MEDIDAS DE DISPERSIÓN: Desviación Media, Desviación Estándar y Varianza

Las medidas de dispersión de los datos junto con la medida de un promedio mejora la descripción.
Un promedio solo, no proporciona mucha información; por sí mismo solo indica la posición del centro, mientras que una medida de dispersión permite conocer cuánto se esparcen los datos alrededor del centro. Por ejemplo, las medidas de dispersión indican si los valores están relativamente cercanos uno de otro o si se encuentran dispersos.
Son medidas de dispersión: Cuartiles, deciles, percentiles, rango (también conocidos como medidas de posición), desviación media, varianza, desviación estándar y coeficiente de variación.
Las más eficientes son aquellas en las que se utiliza toda la información disponible, pero otras son ampliamente usadas para efectuar descripciones de distribuciones de frecuencias. Son estadísticos si se calculan con los datos de una muestra, y son parámetro si se utiliza toda la información de la población (censo).
1. Desviación media (DM)
Una de las medidas de dispersión que incluye todos los datos es la desviación media. Es la media de las desviaciones a partir de un valor central.
La distancia entre el dato xi y la media se da por  y el promedio de las  n distancias de los datos respecto de su media se denomina desviación media.
La ecuación que nos permite el cálculo de la Desviación Media (DM) para cada tipo de serie es:
2. Varianza (s2)
La varianza de una muestra se calcula casi en la misma forma que la desviación media, con dos pequeñas diferencias:
ü               Las desviaciones se elevan al cuadrado antes de ser sumadas.
ü              Se obtiene el promedio, utilizando n-1 en lugar de n.
La varianza de una muestra o conjunto de datos es la desviación promedio de valores obtenidos a partir de la media elevada al cuadrado y dividida entre n-1.
La varianza se representa como s2 cuando se refiere a la varianza muestral y como  (letra griega sigma minúscula al cuadrado), cuando se trata de la varianza de una población.
 La fórmula para calcular la  de una muestra tiene pequeñas modificaciones, las cuales dependen del tipo de serie al que se quiera aplicar, como a continuación se presenta:
Procedimiento:
A. Para series simples
 ü  Calcular la media.
 ü  Restar la media a cada valor del conjunto, originando las desviaciones y realizar la sumatoria.
 ü  Elevar al cuadrado cada una de estas desviaciones y realizar la sumatoria.
 ü  Dividir el resultado de la sumatoria entre n-1 en el caso de datos muestrales o dividir entre n, si los datos equivalen a todos los valores de una población.
B. Para series de frecuencias (datos no agrupados)
 ü  Calcular la media.
 ü  Agregar una columna donde se coloquen las frecuencias de la serie.
 ü  Restar la media a cada valor del conjunto y con ello originar las desviaciones con respecto a la media.
 ü  Elevar al cuadrado cada una de estas desviaciones.
 ü  Multiplicar la frecuencia correspondiente a cada una de las desviaciones al cuadrado y realizar la sumatoria.
 ü  Dividir el resultado de la sumatoria entre n-1 en el caso de datos muestrales o dividir entre n si los datos equivalen a todos los valores de una población
C. Para series de clases y frecuencias (datos agrupados)
 ü  Agregar una columna en donde se calculen las marcas de clase.
 ü  Agregar una columna donde se coloquen las frecuencias de la serie.
 ü  Calcular la media.
 ü  Restar la media a cada marca de clase del conjunto y con ello originar las desviaciones con respecto a la media.
 ü  Elevar al cuadrado cada una de estas desviaciones.
 ü  Multiplicar la frecuencia correspondiente a cada una de las desviaciones al cuadrado y realizar la sumatoria.
 ü  Dividir el resultado de la sumatoria entre n-1 en el caso de datos muestrales o dividir entre n si los datos equivalen a todos los valores de una población.

3. Desviación estándar o desviación típica
Se llama desviación o desvío a la diferencia entre un valor individual xi y la media . La varianza es una medida de dispersión en la que hallamos las desviaciones al cuadrado. Esto indica que la unidad de varianza se expresa en unidades al cuadrado.
Para superar esta insuficiencia y disponer de una medida de la dispersión de las puntuaciones que se exprese en unidades, que no sean al cuadrado, se calcula la raíz cuadrada de la varianza conocida como desviación estándar.
La desviación estándar es una de las medidas de resumen que más se utiliza para distribuciones y desempeña un papel preponderante en la estadística. Es importante observar que las unidades en las que se expresa la desviación estándar son las mismas que las de la media. Por ejemplo, si la media se da a conocer en unidades monetarias, la desviación estándar también lo estará.
La desviación estándar σ, para la población o s, para la muestra, es la desviación en promedio de las diferencias de los valores con respecto a su media.
La desviación estándar es simplemente la raíz cuadrada de la varianza. Existen dos métodos para calcular la desviación estándar según la organización de los datos:



En el siguiente link podrás descargar los apuntes del tema : 

MEDIDAS DE DISPERSIÓN

Para resolver los ejercicios y problemas descarga el PROBLEMARIO DEL MEDIDAS DE DIPERSIÓN

No hay comentarios:

Publicar un comentario