Las medidas de dispersión de los datos junto con la
medida de un promedio mejora la descripción.
Un promedio solo, no proporciona mucha información;
por sí mismo solo indica la posición del centro, mientras que una medida de
dispersión permite conocer cuánto se esparcen los datos alrededor del centro. Por
ejemplo, las medidas de
dispersión indican si los valores están relativamente cercanos uno de otro o si
se encuentran dispersos.
Son medidas de
dispersión: Cuartiles, deciles, percentiles, rango (también conocidos como
medidas de posición), desviación media, varianza, desviación estándar y
coeficiente de variación.
Las más
eficientes son aquellas en las que se utiliza toda la información disponible,
pero otras son ampliamente usadas para efectuar descripciones de distribuciones
de frecuencias. Son estadísticos si se calculan con los datos de una muestra, y
son parámetro si se utiliza toda la información de la población (censo).
1.
Desviación media (DM)
Una de las medidas
de dispersión que incluye todos los datos es la desviación media. Es la
media de las desviaciones a partir de un valor central.
La distancia entre
el dato xi y la media se da por y el promedio de las n distancias de los datos respecto de su media
se denomina desviación media.
La ecuación que nos permite el
cálculo de la Desviación Media (DM) para cada tipo de serie es:
2. Varianza
(s2)
La varianza de una muestra se calcula
casi en la misma forma que la desviación media, con dos pequeñas diferencias:
ü Las desviaciones se elevan al cuadrado antes de ser
sumadas.
ü Se obtiene el promedio, utilizando n-1 en lugar de n.
La varianza de una muestra o
conjunto de datos es la desviación promedio de valores obtenidos a partir de
la media elevada al cuadrado y dividida entre n-1.
La varianza se representa como s2 cuando se refiere a la
varianza muestral y como (letra griega sigma minúscula al cuadrado),
cuando se trata de la varianza de una población.
Procedimiento:
A. Para series simples
ü Calcular la media.
ü Restar la media a cada valor del
conjunto, originando las desviaciones y realizar la sumatoria.
ü Elevar al cuadrado cada una de estas
desviaciones y realizar la sumatoria.
ü Dividir el resultado de la sumatoria
entre n-1 en el caso de datos muestrales o dividir entre n, si los datos
equivalen a todos los valores de una población.
B. Para series de frecuencias
(datos no agrupados)
ü Calcular la media.
ü Agregar una columna donde se coloquen las
frecuencias de la serie.
ü Restar la media a cada valor del conjunto
y con ello originar las desviaciones con respecto a la media.
ü Elevar al cuadrado cada una de estas
desviaciones.
ü Multiplicar la frecuencia correspondiente
a cada una de las desviaciones al cuadrado y realizar la sumatoria.
ü Dividir el resultado de la sumatoria
entre n-1 en el caso de datos muestrales o dividir entre n si los datos
equivalen a todos los valores de una población
C. Para series de clases y
frecuencias (datos agrupados)
ü Agregar una columna en donde se calculen
las marcas de clase.
ü Agregar una columna donde se coloquen las
frecuencias de la serie.
ü Calcular la media.
ü Restar la media a cada marca de clase del
conjunto y con ello originar las desviaciones con respecto a la media.
ü Elevar al cuadrado cada una de estas
desviaciones.
ü Multiplicar la frecuencia correspondiente
a cada una de las desviaciones al cuadrado y realizar la sumatoria.
ü Dividir el resultado de la sumatoria
entre n-1 en el caso de datos muestrales o dividir entre n si los datos
equivalen a todos los valores de una población.
3. Desviación
estándar o desviación típica
Se llama desviación o desvío a la
diferencia entre un valor individual xi y la media . La varianza es una medida de
dispersión en la que hallamos las desviaciones al cuadrado. Esto indica que la
unidad de varianza se expresa en unidades al cuadrado.
Para superar esta insuficiencia y
disponer de una medida de la dispersión de las puntuaciones que se exprese en
unidades, que no sean al cuadrado, se calcula la raíz cuadrada de la varianza
conocida como desviación estándar.
La desviación estándar es una
de las medidas de resumen que más se utiliza para distribuciones y desempeña un
papel preponderante en la estadística. Es importante observar que las
unidades en las que se expresa la desviación estándar son las mismas que las de
la media. Por ejemplo, si la media se da a conocer en unidades monetarias,
la desviación estándar también lo estará.
La desviación estándar σ, para la población o s, para la muestra, es la desviación en
promedio de las diferencias de los valores con respecto a su media.
La desviación estándar es simplemente
la raíz cuadrada de la varianza. Existen dos métodos para calcular la
desviación estándar según la organización de los datos:
En el siguiente link podrás descargar los apuntes del tema :
MEDIDAS DE DISPERSIÓN
Para resolver los ejercicios y problemas descarga el PROBLEMARIO DEL MEDIDAS DE DIPERSIÓN
No hay comentarios:
Publicar un comentario