Diagrama de Caja y
Bigotes
Los diagramas de Caja-Bigotes
(boxplots o box and whiskers) son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y
simetría.
Para su realización se representan
los tres cuartiles y los valores mínimo y máximo de los datos, sobre un
rectángulo, alineado horizontal o verticalmente
Construcción:
Una gráfica de este tipo consiste en
una caja rectangular, donde los lados más largos muestran el recorrido
intercuartílico. Este rectángulo está dividido por un segmento vertical que
indica donde se posiciona la mediana y por lo tanto su relación con los
cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la
mediana).
Esta caja se ubica a escala sobre un
segmento que tiene como extremos los valores mínimo y máximo de la variable.
Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen
tienen un límite de prolongación, de modo que cualquier dato o caso que no se
encuentre dentro de este rango es marcado e identificado individualmente
EJEMPLO
DISTRIBUCIÓN DE EDADES
Utilizamos la ya usada distribución de frecuencias
(en tallos y hojas), que representan la edad de un colectivo de 20 personas.
36 25
37 24 39
20 36 45
31 31 39 24
29 23 41
40 33 24
34 40
1. ORDENAR LOS DATOS
Para calcular los parámetros estadístico, lo
primero es ordenar la distribución
20 23
24 24 24
25 29 31
31 33 34
36 36 37
39 39 40
40 41 45
2. CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25%
de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer
cuartil es la media aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 =
24,5
Q2, el Segundo Cuartil es, evidentemente, la
mediana de la distribución, es el valor de la variable que ocupa el lugar
central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la
media aritmética de dicho valor y el siguiente:
Me= Q2 = (33 + 34)/ 2
=33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa
al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15,
resulta
Q3=(39 + 39) / 2 = 39
3. CALCULAR EL RANGO INTERCUARTÍLICO
Al valor del Q3 se le resta el valor del Q1 : RI= Q3-Q1
4. CÁLCULO DE VALORES ATÍPICOS
Se obtienen los valores atípicos (f1 y f3),
mediante la siguiente fórmula:
f1= Q1 – 1.5RI f2= Q3 + 1.5RI
Estos valores indican que todos los
valores inferiores a f1 y superiores a f3 son atípicos y que no deben ser
considerados dentro del conjunto de los datos.
5. DIBUJAR LA CAJA Y LOS BIGOTES
a) Se traza una recta numérica con los valores de
los datos.
b) Se ubican el dato menor y el dato mayor
c) Localizar el valor del Q1, Q2 y Q3 que
representan la caja y los bigotes el rango de valores del valor mínimo (Linf.) hasta
Q1 y del Q3 al valor máximo(Lsup.):
El bigote de la izquierda representa al colectivo
de edades ( Linf., Q1)
La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Lsup.).
INTERPRETACIÓN
Podemos obtener abundante información
de una distribución a partir de estas representaciones. Veamos alguna:
•
La parte izquierda de
la caja es mayor que la de la derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la población está más dispersa que entre
el 50% y el 75%.
• El bigote de la izquierda (Linf., Q1) es más corto que el de la derecha;
por ello el 25% de los más jóvenes están más concentrados que el 25% de los
mayores.
• El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la
población está comprendido en 14,5 años.
Del canal de Khan Academy se presenta el siguiente video que te ayudará a comprender la interpretación del gráfico de Caja y Bigotes
En el siguiente video de Khan Academy se presenta el procedimiento para la construcción del gráfico de Caja y Bigotes:
No hay comentarios:
Publicar un comentario