Análisis de datos usando la gráfica de caja
Gráfica de caja
En la siguiente escena se muestra una gráfica de caja cuya posición de sus elementos que la constituyen se basan en la posición de los puntos de colores que representan las observaciones de un conjunto de datos.
Elementos de una gráfica de caja
La gráfica de caja es una herramienta útil para mostrar cómo se distribuyen los datos con relación a la posición de la medida de tendencia central y la dispersión de los datos. La gráfica de caja se elabora con 5 elementos: dato mínimo, dato máximo, mediana, primer cuartil (Q1) y tercer cuartil (Q3). La línea que divide a la caja es la mediana, los extremos de la caja serán Q1 y Q3 y los “bigotes” que salen de la caja serán el dato mínimo y el máximo. Con la gráfica podemos interpretar si existe simetría en la variable cuando la línea que divide a la caja se encuentra al centro de ella. Los datos sesgados están dispersos más hacia un lado del centro que hacia el otro lado. Así, los datos sesgados hacia la derecha implican que están dispersos más hacia la derecha del centro que hacia la izquierda.