Google ClassroomGoogle Classroom
GeoGebraGeoGebra Classroom

Análisis de datos comparando media y mediana

Media y mediana para el análisis de datos

La media o promedio aritmético, es la medida de posición o tendencia central más comúnmente usada. Sin embargo, no es siempre ideal usarla como un promedio, porque es muy sensible a los valores extremos que causan que una distribución de valores sea oblicua (asimétrica), estos valores extremos también son llamados datos atípicos.  Relativamente, el cálculo de la media es más difícil de calcular, ya que requiere de sumar todos los números de un conjunto y dividirlos entre el número de elementos del conjunto. La mediana requiere únicamente de ordenarlos. A pesar de lo anterior, la media es la medida de tendencia central más usada, ya que la problemática de sumar todos los valores para obtenerla, la tecnología la ha reducido en gran medida. Además, la media considera todos los valores del conjunto de observaciones.  La localización de la mediana no está afectada por los datos atípicos. Por ejemplo, el siguiente conjunto de datos que corresponde al número de materias adeudadas de 5 alumnos: 0, 0, 1, 2, 17, contiene un dato atípico: el 17, es decir, si esta observación tuviera un valor de 2 por ejemplo, la mediana seguiría teniendo el mismo valor. Así, cuando los valores extremos están incluidos en los datos y ellos presentan una forma oblicua, frecuentemente usamos la mediana, en lugar de la media. Para cuando los datos son simétricos, los valores de la media y la mediana no difieren mucho. Las desventajas de la mediana son:

  • el ordenamiento de los datos para obtener su valor
  • la dificultad analizarla con álgebra, al carecer de una fórmula.
La siguiente escena resulta de gran utilidad para comprender la relación entre la media y la mediana dentro de un conjunto de datos, ya que los puntos que representan las observaciones los puedes manipular para estudiar distintos conjuntos de observaciones.