Análisis de datos comparando media y mediana
Media y mediana para el análisis de datos
La media o promedio aritmético, es la medida de posición o tendencia central más comúnmente usada. Sin embargo, no es siempre ideal usarla como un promedio, porque es muy sensible a los valores extremos que causan que una distribución de valores sea oblicua (asimétrica), estos valores extremos también son llamados datos atípicos. Relativamente, el cálculo de la media es más difícil de calcular, ya que requiere de sumar todos los números de un conjunto y dividirlos entre el número de elementos del conjunto. La mediana requiere únicamente de ordenarlos. A pesar de lo anterior, la media es la medida de tendencia central más usada, ya que la problemática de sumar todos los valores para obtenerla, la tecnología la ha reducido en gran medida. Además, la media considera todos los valores del conjunto de observaciones. La localización de la mediana no está afectada por los datos atípicos. Por ejemplo, el siguiente conjunto de datos que corresponde al número de materias adeudadas de 5 alumnos: 0, 0, 1, 2, 17, contiene un dato atípico: el 17, es decir, si esta observación tuviera un valor de 2 por ejemplo, la mediana seguiría teniendo el mismo valor. Así, cuando los valores extremos están incluidos en los datos y ellos presentan una forma oblicua, frecuentemente usamos la mediana, en lugar de la media. Para cuando los datos son simétricos, los valores de la media y la mediana no difieren mucho. Las desventajas de la mediana son:
- el ordenamiento de los datos para obtener su valor
- la dificultad analizarla con álgebra, al carecer de una fórmula.