La varianza

Aunque el rango mide la dispersión de los datos, sólo tienen en cuenta dos de los valores de los datos. Necesitamos una medida que considere cada uno de los valores de los datos. Esa medida promediaría la distancia total entre cada observación y la media. Esta distancia sería negativa en el caso de los valores menores que la media (y la distancia no es negativa). Si se eleva al cuadrado cada una de, cada observación (tanto por encima como por debajo de la media) contribuye a la suma de los términos al cuadrado. La media de la suma de los términos al cuadrado se llama varianza.

En el caso de la varianza de la muestra la formula es: Obsérvese que, en el caso de los datos muestrales, en la ecuación la varianza se halla dividiendo el numerador por (n -1), y no por n. Como nuestro objetivo es hallar una media de los cuadrados de las desviaciones en torno a la media, sería de esperar que hubiera que dividir por n. ¿Por qué se calcula entonces la varianza muestral dividiendo por (n -1)? Si tomáramos un número muy grande de muestras, cada una del tamaño n, de la población y calculáramos la varianza muestral, como se hace en la ecuación para cada una de estas muestras, la media de todas estas varianzas muestrales sería la varianza poblacional, esta propiedad indica que la varianza muestral es un «estimador insesgado» de la varianza poblacional, estadísticos matemáticos que han demostrado que, si no se conoce la varianza poblacional, una varianza muestral es un estimador mejor de la varianza poblacional si el denominador de la varianza muestral es (n -1), en lugar de n.

Para calcular la varianza hay que elevar al cuadrado las distancias, lo que altera la unidad de medición, que ahora son unidades al cuadrado. La desviación típica, que es la raíz cuadrada de la varianza, hace que los datos vuelvan a su unidad original de medición. Si las mediciones originales estuvieran en pies, la varianza estaría en pies cuadrados, pero la desviación típica estaría en pies. La desviación típica mide la dispersión media en torno a la media. Ejemplo: Los siguientes datos corresponden a los estudiantes de la asignatura de Métodos estadísticos I de la carrera de Economía Agrícola en el III periodo del 2020. Edad Edad promedio
Observación = ×Promedio = µDesviación = σDesviación al cuadrado σ 2Observación al cuadrado x 2
2423.250.750.5625576
2823.254.7522.5625784
2423.250.750.5625576
2223.25-1.251.5625484
2023.25-3.2510.5625400
2123.25-2.255.0625441
2523.251.753.0625625
2223.25-1.251.5625484
Suma 45.5 4370

49. Cuando sustituyes en la formula los valores, la varianza resulta

Marca todas las que correspondan
  • A
  • B
  • C
Revisa tu respuesta (3)