La varianza
- Tema:
- Varianza
Aunque el rango mide la dispersión de los datos, sólo tienen en cuenta dos de los valores de los datos. Necesitamos una medida que considere cada uno de los valores de los datos. Esa medida promediaría la distancia total entre cada observación y la media. Esta distancia sería negativa en el caso de los valores menores que la media (y la distancia no es negativa). Si se eleva al cuadrado cada una de, cada observación (tanto por encima como por debajo de la media) contribuye a la suma de los términos al cuadrado. La media de la suma de los términos al cuadrado se llama varianza.
En el caso de la varianza de la muestra la formula es:
Obsérvese que, en el caso de los datos muestrales, en la ecuación la varianza se halla dividiendo el numerador por (n -1), y no por n. Como nuestro objetivo es hallar una media de los cuadrados de las desviaciones en torno a la media, sería de esperar que hubiera que dividir por n. ¿Por qué se calcula entonces la varianza muestral dividiendo por (n -1)?
Si tomáramos un número muy grande de muestras, cada una del tamaño n, de la población y calculáramos la varianza muestral, como se hace en la ecuación para cada una de estas muestras, la media de todas estas varianzas muestrales sería la varianza poblacional, esta propiedad indica que la varianza muestral es un «estimador insesgado» de la varianza poblacional, estadísticos matemáticos que han demostrado que, si no se conoce la varianza poblacional, una varianza muestral es un estimador mejor de la varianza poblacional si el denominador de la varianza muestral es (n -1), en lugar de n.
Observación = × | Promedio = µ | Desviación = σ | Desviación al cuadrado σ 2 | Observación al cuadrado x 2 |
24 | 23.25 | 0.75 | 0.5625 | 576 |
28 | 23.25 | 4.75 | 22.5625 | 784 |
24 | 23.25 | 0.75 | 0.5625 | 576 |
22 | 23.25 | -1.25 | 1.5625 | 484 |
20 | 23.25 | -3.25 | 10.5625 | 400 |
21 | 23.25 | -2.25 | 5.0625 | 441 |
25 | 23.25 | 1.75 | 3.0625 | 625 |
22 | 23.25 | -1.25 | 1.5625 | 484 |
49. Cuando sustituyes en la formula los valores, la varianza resulta