Dispersión. Variables Continuas [mediante sumas de cuadrados]

Calcula la varianza y la desviación típica y las desviaciones de los datos preguntados. Cada ejercicio vale 3 puntos. Si además el Coeficiente de Variación (C.V.), recibes 0.5 pts. Redondea con 2 decimales.
Se dan por válidos tanto la varianza muestral como la poblacional. La varianza muestral se utiliza al calcularla a partir de una estimación de la media (pues tomamos una muestra), y la varianza poblacional cuando se calcula utilizando el verdadero valor de la media.

Nuestras fórmulas

Veamos las fórmulas que podemos utilizar para estos cálculos. Dado un conjunto de datos continuos, suelen agruparse por intervalos, y tomar como elemento representativo uno de sus elementos, generalmente el valor medio del intervalo, que se denomina marca de esa clase. Sustituimos todos los datos del intervalo por el valor de esa marca de clase. Si los datos son , (varios pueden estar repetidos, según las frecuencias correspondientes), definimos:
  • su media es . También puede denotarse como . Cuando hay datos repetidos (frecuencias mayores que 1), suele ser cómodo multiplicar el dato por la frecuencia, para reducir el número de sumandos.
  • la media cuadrática (o media de los cuadrados) es .
  • y ¡ojo! no coincide con la media al cuadrado, , que se puede escribir como . Cuidado porque la notación del cuadrado y la barra para la media se parecen bastante. .
  • La varianza poblacional se denota y es la diferencia media entre la media cuadrática y la media la cuadrado, es decir: .
  • A partir de la varianza, calculamos la desviación típica poblacional como su raíz cuadrada: .
  • Podemos usar el coeficiente de variación para medir a relación entre el tamaño de la media y su varianza, para ver si la media aritmética es representativa del conjunto de datos. Lo calculamos como , y suele expresarse en porcentaje. Cuando es menor que el 30%, podemos decir que la media es suficientemente representativa.

¿Muestral o poblacional?

Normalmente, no disponemos de todos los datos de la población, y lo que hacemos es tomar una muestra. En ese caso, los resultados obtenidos son algo mejores si utilizamos la varianza y desviación típicas muestrales.
  • La única diferencia es que en los cálculos dividiremos por , en lugar de .
  • Pero en este caso, al realizar los cálculos mediante diferencias de cuadrados, resulta más cómodo utilizar las fórmulas poblacionales (las anteriores), pues se ha utilizado una simplificación de la fórmula original (a partir de las desviaciones respecto la media), que ya no podría usarse.