VARIANZA Y DESVIACIÓN TÍPICA

Definición: Se llama varianza de una variable estadística a la media aritmética de los cuadrados de las desviaciones respecto de la media. Se representa por s2 o Var(x).

Definición: Se llama desviación típica de una v.e. a la raíz cuadrada positiva de la varianza. Se representa por s .

Cálculo de la varianza y de la desviación típica

Sea X una v.e. que toma los valores con frecuencias absolutas respectivamente. La varianza viene dada por la siguiente expresión:

O bien, utilizando sumatorias:

A veces no es un número entero, entonces las desviaciones (xi) suelen ser números decimales. Las operaciones de elevar al cuadrado cada una de las desviaciones y multiplicarlas por las frecuencias respectivas pueden resultar sumamente laboriosas; por ello se utiliza 

otra expresión equivalente a la anterior en la que se evitan estos cálculos:


Como consecuencia de la definición de varianza, la definición típica viene dada por las siguientes expresiones:

Observaciones a la varianza

1.Tanto la varianza como la desviación típica dependen de todos los valores de la distribución, así como de la media.

2.En los casos en los que no sea posible calcular la media aritmética, no será posible tampoco obtener la varianza y la desviación típica, por ser funciones de la media.

3.La varianza tiene el inconveniente de que no viene expresada en las mismas unidades que los datos, debido a que las desviaciones están elevadas al cuadrado. Si los datos fueran en metros, la varianza vendría dada en metros cuadrados. En cambio, la desviación típica sí viene expresada en las mismas unidades que los datos, de ahí que resulte más interesante que la varianza.

UTILIZACIÓN CONJUNTA DEY s

La media aritmética, , de un conjunto de datos se encuentra, aproximadamente, hacia el centro de la distribución. La desviación típica s nos informa sobre la dispersión de los datos respecto a la media. Utilizando ambos parámetros conjuntamente podemos obtener resultados muy importantes sobre la distribución.

Así, por ejemplo, en las distribuciones unimodales, simétricas o ligeramente asimétricas se demuestra que: 

1º En el intervalo (- s, + s) se encuentra el68% de los datos.

2º En el intervalo (-2s, +2s) se encuentra el95% de los datos.

3º En el intervalo (- 3s, +3s) se encuentra el99% de los datos.

Estos resultados son consecuencia de lo que estadística matemática se conoce con el nombre de desigualdad de Tchebicheff.

Se puede observar un gráfico bastante repredentativo en el enlace: Utilización conjunta de media y desviación tipica.