Medidas de dispersión

Las medidas de posición estudiadas en la sección anterior servían para resumir la distribución de frecuencias en un solo valor. Las medidas de dispersión, a las cuales dedicaremos esta sección, tienen como propósito estudiar lo concentrada que está la distribución en torno a algún promedio.

Estudiaremos las cuatro medidas de dispersión más utilizadas: recorrido, varianza, desviación típica y coeficiente de variación de Pearson, estando definidas las tres primeras medidas en unidades concretas y estándolo la cuarta en unidades abstractas.

  1. Recorrido

    Si x max es el dato mayor o la última marca de clase, si es que los datos vienen agrupados en intervalos, y x min el dato menor o primera marca de clase, llamaremos recorrido a

    R = x max - x min

    Así, en el ejemplo de los niveles de colinesterasa el recorrido es

    R = 15'75 - 8'25 = 7'5

    y en el ejemplo del número de hijos será R = 4 - 0 = 4.

    La principal ventaja del recorrido es la de proporcionar una medida de la dispersión de los datos fácil y rápida de calcular.

  2. Varianza

    Denotando por x1,...,xk los datos o las marcas de clase, llamaremos varianza a

    siendo a la media de la distribución.

    Así en el ejemplo del número de hijos la varianza es

    s2 = 4'24 - (1'68)2 = 1'4176.

    y en ejemplo de los niveles de colinesterasa

    s2 = 133'97 - (11'426)2 = 3'42.

    Al valor

    se le denomina cuasivarzanza.

  3. Desviación Típica

    La varianza tiene un problema, y es que está expresada en unidades al cuadrado. Esto puede producir una falsa imagen de la dispersión de la distribución. En su lugar suele utilizarse su raíz cuadrada, denominada desviación típica. Así, la desviación típica de la distribución de frecuencias del ejemplo de los niveles de colinesterasa es s = 1'1906 y la del ejemplo del número de hijos   s = 1'85.

  4. Coeficiente de Variación de Pearson

    La desviación típica sirve para medir de forma eficaz la dispersión de un conjunto de datos entorno a su media. Desgraciadamente esta medida puede resultar engañosa cuando tratamos de comparar la dispersión de dos conjuntos de datos. Así, si por ejemplo tenemos dos grupos de mujeres de 11 y 25 años con medias y desviaciones típicas dadas por la tabla siguiente:

    Peso Medio
    Desviación Típica
    11 años
    40 Kgr.
    2 Kgr.
    25 años
    50 Kgr.
    2 Kgr.

    puede parecernos, al observar en ambos grupos una desviación típica igual, que ambos grupos de datos tienen la misma dispersión. No obstante, como parece lógico, no es lo mismo una variación de dos kilos en un grupo de elefantes que en uno de conejos. El coeficiente de Variación de Pearson elimina esa posible confusión al ser una medida de la variación de los datos pero en relación con su media. Se defide como

    siendo s y a respectivamente la desviación típica y la media de la distribución en estudio y en donde el factor 100 tiene como único objetivo el evitar operar con valores decimales.

    De la defición de Vp se deduce fácilmente que aquella distribución a la que corresponda mayor coeficiente tendrá mayor dispersión.

    En el ejemplo anterior, al grupo de mujeres de 11 años le corresponde un coeficiente de variación de Pearson igual a

    y al grupo de las mujeres de 25 años

    lo que indica una mayor dispersión en el grupo de mujeres de 11 años.

    Para el ejemplo del número de hijos Vp toma el valor

    y en el de los niveles de colinesterasa




    [Página Anterior]
    [Página Inicial]
    [Página Siguiente]