|
|
Llamando xl, ..., xk a los datos distintos de un carácter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmética de la distribución de frecuencias a

en donde n es la frecuencia total.
| Ejemplo 1: |

es decir, las familias encuestadas tienen un número medio de hijos de 1'68.
| Ejemplo 2: |
Se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de 34 agricultores expuestos a insecticidas agrícolas, obteniéndose los siguientes datos:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
La distribución de frecuencias las marcas de clase será:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
la cual proporciona una media aritmética de

La mediana es otra medida de posición, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de ésta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales
Así, si en la siguiente distribución de frecuencias,
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ordenamos los valores en orden creciente,
0 0 0 1 1 2 2
el 1 será el valor que cumple la definición de mediana.
Lógicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razón, daremos a continuación una fórmula que permita calcularla. No obstante, será necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar.
Las gráficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar:

Si la situación es como la de la figura de la derecha, es decir, si
Si la situación que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmética de los dos valores entre los que se produce la indeterminación; así pues, si
Nj-1 = n/2 < Nj
entonces la mediana es

| Ejemplo 1: |
La distribución de frecuencias acumuladas del ejemplo del número de hijos era
|
|
0 | 1 | 2 | 3 | 4 | ||||
| Frecuencias Acumuladas(Ni) | 5 | 11 | 19 | 23 | 25 | ||||
y como es n/2=12'5 y en consecuencia
11 < 12'5 < 19
la mediana será Me= 2.
Las gráficas siguientes, correspondientes a polígonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar:

El más sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj.
Si la situación es como la que se representa en la figura de la izquierda, en la que
Nj-l < n/2 < Nj
entonces, la mediana, está en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomándose en ese caso, por razonamientos de proporcionalidad, como mediana el valor

siendo cj la amplitud del intervalo [xj-1, xj).
| Ejemplo: |
La distribución de frecuencias del ejemplo de los niveles de colinesterasa es:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Al ser n/2 = 17 y estar
11 < 17 < 21
la mediana estará en el intervalo [10'5 , 12), y aplicando la fórmula anterior, será

La moda se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta o relativa). Para calcularla, también será necesario distinguir si los datos están o no agrupados.
Para datos sin agrupar, la determinación del valor o valores (ya que puede haber más de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese será la moda.
Así en el ejemplo del número de hijos, la simple inspección de la tabla siguiente proporciona como valor para la moda el Md = 2.
|
|
0 | 1 | 2 | 3 | 4 | |||||
| Nº de familias(ni) | 5 | 6 | 8 | 4 | 2 | ?ni=25 | ||||
Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si éstos tienen o no igual amplitud.
Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, también por razones geométricas, como

| Ejemplo: |
Este ejemplo presenta un caso de distribución bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 - 13'5) tienen frecuencia absoluta máxima. Deberíamos aplicar, por tanto, para cada uno de los dos intervalos la fórmula anterior, determinando así las dos modas de la distribución. No obstante, este ejemplo presenta además la peculiaridad adicional de ser ambos intervalos modales contiguos. En esta situación se considera la distribución unimodal, eligiendo como moda el extremo común, Md = 12.
Si los intervalos tuvieran distinta amplitud cj, primeros debemos normalizar las frecuencias absolutas nj, determinando los cocientes

y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los lj. Es decir, primero calcular el lj = max{l1,...., lk} para determinar el intervalo modal [xj-1, xj) y luego aplicar la fórmula

siendo cj la amplitud del intervalo modal [xj-1, xj).
| Ejemplo: |
Las frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud serán,
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
con lo que el intervalo modal es el [40 - 45) y la moda

A diferencia de lo que ocurre con la media o con la mediana, sí es posible determinar la moda en el caso de datos cualitativos. Así, en el ejemplo del tratamiento de radiación seguido de cirugía puede afirmarse que la causa modal por la que no fue completado el tratamiento es Md = rehusaron cirugía.
Los cuantiles o cuantilas son las últimas medidas de posición que veremos. De hecho algunos autores las incluyen dentro de las medidas de dispersión al ser medidas de posición no centrales.
El cuantil pr/k r= 1,2,..., k - 1 se define como aquel valor de la variable que divide la distribución de frecuencias, previamente ordenada de forma creciente, en dos partes, estando el (100·r/k)% de ésta formado por valores menores que pr/k.
Si k = 4 los (tres) cuantiles reciben el nombre de cuartíles. Si k = 10 los (nueve) cuantiles reciben, en este caso, el nombre de decíles. Por último, si k = 100 los (noventa y nueve) cuantiles reciben el nombre de centiles.
Obsérvese que siempre que r y k mantengan la misma proporción (r/k) obtendremos el mismo valor. Es decir, por ejemplo, el primer cuartil es igual al vigésimo quinto centil.
En este sentido, la mediana Me es el segundo cuartil, o el quinto decil, etc.
Para el cálculo de los cuantiles de nuevo hay que considerar si los datos vienen o no agrupados en intervalos.
Si los datos vienen sin agrupar y es
Nj-1 <
<
Nj
el r-ésimo cuantil de orden k será pr/k= xj, valor al que corresponde la frecuencia absoluta acumulada Nj.
Si la situación fuera de la forma
Nj-1 =
< Nj
tomaríamos, en esta situación indeterminada,

Si los datos se presentan agrupados y, para algún j, fuera
< Nj
el résimo cuantil de orden k sería pr/k= xj.
Por último, si fuera
Nj-1 <
<
Nj
el intervalo a considerar sería el [xj-1, xj), al que corresponde frecuencia absoluta ni y absoluta acumulada Ni, siendo entonces el cuantil el dado por la expresión,

en donde cj es la amplitud del intervalo [xj-1, xj).
Si el intervalo a considerar fuera el [x0 , x1), se tomaría en la expresión anterior Nj-1 = 0.
| Ejemplo: |
Vamos a determinar la tercera cuartila del ejemplo del número de hijos.
|
|
0 | 1 | 2 | 3 | 4 | |||||
| Nº de familias(ni) | 5 | 6 | 8 | 4 | 2 | ?ni=25 | ||||
| Nº de familias(ni) | 5 | 11 | 19 | 23 | 25 | |||||
Como es

y 11 < 18'75 < 19, será p3/4=2.
| Ejemplo: |
Vamos a determinar la séptima decila del ejemplo de los niveles de colinesterasa.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Como es:

21 < 23'8 < 31, el intervalo a considerar será el [12 , 13'5), siendo

![]() |
![]() |
![]() |