Estadística descriptiva: medidas de tendencia central y dispersión

La estadística descriptiva es una rama fundamental de la estadística que se encarga de resumir y describir las características principales de un conjunto de datos. Entre las herramientas más utilizadas en esta disciplina se encuentran las medidas de tendencia central y las medidas de dispersión. Estas medidas nos permiten entender la distribución de los datos y extraer conclusiones significativas.

Medidas de Tendencia Central

Las medidas de tendencia central son valores que representan el centro de un conjunto de datos. Las más comunes son la media, la mediana y la moda.

Media Aritmética

La media aritmética, o simplemente media, es el valor promedio de un conjunto de datos. Se calcula sumando todos los valores y dividiendo entre el número total de observaciones. Matemáticamente, se expresa como:

\[
\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i
\]

Donde \( \bar{x} \) es la media, \( n \) es el número de observaciones y \( x_i \) representa cada valor individual.

Ejemplo: Supongamos que tenemos los siguientes datos: 5, 7, 8, 10, 12. La media sería:

\[
\bar{x} = \frac{5 + 7 + 8 + 10 + 12}{5} = \frac{42}{5} = 8.4
\]

Mediana

La mediana es el valor que se encuentra en el centro de un conjunto de datos ordenados. Si el número de observaciones es par, la mediana es el promedio de los dos valores centrales. Para un conjunto de datos ordenados \( x_1, x_2, \dots, x_n \), la mediana se calcula como:

\[
\text{Mediana} = \begin{cases}
x_{\frac{n+1}{2}} & \text{si } n \text{ es impar} \\
\frac{x_{\frac{n}{2}} + x_{\frac{n}{2}+1}}{2} & \text{si } n \text{ es par}
\end{cases}
\]

Ejemplo: Para los datos 5, 7, 8, 10, 12, la mediana es 8. Si añadimos un sexto valor, como 14, la mediana sería:

\[
\text{Mediana} = \frac{8 + 10}{2} = 9
\]

Moda

La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda, más de una moda o ninguna moda si todos los valores son únicos.

Ejemplo: En el conjunto de datos 5, 7, 8, 8, 10, 12, la moda es 8.

Medidas de Dispersión

Las medidas de dispersión nos indican cuánto se alejan los datos de la tendencia central. Las más utilizadas son la varianza, la desviación estándar y el rango.

Varianza

La varianza mide la dispersión de los datos respecto a la media. Se calcula como el promedio de los cuadrados de las diferencias entre cada valor y la media. La fórmula es:

\[
\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i – \bar{x})^2
\]

Ejemplo: Para los datos 5, 7, 8, 10, 12, con una media de 8.4, la varianza sería:

\[
\sigma^2 = \frac{(5-8.4)^2 + (7-8.4)^2 + (8-8.4)^2 + (10-8.4)^2 + (12-8.4)^2}{5} = \frac{11.56 + 1.96 + 0.16 + 2.56 + 12.96}{5} = \frac{29.2}{5} = 5.84
\]

Desviación Estándar

La desviación estándar es la raíz cuadrada de la varianza y proporciona una medida de dispersión en las mismas unidades que los datos originales. Se calcula como:

\[
\sigma = \sqrt{\sigma^2}
\]

Ejemplo: Para los datos anteriores, la desviación estándar sería:

\[
\sigma = \sqrt{5.84} \approx 2.42
\]

Rango

El rango es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos. Es una medida simple de dispersión que se calcula como:

\[
\text{Rango} = x_{\text{max}} – x_{\text{min}}
\]

Ejemplo: Para los datos 5, 7, 8, 10, 12, el rango es:

\[
\text{Rango} = 12 – 5 = 7
\]

Conclusión

Las medidas de tendencia central y dispersión son herramientas esenciales en la estadística descriptiva. Nos permiten resumir grandes cantidades de datos y entender su distribución. La media, mediana y moda nos dan una idea del centro de los datos, mientras que la varianza, desviación estándar y rango nos indican cuánto varían los datos alrededor de ese centro. Dominar estas medidas es fundamental para cualquier análisis estadístico.


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *