Introducción
La estadística descriptiva es una herramienta fundamental para resumir y analizar conjuntos de datos. Ya sea en investigación científica, negocios o educación, entender las medidas de tendencia central y dispersión nos permite extraer información valiosa de manera eficiente. Imagina que tienes las calificaciones de 100 estudiantes: ¿cómo identificarías el rendimiento promedio o la variabilidad en los resultados? En este artículo, exploraremos estas métricas esenciales con ejemplos prácticos, demostraciones y ejercicios para consolidar tu aprendizaje.
Medidas de Tendencia Central
Las medidas de tendencia central describen el centro de un conjunto de datos. Las principales son la media, la mediana y la moda.
Teorema 1: Propiedad de la Media Aritmética
Para un conjunto de datos $x_1, x_2, \dots, x_n$, la media aritmética $\bar{x}$ minimiza la suma de los cuadrados de las desviaciones:
$$ \sum_{i=1}^n (x_i – \bar{x})^2 \leq \sum_{i=1}^n (x_i – c)^2 \quad \forall c \in \mathbb{R} $$
Demostración: Derivando e igualando a cero la función $f(c) = \sum (x_i – c)^2$, obtenemos:
$$ f'(c) = -2\sum (x_i – c) = 0 \implies \sum x_i = n c \implies c = \bar{x} $$
Ejemplo 1: Cálculo de la Media, Mediana y Moda
Datos: $3, 5, 7, 7, 8$
- Media: $\frac{3+5+7+7+8}{5} = 6$
- Mediana: Valor central $7$
- Moda: Valor más frecuente $7$
Medidas de Dispersión
Indican cuán dispersos están los datos alrededor de la tendencia central. Las más usadas son rango, varianza, desviación estándar y coeficiente de variación.
Teorema 2: Varianza Muestral
La varianza muestral $s^2$ de $n$ datos se define como:
$$ s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i – \bar{x})^2 $$
Esta fórmula corrige el sesgo en la estimación de la varianza poblacional.
Ejemplo 2: Cálculo de Varianza y Desviación Estándar
Datos: $2, 4, 6, 8$
- Media: $\bar{x} = 5$
- Varianza: $\frac{(2-5)^2 + \dots + (8-5)^2}{3} = \frac{20}{3} \approx 6.67$
- Desviación Estándar: $s \approx 2.58$
Teorema 3: Desigualdad de Chebyshev
Para cualquier distribución y $k > 1$, al menos $1 – \frac{1}{k^2}$ de los datos están dentro de $k$ desviaciones estándar de la media:
$$ P(|X – \mu| \geq k\sigma) \leq \frac{1}{k^2} $$
Demostración: Usando la definición de varianza y acotando la integral fuera del intervalo $(\mu – k\sigma, \mu + k\sigma)$.
Para cualquier distribución y $k > 1$, al menos $1 – \frac{1}{k^2}$ de los datos están dentro de $k$ desviaciones estándar de la media:
$$ P(|X – \mu| \geq k\sigma) \leq \frac{1}{k^2} $$
Demostración: Usando la definición de varianza y acotando la integral fuera del intervalo $(\mu – k\sigma, \mu + k\sigma)$.
Ejercicios Resueltos
Ejercicio 1
Calcula la media y mediana para: $10, 20, 30, 40, 50$.
Solución:
- Media: $\frac{10 + \dots + 50}{5} = 30$
- Mediana: $30$ (valor central)
Ejercicio 2
Encuentra la moda en: $1, 2, 2, 3, 4, 4, 4$.
Solución: La moda es $4$ (aparece 3 veces).
Ejercicio 3
Calcula el rango de: $5, 8, 12, 15, 20$.
Solución: Rango $= 20 – 5 = 15$.
Ejercicio 4
Determina la varianza para: $6, 8, 10$ (usando fórmula poblacional).
Solución:
- Media: $8$
- Varianza: $\frac{(6-8)^2 + (8-8)^2 + (10-8)^2}{3} = \frac{8}{3} \approx 2.67$
Ejercicio 5
Si $\bar{x} = 50$ y $s = 10$, ¿qué porcentaje mínimo de datos está entre 30 y 70 según Chebyshev?
Solución: $k = 2$ (pues $50 \pm 2 \times 10$). Entonces, al menos $1 – \frac{1}{4} = 75\%$.
Aplicaciones Prácticas
Estas medidas son esenciales en:
- Educación: Análisis de calificaciones (ver más).
- Finanzas: Evaluación de riesgos en inversiones.
- Control de calidad: Monitoreo de procesos industriales.
Por ejemplo, la media y desviación estándar son claves en gráficos de control (detalles aquí).
Conclusión
Las medidas de tendencia central (media, mediana, moda) y dispersión (rango, varianza, desviación estándar) proporcionan un resumen numérico de los datos. Hemos visto su cálculo, propiedades matemáticas y aplicaciones en diversos campos. Con los ejercicios resueltos, ahora puedes practicar estos conceptos en situaciones reales. Continúa explorando temas avanzados como inferencia estadística para profundizar tu comprensión.
«`