Estadística Descriptiva: Medidas de Tendencia Central y Dispersión


«`html





Estadística Descriptiva: Medidas de Tendencia Central y Dispersión

Introducción

La estadística descriptiva es una herramienta fundamental para resumir y analizar conjuntos de datos. Ya sea en investigación científica, negocios o educación, entender las medidas de tendencia central y dispersión nos permite extraer información valiosa de manera eficiente. Imagina que tienes las calificaciones de 100 estudiantes: ¿cómo identificarías el rendimiento promedio o la variabilidad en los resultados? En este artículo, exploraremos estas métricas esenciales con ejemplos prácticos, demostraciones y ejercicios para consolidar tu aprendizaje.

Medidas de Tendencia Central

Las medidas de tendencia central describen el centro de un conjunto de datos. Las principales son la media, la mediana y la moda.

Teorema 1: Propiedad de la Media Aritmética

Para un conjunto de datos $x_1, x_2, \dots, x_n$, la media aritmética $\bar{x}$ minimiza la suma de los cuadrados de las desviaciones:

$$ \sum_{i=1}^n (x_i – \bar{x})^2 \leq \sum_{i=1}^n (x_i – c)^2 \quad \forall c \in \mathbb{R} $$

Demostración: Derivando e igualando a cero la función $f(c) = \sum (x_i – c)^2$, obtenemos:

$$ f'(c) = -2\sum (x_i – c) = 0 \implies \sum x_i = n c \implies c = \bar{x} $$

Ejemplo 1: Cálculo de la Media, Mediana y Moda

Datos: $3, 5, 7, 7, 8$

  • Media: $\frac{3+5+7+7+8}{5} = 6$
  • Mediana: Valor central $7$
  • Moda: Valor más frecuente $7$

Medidas de Dispersión

Indican cuán dispersos están los datos alrededor de la tendencia central. Las más usadas son rango, varianza, desviación estándar y coeficiente de variación.

Teorema 2: Varianza Muestral

La varianza muestral $s^2$ de $n$ datos se define como:

$$ s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i – \bar{x})^2 $$

Esta fórmula corrige el sesgo en la estimación de la varianza poblacional.

Ejemplo 2: Cálculo de Varianza y Desviación Estándar

Datos: $2, 4, 6, 8$

  • Media: $\bar{x} = 5$
  • Varianza: $\frac{(2-5)^2 + \dots + (8-5)^2}{3} = \frac{20}{3} \approx 6.67$
  • Desviación Estándar: $s \approx 2.58$

Teorema 3: Desigualdad de Chebyshev

Para cualquier distribución y $k > 1$, al menos $1 – \frac{1}{k^2}$ de los datos están dentro de $k$ desviaciones estándar de la media:

$$ P(|X – \mu| \geq k\sigma) \leq \frac{1}{k^2} $$

Demostración: Usando la definición de varianza y acotando la integral fuera del intervalo $(\mu – k\sigma, \mu + k\sigma)$.

Ejercicios Resueltos

Ejercicio 1

Calcula la media y mediana para: $10, 20, 30, 40, 50$.

Solución:

  • Media: $\frac{10 + \dots + 50}{5} = 30$
  • Mediana: $30$ (valor central)

Ejercicio 2

Encuentra la moda en: $1, 2, 2, 3, 4, 4, 4$.

Solución: La moda es $4$ (aparece 3 veces).

Ejercicio 3

Calcula el rango de: $5, 8, 12, 15, 20$.

Solución: Rango $= 20 – 5 = 15$.

Ejercicio 4

Determina la varianza para: $6, 8, 10$ (usando fórmula poblacional).

Solución:

  • Media: $8$
  • Varianza: $\frac{(6-8)^2 + (8-8)^2 + (10-8)^2}{3} = \frac{8}{3} \approx 2.67$

Ejercicio 5

Si $\bar{x} = 50$ y $s = 10$, ¿qué porcentaje mínimo de datos está entre 30 y 70 según Chebyshev?

Solución: $k = 2$ (pues $50 \pm 2 \times 10$). Entonces, al menos $1 – \frac{1}{4} = 75\%$.

Aplicaciones Prácticas

Estas medidas son esenciales en:

  • Educación: Análisis de calificaciones (ver más).
  • Finanzas: Evaluación de riesgos en inversiones.
  • Control de calidad: Monitoreo de procesos industriales.

Por ejemplo, la media y desviación estándar son claves en gráficos de control (detalles aquí).

Conclusión

Las medidas de tendencia central (media, mediana, moda) y dispersión (rango, varianza, desviación estándar) proporcionan un resumen numérico de los datos. Hemos visto su cálculo, propiedades matemáticas y aplicaciones en diversos campos. Con los ejercicios resueltos, ahora puedes practicar estos conceptos en situaciones reales. Continúa explorando temas avanzados como inferencia estadística para profundizar tu comprensión.



«`

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *