Introducción
La estadística inferencial es una herramienta fundamental en la ciencia de datos, la investigación y la toma de decisiones. A diferencia de la estadística descriptiva, que se limita a resumir datos, la inferencial nos permite hacer predicciones y generalizaciones sobre una población a partir de una muestra. En este artículo, exploraremos los conceptos clave, teoremas fundamentales y aplicaciones prácticas de esta disciplina.
Conceptos Básicos
La estadística inferencial se basa en dos pilares: la estimación de parámetros y las pruebas de hipótesis. Un parámetro es una medida descriptiva de una población, como la media ($\mu$) o la desviación estándar ($\sigma$). A través de muestras, estimamos estos parámetros usando estadísticos como $\bar{X}$ (media muestral) o $s$ (desviación estándar muestral).
Ejemplo 1: Estimación Puntual
Supongamos que queremos estimar la altura promedio de los estudiantes en una universidad. Tomamos una muestra de 50 estudiantes y calculamos su altura media, obteniendo $\bar{X} = 1.72$ metros. Este valor es una estimación puntual de $\mu$.
Teoremas Fundamentales
Teorema 1: Ley de los Grandes Números
Enunciado: Si $X_1, X_2, \dots, X_n$ son variables aleatorias independientes e idénticamente distribuidas con media $\mu$, entonces:
$$ \bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i \xrightarrow{P} \mu \quad \text{cuando} \quad n \to \infty $$
Demostración: Por la desigualdad de Chebyshev, para cualquier $\epsilon > 0$:
$$ P(|\bar{X}_n – \mu| \geq \epsilon) \leq \frac{\text{Var}(\bar{X}_n)}{\epsilon^2} = \frac{\sigma^2}{n\epsilon^2} \to 0 $$
Lo que implica convergencia en probabilidad.
Teorema 2: Teorema Central del Límite
Enunciado: Bajo las mismas condiciones del Teorema 1, la distribución de $\sqrt{n}(\bar{X}_n – \mu)/\sigma$ converge a una distribución normal estándar $N(0,1)$ cuando $n \to \infty$.
Demostración: Usando funciones características, se muestra que la función característica de $Z_n = \sqrt{n}(\bar{X}_n – \mu)/\sigma$ converge a $e^{-t^2/2}$, que es la función característica de $N(0,1)$.
Pruebas de Hipótesis
Una prueba de hipótesis nos permite tomar decisiones sobre parámetros poblacionales. Consta de:
- Hipótesis nula ($H_0$): Suposición a contrastar.
- Hipótesis alternativa ($H_1$): Afirmación que aceptamos si rechazamos $H_0$.
- Nivel de significancia ($\alpha$): Probabilidad de rechazar $H_0$ cuando es verdadera.
Ejemplo 2: Prueba Z para la Media
Queremos probar si la altura media de los estudiantes es 1.70 m ($H_0: \mu = 1.70$) contra $H_1: \mu \neq 1.70$. Con $n=50$, $\bar{X}=1.72$, $\sigma=0.1$ y $\alpha=0.05$:
$$ Z = \frac{\bar{X} – \mu}{\sigma/\sqrt{n}} = \frac{1.72 – 1.70}{0.1/\sqrt{50}} \approx 1.41 $$
Como $|Z| < 1.96$ (valor crítico), no rechazamos $H_0$.
Intervalos de Confianza
Un intervalo de confianza proporciona un rango de valores plausibles para un parámetro. Para la media con $\sigma$ conocida:
$$ \text{IC}_{1-\alpha} = \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} $$
Ejercicio 1: IC para la Media
Con $\bar{X}=1.72$, $\sigma=0.1$, $n=50$ y $\alpha=0.05$, calcule el IC del 95%.
Solución:
$$ 1.72 \pm 1.96 \times \frac{0.1}{\sqrt{50}} \approx 1.72 \pm 0.028 $$
El IC es $(1.692, 1.748)$.
Regresión Lineal
La regresión lineal modela la relación entre variables. El modelo simple es:
$$ Y = \beta_0 + \beta_1 X + \epsilon $$
Donde $\beta_0$ y $\beta_1$ se estiman por mínimos cuadrados.
Ejercicio 2: Ajuste de Regresión
Dados los pares $(X,Y)$: (1,2), (2,3), (3,5), estime $\beta_0$ y $\beta_1$.
Solución:
Calculamos:
$$ \bar{X}=2, \bar{Y}=3.33 $$
$$ \beta_1 = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sum (X_i – \bar{X})^2} = \frac{2.33}{2} \approx 1.165 $$
$$ \beta_0 = \bar{Y} – \beta_1 \bar{X} \approx 1 $$
El modelo es $Y \approx 1 + 1.165X$.
Aplicaciones Prácticas
La estadística inferencial tiene aplicaciones en:
- Medicina: Evaluación de tratamientos mediante ensayos clínicos.
- Economía: Predicción de indicadores económicos.
- Calidad: Control de procesos en la industria.
Para profundizar en aplicaciones, visite nuestro artículo sobre aplicaciones de la estadística.
Conclusión
La estadística inferencial es esencial para extraer conclusiones a partir de datos. Hemos cubierto:
- Conceptos básicos como estimación y pruebas de hipótesis.
- Teoremas fundamentales como el TCL.
- Aplicaciones prácticas en diversos campos.
Con estos conocimientos, estás listo para aplicar técnicas inferenciales en tus proyectos.
Ejercicios Adicionales
Ejercicio 3: Prueba t
Para una muestra con $\bar{X}=5$, $s=2$, $n=20$, pruebe $H_0: \mu=4.5$ vs $H_1: \mu>4.5$ con $\alpha=0.05$.
Solución:
$$ t = \frac{5 – 4.5}{2/\sqrt{20}} \approx 1.12 $$
El valor crítico es $t_{19,0.05} \approx 1.729$. No se rechaza $H_0$.
Ejercicio 4: IC para Proporción
En una encuesta, 60 de 150 personas apoyan una política. Calcule el IC del 95% para $p$.
Solución:
$$ \hat{p} = 60/150 = 0.4 $$
$$ 0.4 \pm 1.96 \sqrt{\frac{0.4 \times 0.6}{150}} \approx 0.4 \pm 0.078 $$
IC: $(0.322, 0.478)$.
Ejercicio 5: ANOVA
Compare tres grupos con medias $\bar{X}_1=10$, $\bar{X}_2=12$, $\bar{X}_3=15$, $n_i=10$, $MSE=4$. Calcule el estadístico F.
Solución:
$$ \text{MSB} = \frac{10[(10-12.33)^2 + (12-12.33)^2 + (15-12.33)^2]}{2} \approx 83.33 $$
$$ F = \frac{83.33}{4} \approx 20.83 $$
«`
