Estadística Inferencial: Teoría y Práctica


«`html





Estadística Inferencial: Teoría y Práctica

Introducción

La estadística inferencial es una herramienta fundamental en la ciencia de datos, la investigación y la toma de decisiones. A diferencia de la estadística descriptiva, que se limita a resumir datos, la inferencial nos permite hacer predicciones y generalizaciones sobre una población a partir de una muestra. En este artículo, exploraremos los conceptos clave, teoremas fundamentales y aplicaciones prácticas de esta disciplina.

Conceptos Básicos

La estadística inferencial se basa en dos pilares: la estimación de parámetros y las pruebas de hipótesis. Un parámetro es una medida descriptiva de una población, como la media ($\mu$) o la desviación estándar ($\sigma$). A través de muestras, estimamos estos parámetros usando estadísticos como $\bar{X}$ (media muestral) o $s$ (desviación estándar muestral).

Ejemplo 1: Estimación Puntual

Supongamos que queremos estimar la altura promedio de los estudiantes en una universidad. Tomamos una muestra de 50 estudiantes y calculamos su altura media, obteniendo $\bar{X} = 1.72$ metros. Este valor es una estimación puntual de $\mu$.

Teoremas Fundamentales

Teorema 1: Ley de los Grandes Números

Enunciado: Si $X_1, X_2, \dots, X_n$ son variables aleatorias independientes e idénticamente distribuidas con media $\mu$, entonces:

$$ \bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i \xrightarrow{P} \mu \quad \text{cuando} \quad n \to \infty $$

Demostración: Por la desigualdad de Chebyshev, para cualquier $\epsilon > 0$:

$$ P(|\bar{X}_n – \mu| \geq \epsilon) \leq \frac{\text{Var}(\bar{X}_n)}{\epsilon^2} = \frac{\sigma^2}{n\epsilon^2} \to 0 $$

Lo que implica convergencia en probabilidad.

Teorema 2: Teorema Central del Límite

Enunciado: Bajo las mismas condiciones del Teorema 1, la distribución de $\sqrt{n}(\bar{X}_n – \mu)/\sigma$ converge a una distribución normal estándar $N(0,1)$ cuando $n \to \infty$.

Demostración: Usando funciones características, se muestra que la función característica de $Z_n = \sqrt{n}(\bar{X}_n – \mu)/\sigma$ converge a $e^{-t^2/2}$, que es la función característica de $N(0,1)$.

Pruebas de Hipótesis

Una prueba de hipótesis nos permite tomar decisiones sobre parámetros poblacionales. Consta de:

  • Hipótesis nula ($H_0$): Suposición a contrastar.
  • Hipótesis alternativa ($H_1$): Afirmación que aceptamos si rechazamos $H_0$.
  • Nivel de significancia ($\alpha$): Probabilidad de rechazar $H_0$ cuando es verdadera.

Ejemplo 2: Prueba Z para la Media

Queremos probar si la altura media de los estudiantes es 1.70 m ($H_0: \mu = 1.70$) contra $H_1: \mu \neq 1.70$. Con $n=50$, $\bar{X}=1.72$, $\sigma=0.1$ y $\alpha=0.05$:

$$ Z = \frac{\bar{X} – \mu}{\sigma/\sqrt{n}} = \frac{1.72 – 1.70}{0.1/\sqrt{50}} \approx 1.41 $$

Como $|Z| < 1.96$ (valor crítico), no rechazamos $H_0$.

Intervalos de Confianza

Un intervalo de confianza proporciona un rango de valores plausibles para un parámetro. Para la media con $\sigma$ conocida:

$$ \text{IC}_{1-\alpha} = \bar{X} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} $$

Ejercicio 1: IC para la Media

Con $\bar{X}=1.72$, $\sigma=0.1$, $n=50$ y $\alpha=0.05$, calcule el IC del 95%.

Solución:

$$ 1.72 \pm 1.96 \times \frac{0.1}{\sqrt{50}} \approx 1.72 \pm 0.028 $$

El IC es $(1.692, 1.748)$.

Regresión Lineal

La regresión lineal modela la relación entre variables. El modelo simple es:

$$ Y = \beta_0 + \beta_1 X + \epsilon $$

Donde $\beta_0$ y $\beta_1$ se estiman por mínimos cuadrados.

Ejercicio 2: Ajuste de Regresión

Dados los pares $(X,Y)$: (1,2), (2,3), (3,5), estime $\beta_0$ y $\beta_1$.

Solución:

Calculamos:

$$ \bar{X}=2, \bar{Y}=3.33 $$
$$ \beta_1 = \frac{\sum (X_i – \bar{X})(Y_i – \bar{Y})}{\sum (X_i – \bar{X})^2} = \frac{2.33}{2} \approx 1.165 $$
$$ \beta_0 = \bar{Y} – \beta_1 \bar{X} \approx 1 $$

El modelo es $Y \approx 1 + 1.165X$.

Aplicaciones Prácticas

La estadística inferencial tiene aplicaciones en:

  • Medicina: Evaluación de tratamientos mediante ensayos clínicos.
  • Economía: Predicción de indicadores económicos.
  • Calidad: Control de procesos en la industria.

Para profundizar en aplicaciones, visite nuestro artículo sobre aplicaciones de la estadística.

Conclusión

La estadística inferencial es esencial para extraer conclusiones a partir de datos. Hemos cubierto:

  • Conceptos básicos como estimación y pruebas de hipótesis.
  • Teoremas fundamentales como el TCL.
  • Aplicaciones prácticas en diversos campos.

Con estos conocimientos, estás listo para aplicar técnicas inferenciales en tus proyectos.

Ejercicios Adicionales

Ejercicio 3: Prueba t

Para una muestra con $\bar{X}=5$, $s=2$, $n=20$, pruebe $H_0: \mu=4.5$ vs $H_1: \mu>4.5$ con $\alpha=0.05$.

Solución:

$$ t = \frac{5 – 4.5}{2/\sqrt{20}} \approx 1.12 $$

El valor crítico es $t_{19,0.05} \approx 1.729$. No se rechaza $H_0$.

Ejercicio 4: IC para Proporción

En una encuesta, 60 de 150 personas apoyan una política. Calcule el IC del 95% para $p$.

Solución:

$$ \hat{p} = 60/150 = 0.4 $$
$$ 0.4 \pm 1.96 \sqrt{\frac{0.4 \times 0.6}{150}} \approx 0.4 \pm 0.078 $$

IC: $(0.322, 0.478)$.

Ejercicio 5: ANOVA

Compare tres grupos con medias $\bar{X}_1=10$, $\bar{X}_2=12$, $\bar{X}_3=15$, $n_i=10$, $MSE=4$. Calcule el estadístico F.

Solución:

$$ \text{MSB} = \frac{10[(10-12.33)^2 + (12-12.33)^2 + (15-12.33)^2]}{2} \approx 83.33 $$
$$ F = \frac{83.33}{4} \approx 20.83 $$



«`

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *