El Teorema Central del Límite: Importancia en Estadística


«`html





El Teorema Central del Límite: Importancia en Estadística

Introducción

Imagina que deseas conocer el promedio de altura de los estudiantes en una universidad. Medir a cada uno sería tedioso, pero ¿y si solo mides una muestra? Aquí entra el Teorema Central del Límite (TCL), uno de los pilares de la estadística. Este teorema nos permite hacer inferencias sobre poblaciones enteras a partir de muestras, incluso cuando la distribución original no es normal. En este artículo, exploraremos su importancia, demostraciones técnicas, ejercicios prácticos y aplicaciones en el mundo real.

¿Qué es el Teorema Central del Límite?

El TCL establece que, bajo ciertas condiciones, la suma (o promedio) de un gran número de variables aleatorias independientes e idénticamente distribuidas (i.i.d.) seguirá aproximadamente una distribución normal, independientemente de la forma de la distribución original. Matemáticamente, si $X_1, X_2, \dots, X_n$ son variables i.i.d. con media $\mu$ y varianza $\sigma^2$, entonces:

$$ \frac{\bar{X} – \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1) $$

donde $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ es la media muestral y $\xrightarrow{d}$ denota convergencia en distribución.

Condiciones para la Aplicación del TCL

El TCL requiere que se cumplan las siguientes condiciones:

  1. Independencia: Las variables deben ser independientes entre sí.
  2. Mismo tamaño de muestra: Todas las variables deben tener la misma distribución.
  3. Tamaño de muestra grande: Generalmente, $n \geq 30$ se considera suficiente.

Ejemplo 1: Lanzamiento de un dado

Considera el lanzamiento de un dado justo. La distribución de un solo lanzamiento es uniforme, pero si lanzamos el dado 50 veces y calculamos el promedio de los resultados, la distribución del promedio se aproximará a una normal.

Teoremas y Demostraciones

Teorema 1: Formulación Clásica del TCL

Sea $X_1, X_2, \dots, X_n$ una secuencia de variables aleatorias i.i.d. con media $\mu$ y varianza $\sigma^2 < \infty$. Entonces, la variable estandarizada:

$$ Z_n = \frac{\bar{X} – \mu}{\sigma/\sqrt{n}} $$

converge en distribución a una normal estándar $N(0,1)$ cuando $n \to \infty$.

Demostración (Esquema):

Usando la función característica, se muestra que la función característica de $Z_n$ converge a la de una normal estándar. Para $t \in \mathbb{R}$:

$$ \phi_{Z_n}(t) = \left(1 – \frac{t^2}{2n} + o\left(\frac{t^2}{n}\right)\right)^n \to e^{-t^2/2} $$

que es la función característica de $N(0,1)$.

Teorema 2: TCL para Variables no Idénticas (Lindeberg-Lévy)

Si $X_1, X_2, \dots, X_n$ son independientes con medias $\mu_i$ y varianzas $\sigma_i^2$, y se cumple la condición de Lindeberg, entonces:

$$ \frac{\sum_{i=1}^n (X_i – \mu_i)}{\sqrt{\sum_{i=1}^n \sigma_i^2}} \xrightarrow{d} N(0,1) $$

Demostración (Esquema):

La condición de Lindeberg asegura que ninguna variable domine la suma. Se usa nuevamente la convergencia de funciones características.

Ejercicios Resueltos

Ejercicio 1: Promedio de Exámenes

Las calificaciones de un examen tienen media $\mu = 70$ y desviación estándar $\sigma = 10$. Si tomamos una muestra de $n = 50$ estudiantes, ¿cuál es la probabilidad de que el promedio sea mayor a 72?

Solución:

Estandarizamos usando el TCL:

$$ Z = \frac{72 – 70}{10/\sqrt{50}} \approx 1.41 $$

Buscamos $P(Z > 1.41) = 1 – \Phi(1.41) \approx 0.0793$.

Ejercicio 2: Suma de Variables Uniformes

Sea $X_i \sim \text{Uniforme}(0,1)$. Aproxima $P\left(\sum_{i=1}^{100} X_i > 55\right)$.

Solución:

Para $X_i \sim \text{Uniforme}(0,1)$, $\mu = 0.5$ y $\sigma^2 = 1/12$. Aplicamos TCL:

$$ P\left(\frac{S_n – n\mu}{\sigma\sqrt{n}} > \frac{55 – 50}{1/\sqrt{12} \cdot 10}\right) \approx P(Z > 1.73) \approx 0.0418 $$

Aplicaciones Prácticas

El TCL es fundamental en:

  • Control de calidad: Evaluar si un proceso de fabricación está dentro de especificaciones.
  • Finanzas: Modelar rendimientos de activos como normales, aunque los precios no lo sean.
  • Medicina: Analizar resultados de pruebas clínicas a partir de muestras.

Para profundizar en aplicaciones, visita nuestro artículo sobre aplicaciones de la estadística.

Conclusión

El Teorema Central del Límite es una herramienta poderosa que justifica el uso de la distribución normal en innumerables contextos. Desde muestras grandes hasta inferencias poblacionales, su relevancia en estadística y ciencias aplicadas es incuestionable. Si deseas reforzar tus bases, te recomendamos nuestro artículo sobre introducción a la estadística.

En resumen:

  1. El TCL permite aproximar distribuciones de promedios a la normal.
  2. Es aplicable bajo condiciones de independencia y tamaño de muestra grande.
  3. Tiene aplicaciones prácticas en diversas disciplinas.



«`

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *