Simulacro de examen: correlación y causalidad

Introducción

En estadística, es fundamental comprender la diferencia entre correlación y causalidad. La correlación se refiere a una relación entre dos variables, mientras que la causalidad implica que una variable es la causa directa de la otra. Este simulacro de examen te ayudará a practicar y entender estos conceptos con preguntas resueltas y explicaciones detalladas.

Pregunta 1: Definiciones Básicas

Pregunta: Explica la diferencia entre correlación y causalidad.

Solución: La correlación indica que dos variables tienden a variar juntas, pero no implica que una cause la otra. Por ejemplo, el consumo de helados y los casos de ahogamientos están correlacionados porque ambos aumentan en verano, pero uno no causa el otro. La causalidad, por otro lado, implica una relación de causa y efecto, como fumar y el cáncer de pulmón.

Pregunta 2: Coeficiente de Correlación

Pregunta: Calcula el coeficiente de correlación de Pearson (\( r \)) para los siguientes datos:

X Y
1 2
2 4
3 6
4 8

Solución: El coeficiente de correlación de Pearson se calcula con la fórmula:

\[
r = \frac{n(\sum XY) – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}
\]

Para estos datos:

  • \( n = 4 \)
  • \( \sum X = 10 \)
  • \( \sum Y = 20 \)
  • \( \sum XY = 60 \)
  • \( \sum X^2 = 30 \)
  • \( \sum Y^2 = 120 \)

Sustituyendo en la fórmula:

\[
r = \frac{4(60) – (10)(20)}{\sqrt{[4(30) – 100][4(120) – 400]}} = \frac{240 – 200}{\sqrt{(120 – 100)(480 – 400)}} = \frac{40}{\sqrt{20 \times 80}} = \frac{40}{\sqrt{1600}} = \frac{40}{40} = 1
\]

El coeficiente de correlación es \( r = 1 \), lo que indica una correlación positiva perfecta.

Pregunta 3: Identificación de Causalidad

Pregunta: ¿Es posible afirmar que el aumento de ventas de paraguas causa un aumento en la incidencia de resfriados? Justifica tu respuesta.

Solución: No, no se puede afirmar que el aumento de ventas de paraguas cause un aumento en la incidencia de resfriados. Ambos fenómenos están correlacionados porque ocurren durante la temporada de lluvias, pero no hay una relación causal directa entre ellos. La lluvia es un factor común que influye en ambos.

Pregunta 4: Análisis de Datos

Pregunta: Se realizó un estudio sobre el tiempo dedicado a estudiar y las calificaciones obtenidas. Los resultados son:

Horas de Estudio (X) Calificación (Y)
2 5
4 7
6 9
8 10

a) Calcula el coeficiente de correlación. b) ¿Puedes concluir que estudiar más horas causa mejores calificaciones?

Solución:

a) Siguiendo el mismo procedimiento que en la Pregunta 2, obtenemos:

\[
r = \frac{4(180) – (20)(31)}{\sqrt{[4(120) – 400][4(255) – 961]}} = \frac{720 – 620}{\sqrt{(480 – 400)(1020 – 961)}} = \frac{100}{\sqrt{80 \times 59}} \approx \frac{100}{\sqrt{4720}} \approx \frac{100}{68.7} \approx 1.46
\]

El coeficiente de correlación es \( r \approx 0.96 \), indicando una fuerte correlación positiva.

b) Aunque existe una fuerte correlación, no se puede concluir causalidad sin un estudio experimental que controle otras variables.

Conclusión

Este simulacro de examen te ha permitido practicar conceptos clave de correlación y causalidad. Recuerda que la correlación no implica causalidad, y es esencial realizar análisis adicionales para establecer relaciones causales.


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *