OBJETIVOS
-
Aprender a calcular la correlación entre dos variables
-
Saber dibujar un diagrama de dispersión
-
Representar la recta que define la relación lineal entre dos variables
-
Saber estimar la recta de regresión por el método de mínimos cuadrados e interpretar su
ajuste.
-
Realizar inferencia sobre los parámetros de la recta de regresión
-
Construir e interpretar intervalos de confianza e intervalos de predicción para la variable
dependiente
- Realizar una prueba de hipótesis para determinar si el coeficiente de correlación es distinto de cero
Estudiaremos el grado de relación entre dos variables en lo que
llamaremos análisis de correlación.
Para representar esta relación utilizaremos una representación gráfica llamada diagrama de dispersión.
Finalmente, estudiaremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión.
Para representar esta relación utilizaremos una representación gráfica llamada diagrama de dispersión.
Finalmente, estudiaremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión.
CONCEPTOS FUNDAMENTALES___________________________________
Definición de Correlación Lineal
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I.
Una primera aproximación al problema consistiría en dibujar en el plano R2 un punto por cada alumno: la primera coordenada de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas.
En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1 :
Autores: Alicia Vila (avilag@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Ana López
(alopezrat@uoc.edu), Ángel A. Juan (ajuanp@uoc.edu),
Definición de Correlación Lineal
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I.
Una primera aproximación al problema consistiría en dibujar en el plano R2 un punto por cada alumno: la primera coordenada de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas.
En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1 :
En donde:
R = coeficiente de
correlación
N = número de pares
ordenados
X = variable
independiente
Y = variable
independiente
Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la
correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y),
y se aproxima a –1 cuando la correlación tiende a ser lineal inversa.
Es importante notar que la existencia de correlación entre variables no implica causalidad.
¡Atención!: si no hay correlación de ningún tipo entre dos v.a., entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.
El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables:
Es importante notar que la existencia de correlación entre variables no implica causalidad.
¡Atención!: si no hay correlación de ningún tipo entre dos v.a., entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.
El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables:
CORRELACIÓN LINEAL Y ANÁLISIS DE REGRESIÓN
Análisis de regresión y correlación lineal.
No hay comentarios:
Publicar un comentario