MEDIDAS DE CORRELACIÓN: COEFICIENTE DE PEARSON




OBJETIVOS
  • Aprender a calcular la correlación entre dos variables
  • Saber dibujar un diagrama de dispersión
  • Representar la recta que define la relación lineal entre dos variables
  • Saber estimar la recta de regresión por el método de mínimos cuadrados e interpretar su ajuste.
  • Realizar inferencia sobre los parámetros de la recta de regresión
  • Construir e interpretar intervalos de confianza e intervalos de predicción para la variable
    dependiente
  • Realizar una prueba de hipótesis para determinar si el coeficiente de correlación es distinto de cero 
Estudiaremos el grado de relación entre dos variables en lo que llamaremos análisis de correlación. 
Para representar esta relación utilizaremos una representación gráfica llamada diagrama de dispersión.
Finalmente, estudiaremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión. 


CONCEPTOS FUNDAMENTALES___________________________________

Definición de Correlación Lineal
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las notas de la asignatura Estadística I y las de Matemáticas I. 
Una primera aproximación al problema consistiría en dibujar en el plano R2 un punto por cada alumno: la primera coordenada de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas. Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas. 


En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r, cuyo valor oscila entre –1 y +1 : 

En donde:

R = coeficiente de correlación
N = número de pares ordenados
X = variable independiente
Y = variable independiente


Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la correlación tiende a ser lineal directa (mayores valores de X significan mayores valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal inversa.

Es importante notar que la existencia de correlación entre variables no implica causalidad.

¡Atención!: si no hay correlación de ningún tipo entre dos v.a., entonces tampoco habrá correlación lineal, por lo que r = 0. Sin embargo, el que ocurra r = 0 sólo nos dice que no hay correlación lineal, pero puede que la haya de otro tipo.
El siguiente diagrama resume el análisis del coeficiente de correlación entre dos variables:










page1image928 page1image1088 page1image1248
CORRELACIÓN LINEAL Y ANÁLISIS DE REGRESIÓN
Autores: Alicia Vila (avilag@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Ana López (alopezrat@uoc.edu), Ángel A. Juan (ajuanp@uoc.edu),page1image2056 page1image2216 page1image2376
Análisis de regresión y correlación lineal.
page1image4688 page1image4848 page1image5008 page1image5168

No hay comentarios:

Publicar un comentario