Coeficiente de correlación
¿Qué es el coeficiente de correlación de Pearson?
El coeficiente de correlación de Pearson es una prueba estadística que analiza la relación entre dos variables continuas. Si la relación entre los componentes no es lineal, el coeficiente no está bien representado.
Para llevar a cabo la correlación de Pearson se requiere lo siguiente:
- La escala de medición debe ser una escala de intervalo o de razón.
- Las variables deben estar dispersas de forma aproximada.
- La relación debe ser lineal.
- Los datos deben estar libres de valores atípicos.
Cómo calcular el coeficiente de correlación
Para calcular el coeficiente de correlación lineal se utiliza la siguiente fórmula:
Es decir, tenemos por un lado el numerador y el denominador, los cuales se explicarán a continuación:
- Numerador. La covarianza se determina de la siguiente manera: para cada par de valores (x,y), se multiplica «x» menos su media por «y» menos su media. La suma de los resultados obtenidos para todos los pares de valores se divide por el tamaño de la muestra.
- El producto de las varianzas de «x» e «y» se calcula en el denominador, y se determina la raíz cuadrada de este producto.
Valores e interpretación del coeficiente de correlación
El coeficiente de correlación de Pearson se sitúa entre -1 y +1:
- Un valor inferior a 0 muestra una correlación negativa, lo que implica que las dos variables están relacionadas negativamente. Cuanto más fuerte es la relación inversa, más se acerca a -1. (cuando el valor de una es muy alto, el de la otra es muy bajo). Cuando el valor es exactamente -1, indica que tienen una correlación negativa perfecta.
- Un número mayor que cero implica una correlación positiva. En este caso, las variables estarían directamente conectadas. Cuanto más cerca estén de +1, más fuerte será su vínculo. Una relación lineal positiva completa se mostraría con un valor de exactamente +1.
- Por último, una correlación de cero o cercana a cero muestra que las dos variables no tienen ninguna relación lineal.
La representación gráfica de los datos es especialmente beneficiosa para visualizar la relación entre las variables, ya que hay que tener en cuenta que no todas las correlaciones entre las variables son lineales.
Ventajas e inconvenientes del coeficiente de correlación de Pearson
Las principales ventajas del coeficiente de correlación de Karl Pearson son las siguientes:
- El valor es independiente de la unidad de medida utilizada para medir las variables.
- La precisión de la estimación es más probable si el tamaño de la muestra es grande.
El coeficiente de correlación tiene los siguientes inconvenientes:
- Las dos variables deben medirse cuantitativamente de forma continua.
- La distribución de las variables debe parecerse a la curva normal.