TEMA 12


Tema 12: Concordancia y correlación.

Correlación paramétrica: Pearson

Para recoger los datos podemos poner en cada fila los datos del individuo y en cada columna los valores que toma una variable. Dichas observaciones pueden ser representados en un diagrama de dispersión, donde cada individuo es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo será intentar reconocer a partir del mismo si hay una relación entre las variables y si es posible predecir el valor de una de ellas en función de la otra.

Relación entre dos variables cuantitativas.

- Variables independientes: se refutaría la hipótesis nula.
- Variables dependientes:

Dependencia funcional: puntos exactamente sobre la línea recta o curva, no se suele dar en estadística.
Dependencia estocástica: no están todos los puntos exactamente sobre el modelo, sino que existe una tendencia.

Modelo de análisis de regresión, 1 variable explicativa, simple y lineal.

Se trata de estudiar la asociación lineal entre dos variables cuantitativas, por la influencia de la edad en las cifras de tensión arterial sistólica. La regresión lineal simples nos dice que es una sola variable independiente.

y = a + bx  siendo y la variable dependiente y x la variable independiente, la pendiente de la recta es b y a es el punto de intersección con el eje de coordenadas. b expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente. a expresa cual es el valor de la variable dependiente cuando la independiente vale cero. Si x=0 entonces y=a.
Si b>0 existe una relación directa, si b<0 existe una relación inversa.



Modelos lineales.

- Modelos lineales deterministas: la variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente.

- Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.
La recta para determinar es aquélla con la menor distancia de cada punto a ella.

Coeficientes de correlación.

- Coeficientes de correlación de Pearson --> paramétrica por lo que requiere que la distribución siga una normalidad.

- Rho de Spearman --> no paramétrica por lo que requiere que se emplee cuando la distribución no sigue la normalidad.

Para las variables cuantitativas normales, el análisis de correlación se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables. El coeficiente de correlación r de Pearson es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables, cuyos valores van desde -1 (correlación negativa) a 1 (correlación positiva), sin correlación sería r=0.

r < 0 tenemos relación lineal inversa.
r > 0 tenemos relación lineal directa.
r = 0 variables independientes.

El coeficiente rho de Spearman es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal. Se ordenan los valores de una de las variables y lo acompañamos de su correspondiente valor ordenado en la otra variable. Para cada par de observaciones calculamos su diferencia y se eleva al cuadrado cada di y se suman todos los valores encontrados y se calcula para determinar la discrepancia entre los rangos la siguiente fórmula -1< rs <1

rs= -1 La asociación es negativa e inversa, las ordenaciones son perfectamente contrarias.

rs= 0 no existe asociación

rs= 1 Las ordenaciones son todas concordantes.


Regresión lineal simple: correlación y determinación.

Coeficiente de correlación (Pearson y Spearman):  Número adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación lineal entre dos variables.

Coeficiente de determinación: número adimensional (entre 0 y 1) que da idea de la relación entre las variables relacionadas linealmente. Es R2, cuando más se aproxime a 1 mayor poder explicativo, es decir, más cantidad de puntos de la nube están cerca.

t de Kendall.

Se realiza el cálculo para modelos de regresión lineal simple:






t > valor de la tabla rechazo la hipótesis nula.

t < valor de la tabla acepto hipótesis nula.

EJEMPLO:

Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los siguientes datos:

















X representa la renta nacional en millones de euros e Y representa las ventas de la compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive). Calcular:

1. La recta de regresión de Y sobre X.























2. El coeficiente de correlación lineal e interpretarlo.








Es un coeficiente de correlación positivo y cercano a uno, por lo que la correlación es directa y fuerte.


3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la predicción para las ventas de la compañía en este año?









Comentarios

Entradas populares de este blog

TEMA 3

TEMA 17

Presentación