Upload
el-res
View
223
Download
0
Embed Size (px)
Citation preview
7/26/2019 DiapositivasTema2 Regresion Simple
1/21
Tema 2. Mtodos deRegresin Estadstica
Parte I: Introduccin y Regresin simple
Mtodos Estadsticos en OrdenadorGrado en Relaciones Laborales y Recursos Humanos
7/26/2019 DiapositivasTema2 Regresion Simple
2/21
INTRODUCCINEl Anlisis de Regresin tiene como objetivo estudiar la
relacin entre variables.Permite expresar dicha relacin en trminos de unaecuacin ue conecta una variable de res uesta Y con
una o ms variables explicativas X1,X2,,Xk.Finalidad:
Determinacin explcita del funcional que relaciona las
variables. (Prediccin)
Comprensin por parte del analista de las interrelaciones
entre las variables que intervienen en el anlisis.
7/26/2019 DiapositivasTema2 Regresion Simple
3/21
EJEMPLOSSe quiere estudiar la posible relacin existente entre la tasa de
desempleo en cierta regin con la tasa de delitos durante un
periodo de recesin econmica.Como resultado de una nueva poltica empresarial, se ha
aumentado progresivamente la inversin en formacin de losempleados en una multinacional. Se sospecha que estencremen o en nvers n a en o gran mpor anc a en osbeneficios de la empresa. Se desea describir cmo son losbeneficios en funcin de los gatos en inversin.
Describir la relacin entre la renta anual familiar y los gastosen ocio.
Una empresa desea conocer la ecuacin que permita describir(y predecir) las ventas de un producto en funcin de lainversin en publicidad en televisin, en publicidad en radio yen los peridicos.
7/26/2019 DiapositivasTema2 Regresion Simple
4/21
PLANTEAMIENTO GENERAL
Notacin:Y variable de respuesta (dependiente, endgena, explicada)X1,X2,,Xkvariables explicativas (independientes, exgenas,
Modelo general de Regresin:Y = m (X1,X2,,Xk ) +
m funcin de regresin residuos del modelo (errores de observacin, inadecuacin del
modelo)
7/26/2019 DiapositivasTema2 Regresion Simple
5/21
Variantes del Anlisis de Regresinen SPSS
Segn el nmero de v. explicativas: Simple o Mltiple. Supuestos sobre la funcin de regresin
Y = 0 + 1 X1+ 2 X2 ++ k Xk +
Estimacin curvilnea (Potencial, exponencial, hiperblica, etc.)
Y = exp (a + b X) ln Y = a + b X
Regresin no lineal (Algoritmos de estimacin iterativos)
Linealizacin
7/26/2019 DiapositivasTema2 Regresion Simple
6/21
Variantes del Anlisis de Regresinen SPSS
Tipo de datosRegresin logstica, Modelos Probit (La variable de respuesta
es binaria)
Regresin ordinal (La variable de respuesta es de tipo ordinal)Escalamiento ptimo o regresin categrica (Las variables
explicativas y/o explicada, pueden ser nominales)
Situaciones especiales en la estimacin del modelo lineal: Mnimoscuadrados en dos fases (correlacin entre residuos y v. explicativas),
estimacion ponderada (situacin de heterocedasticidad)
7/26/2019 DiapositivasTema2 Regresion Simple
7/21
Submen REGRESINRegresin lineal mltiple
Ajuste de curvas mediante linealizacin
Modelos de regresin conrespuestas binarias u ordinales
Modelos de regresin convariables categricas Correcciones en el modelo lineal
Modelos de regresin no lineales
7/26/2019 DiapositivasTema2 Regresion Simple
8/21
PARTE I: REGRESIN SIMPLEEjemplo 1: Se quiere estudiar la posible relacinexistente entre la tasa de desempleo en ciertaregin del sur de Europa con la tasa de delitosdurante 15 meses, en esa zona en un periodo derecesin econmica.
ejregsimple_1.sav
en 15 mesesVariables:
Tasa de desempleo
Tasa de delitos
Objetivo: Estudiar la influencia que tiene la tasa dedesempleo en la tasa de delitos.
egresin simple
7/26/2019 DiapositivasTema2 Regresion Simple
9/21
Regresin lineal simple-Modelo terico-Modelo lineal Y = 0 + 1 X + (1)
Parmetros1 magnitud del efecto que X tienen sobre Y (incremento en la media de
Y cuando X aumenta una unidad)
0 residuos (perturbaciones aleatorias, error del modelo)
Hiptesis: Los residuos se suponen variables aleatorias incorreladas,normales con media cero y la misma varianza.
Datos (observaciones, muestra) { (Yi, Xi) : i = 1,,n }PROBLEMA Suponiendo que la relacin entre las variables es como
en (1), estimar los coeficientes de la regresin: 0y1
7/26/2019 DiapositivasTema2 Regresion Simple
10/21
Paso inicial: Explorar la relacin entrelas variables: diagrama de dispersin
Grficos / Cuadros de dilogo antiguos / Dispersin/puntos
7/26/2019 DiapositivasTema2 Regresion Simple
11/21
Ajustar un modelo lineal medianteregresin simple
Problema de mnimos cuadrados2n
, 10 =
1i
i10i n m zar
Objetivo: Hacer mnima la sumaresidual de cuadrados:
( ){ } { } ===
==+
n
1i
2
i
2n
1i
ii
2n
1i
i10i YYXY
xy
1=
=
0
2
x
xy
1
s
sSolucin:
7/26/2019 DiapositivasTema2 Regresion Simple
12/21
Estimacin de los parmetros delmodelo lineal: ejemplo 1
Modelo terico: T_Delito = 0+ 1T_Desempleo +
Datos: ( xi, yi) / yi= 0+ 1xi+ i ( i = 1, 2,..., n=15 )Parmetros del modelo:
0 Tasa media de delitos en un mes donde la tasa de desempleo es cero
1 Incremento medio en la tasa de delitos cuando la tasa de desempleo se
incrementa en una unidad
7/26/2019 DiapositivasTema2 Regresion Simple
13/21
Estimacin de los parmetros delmodelo lineal: ejemplo
s x
296.5xy
.
s
10
2
x
1
==
==
La recta de regresin ajustada es:
Tasa de delitos = 5.296 + Tasa de desempleo * 1.663Interpretacin:
Pendiente (1.663): Por cada unidad de que aumenta la tasa de desempleo, latasa de delitos aumenta en 1.663 unidades.
Ordenada en el origen (5.296): Cuando la tasa de desempleo es de 0 unidadesla tasa de delitos media es de 5.296 unidades
7/26/2019 DiapositivasTema2 Regresion Simple
14/21
Estudio de la bondad del ajuste:ANOVA del modelo de regresin
BONDAD DEL AJUSTE:
Descomposicin de la variabilidad
( ) ( ) ( )222
===
+=
n
ii
n
i
n
i YYyYyY
COEFICIENTE DE DETERMINACIN 21
VE VNE
R VT VT = = 0
R2
1
= +VT VE VNE
7/26/2019 DiapositivasTema2 Regresion Simple
15/21
Estudio de la bondad del ajuste:ANOVA del modelo de regresin2 2 2
1 1 1
( ) ( )N N N
i i i
i i i
y y y y e= = =
= +
VT VE VNE
VT
VE
VNE
2 1VE VNE
RVT VT
= =
La bondad del ajuste viene dada por el coeficiente de determinacin R2 = 0.897.
Interpretacin: el 89.7% de la variabilidad de la tasa de delitos queda explicada por
la tasa de desempleo mediante el modelo lineal ajustado
7/26/2019 DiapositivasTema2 Regresion Simple
16/21
Contraste de RegresinOBJETIVO: Verificar la existencia de regresin lineal entre X e Y
FORMULACIN H0: 1 = 0H1: 1 0H0: R2= 0H1: R2 0
TABLA ANOVA
Aceptar la hiptesis nula H0 significara que las variables no estnasociadas de forma lineal, esto es, el modelo lineal no es
adecuado para describir la posible relacin entre X e Y
FUENTE SUMA DECUADRADOS G.D.L. MEDIACUADRTICA Fexp p-valor
MODELO VE 1 VE
RESIDUAL VNE N-2 VNE/(N-2)
TOTAL VT N-1VNE
N-2
VE
El p-valor es 0.000,menor que 0.05,entonces se rechaza lahiptesis nula y por
tanto existe relacinlineal entre las variables
7/26/2019 DiapositivasTema2 Regresion Simple
17/21
Contraste de la ordenada en el origenOBJETIVO: Verificar si tiene sentido incluir un trmino constante
en la ecuacin de la recta
FORMULACIN H0: 0 = 0H1: 0 0
Aceptar la hiptesis nula H0 significara que la constante se puede
eliminar del modelo, esto es, es ms adecuado describir la relacin
de dependencia de Y con X mediante una ecuacin del tipo Y= 1X
El p-valor=0.071>0.05, entonces se acepta lahiptesis nula y por tanto parececonveniente eliminar la constante del modelo.No obstante el p-valor no es demasiado
grande.
7/26/2019 DiapositivasTema2 Regresion Simple
18/21
EJERCICIO PROPUESTO 1Enunciado: Como resultado de una nueva polticaempresarial, se ha aumentado progresivamente la
inversin en formacin de los empleados en unamultinacional de software. Se sospecha que esteincremento en inversin ha tenido gran importancia enlos beneficios de la empresa. Se recogen datos
de euros) y a los beneficios brutos de la empresa (enmillones de euros) en los ltimos diez meses.
a) Representa el diagrama de dispersinb) Ajustar un modelo lineal y estudiar la bondad del
ajustec) Comprobar si existe relacin lineal entre lasvariables.d) Utilizando la opcin de regresin curvilnea,realizar un ajuste exponencial. Comparar la
bondad de este ajuste con la del modelo lineal.Qu modelo es preferible?
ejregsimple_2.sav
7/26/2019 DiapositivasTema2 Regresion Simple
19/21
SOLUCIN
(b) Ajuste del modelo lineal (coeficientes y bondad del ajuste)
(a) Diagrama de dispersin
(c) Contraste de regresin (existencia de relacin lineal entre las variables)
7/26/2019 DiapositivasTema2 Regresion Simple
20/21
SOLUCIN(d) Ajuste del modeloexponencial y comparacincon el modelo lineal
7/26/2019 DiapositivasTema2 Regresion Simple
21/21
EJERCICIO PROPUESTO 2Enunciado:Se ha realizado un estudio para conocer siexiste relacin lineal entre la renta mensual de una
familia, en euros y el gasto en actividades de tipocultural, en euros. Los datos aparecen en la tablaadjunta. Se pide:
a) Representa el diagrama de dispersin. Qumo e o crees conven en e emp ear
b) Realiza un ajuste lineal, interpreta loscoeficientes de regresin y obtn el gasto enactividades culturales de una familia con una rentamensual disponible de 2500 euros.
c) Existe relacin lineal? Razona la respuesta.d) A partir del resultado obtenido en el apartado c),qu puedes afirmar ahora sobre la prediccinobtenida en el apartado b)?
e) Tiene sentido considerar otros modelos?Razona la respuesta