DiapositivasTema2 Regresion Simple

  • Upload
    el-res

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    1/21

    Tema 2. Mtodos deRegresin Estadstica

    Parte I: Introduccin y Regresin simple

    Mtodos Estadsticos en OrdenadorGrado en Relaciones Laborales y Recursos Humanos

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    2/21

    INTRODUCCINEl Anlisis de Regresin tiene como objetivo estudiar la

    relacin entre variables.Permite expresar dicha relacin en trminos de unaecuacin ue conecta una variable de res uesta Y con

    una o ms variables explicativas X1,X2,,Xk.Finalidad:

    Determinacin explcita del funcional que relaciona las

    variables. (Prediccin)

    Comprensin por parte del analista de las interrelaciones

    entre las variables que intervienen en el anlisis.

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    3/21

    EJEMPLOSSe quiere estudiar la posible relacin existente entre la tasa de

    desempleo en cierta regin con la tasa de delitos durante un

    periodo de recesin econmica.Como resultado de una nueva poltica empresarial, se ha

    aumentado progresivamente la inversin en formacin de losempleados en una multinacional. Se sospecha que estencremen o en nvers n a en o gran mpor anc a en osbeneficios de la empresa. Se desea describir cmo son losbeneficios en funcin de los gatos en inversin.

    Describir la relacin entre la renta anual familiar y los gastosen ocio.

    Una empresa desea conocer la ecuacin que permita describir(y predecir) las ventas de un producto en funcin de lainversin en publicidad en televisin, en publicidad en radio yen los peridicos.

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    4/21

    PLANTEAMIENTO GENERAL

    Notacin:Y variable de respuesta (dependiente, endgena, explicada)X1,X2,,Xkvariables explicativas (independientes, exgenas,

    Modelo general de Regresin:Y = m (X1,X2,,Xk ) +

    m funcin de regresin residuos del modelo (errores de observacin, inadecuacin del

    modelo)

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    5/21

    Variantes del Anlisis de Regresinen SPSS

    Segn el nmero de v. explicativas: Simple o Mltiple. Supuestos sobre la funcin de regresin

    Y = 0 + 1 X1+ 2 X2 ++ k Xk +

    Estimacin curvilnea (Potencial, exponencial, hiperblica, etc.)

    Y = exp (a + b X) ln Y = a + b X

    Regresin no lineal (Algoritmos de estimacin iterativos)

    Linealizacin

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    6/21

    Variantes del Anlisis de Regresinen SPSS

    Tipo de datosRegresin logstica, Modelos Probit (La variable de respuesta

    es binaria)

    Regresin ordinal (La variable de respuesta es de tipo ordinal)Escalamiento ptimo o regresin categrica (Las variables

    explicativas y/o explicada, pueden ser nominales)

    Situaciones especiales en la estimacin del modelo lineal: Mnimoscuadrados en dos fases (correlacin entre residuos y v. explicativas),

    estimacion ponderada (situacin de heterocedasticidad)

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    7/21

    Submen REGRESINRegresin lineal mltiple

    Ajuste de curvas mediante linealizacin

    Modelos de regresin conrespuestas binarias u ordinales

    Modelos de regresin convariables categricas Correcciones en el modelo lineal

    Modelos de regresin no lineales

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    8/21

    PARTE I: REGRESIN SIMPLEEjemplo 1: Se quiere estudiar la posible relacinexistente entre la tasa de desempleo en ciertaregin del sur de Europa con la tasa de delitosdurante 15 meses, en esa zona en un periodo derecesin econmica.

    ejregsimple_1.sav

    en 15 mesesVariables:

    Tasa de desempleo

    Tasa de delitos

    Objetivo: Estudiar la influencia que tiene la tasa dedesempleo en la tasa de delitos.

    egresin simple

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    9/21

    Regresin lineal simple-Modelo terico-Modelo lineal Y = 0 + 1 X + (1)

    Parmetros1 magnitud del efecto que X tienen sobre Y (incremento en la media de

    Y cuando X aumenta una unidad)

    0 residuos (perturbaciones aleatorias, error del modelo)

    Hiptesis: Los residuos se suponen variables aleatorias incorreladas,normales con media cero y la misma varianza.

    Datos (observaciones, muestra) { (Yi, Xi) : i = 1,,n }PROBLEMA Suponiendo que la relacin entre las variables es como

    en (1), estimar los coeficientes de la regresin: 0y1

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    10/21

    Paso inicial: Explorar la relacin entrelas variables: diagrama de dispersin

    Grficos / Cuadros de dilogo antiguos / Dispersin/puntos

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    11/21

    Ajustar un modelo lineal medianteregresin simple

    Problema de mnimos cuadrados2n

    , 10 =

    1i

    i10i n m zar

    Objetivo: Hacer mnima la sumaresidual de cuadrados:

    ( ){ } { } ===

    ==+

    n

    1i

    2

    i

    2n

    1i

    ii

    2n

    1i

    i10i YYXY

    xy

    1=

    =

    0

    2

    x

    xy

    1

    s

    sSolucin:

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    12/21

    Estimacin de los parmetros delmodelo lineal: ejemplo 1

    Modelo terico: T_Delito = 0+ 1T_Desempleo +

    Datos: ( xi, yi) / yi= 0+ 1xi+ i ( i = 1, 2,..., n=15 )Parmetros del modelo:

    0 Tasa media de delitos en un mes donde la tasa de desempleo es cero

    1 Incremento medio en la tasa de delitos cuando la tasa de desempleo se

    incrementa en una unidad

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    13/21

    Estimacin de los parmetros delmodelo lineal: ejemplo

    s x

    296.5xy

    .

    s

    10

    2

    x

    1

    ==

    ==

    La recta de regresin ajustada es:

    Tasa de delitos = 5.296 + Tasa de desempleo * 1.663Interpretacin:

    Pendiente (1.663): Por cada unidad de que aumenta la tasa de desempleo, latasa de delitos aumenta en 1.663 unidades.

    Ordenada en el origen (5.296): Cuando la tasa de desempleo es de 0 unidadesla tasa de delitos media es de 5.296 unidades

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    14/21

    Estudio de la bondad del ajuste:ANOVA del modelo de regresin

    BONDAD DEL AJUSTE:

    Descomposicin de la variabilidad

    ( ) ( ) ( )222

    ===

    +=

    n

    ii

    n

    i

    n

    i YYyYyY

    COEFICIENTE DE DETERMINACIN 21

    VE VNE

    R VT VT = = 0

    R2

    1

    = +VT VE VNE

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    15/21

    Estudio de la bondad del ajuste:ANOVA del modelo de regresin2 2 2

    1 1 1

    ( ) ( )N N N

    i i i

    i i i

    y y y y e= = =

    = +

    VT VE VNE

    VT

    VE

    VNE

    2 1VE VNE

    RVT VT

    = =

    La bondad del ajuste viene dada por el coeficiente de determinacin R2 = 0.897.

    Interpretacin: el 89.7% de la variabilidad de la tasa de delitos queda explicada por

    la tasa de desempleo mediante el modelo lineal ajustado

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    16/21

    Contraste de RegresinOBJETIVO: Verificar la existencia de regresin lineal entre X e Y

    FORMULACIN H0: 1 = 0H1: 1 0H0: R2= 0H1: R2 0

    TABLA ANOVA

    Aceptar la hiptesis nula H0 significara que las variables no estnasociadas de forma lineal, esto es, el modelo lineal no es

    adecuado para describir la posible relacin entre X e Y

    FUENTE SUMA DECUADRADOS G.D.L. MEDIACUADRTICA Fexp p-valor

    MODELO VE 1 VE

    RESIDUAL VNE N-2 VNE/(N-2)

    TOTAL VT N-1VNE

    N-2

    VE

    El p-valor es 0.000,menor que 0.05,entonces se rechaza lahiptesis nula y por

    tanto existe relacinlineal entre las variables

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    17/21

    Contraste de la ordenada en el origenOBJETIVO: Verificar si tiene sentido incluir un trmino constante

    en la ecuacin de la recta

    FORMULACIN H0: 0 = 0H1: 0 0

    Aceptar la hiptesis nula H0 significara que la constante se puede

    eliminar del modelo, esto es, es ms adecuado describir la relacin

    de dependencia de Y con X mediante una ecuacin del tipo Y= 1X

    El p-valor=0.071>0.05, entonces se acepta lahiptesis nula y por tanto parececonveniente eliminar la constante del modelo.No obstante el p-valor no es demasiado

    grande.

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    18/21

    EJERCICIO PROPUESTO 1Enunciado: Como resultado de una nueva polticaempresarial, se ha aumentado progresivamente la

    inversin en formacin de los empleados en unamultinacional de software. Se sospecha que esteincremento en inversin ha tenido gran importancia enlos beneficios de la empresa. Se recogen datos

    de euros) y a los beneficios brutos de la empresa (enmillones de euros) en los ltimos diez meses.

    a) Representa el diagrama de dispersinb) Ajustar un modelo lineal y estudiar la bondad del

    ajustec) Comprobar si existe relacin lineal entre lasvariables.d) Utilizando la opcin de regresin curvilnea,realizar un ajuste exponencial. Comparar la

    bondad de este ajuste con la del modelo lineal.Qu modelo es preferible?

    ejregsimple_2.sav

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    19/21

    SOLUCIN

    (b) Ajuste del modelo lineal (coeficientes y bondad del ajuste)

    (a) Diagrama de dispersin

    (c) Contraste de regresin (existencia de relacin lineal entre las variables)

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    20/21

    SOLUCIN(d) Ajuste del modeloexponencial y comparacincon el modelo lineal

  • 7/26/2019 DiapositivasTema2 Regresion Simple

    21/21

    EJERCICIO PROPUESTO 2Enunciado:Se ha realizado un estudio para conocer siexiste relacin lineal entre la renta mensual de una

    familia, en euros y el gasto en actividades de tipocultural, en euros. Los datos aparecen en la tablaadjunta. Se pide:

    a) Representa el diagrama de dispersin. Qumo e o crees conven en e emp ear

    b) Realiza un ajuste lineal, interpreta loscoeficientes de regresin y obtn el gasto enactividades culturales de una familia con una rentamensual disponible de 2500 euros.

    c) Existe relacin lineal? Razona la respuesta.d) A partir del resultado obtenido en el apartado c),qu puedes afirmar ahora sobre la prediccinobtenida en el apartado b)?

    e) Tiene sentido considerar otros modelos?Razona la respuesta