Regresion No Parametrico

Embed Size (px)

Citation preview

  • 8/18/2019 Regresion No Parametrico

    1/9

    1

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    UNIDAD TEMATICA 4: RECTA RESISTENTE

    ANÁLISIS EXPLORATORIO DE DATOS, Y VERSUS X

    Introducción

    Para ajustar una linea recta de la forma y = a + bx a un conjunto de datos (xi; yi); i = 1,…, n, se han

    desarrollado varios métodos a lo laro de la historia! "a reresi#n $or m%nimos cuadrados &ue hemos

    ex$licado es el método m's conocido y m's am$liamente utiliado! s un método &ue involucra

    c'lculos alebraicamente sim$les, y re&uiere *nicamente una derivaci#n matem'tica sencilla! Pero,

    la recta de reresi#n m%nimocuadr'tica no es resistente! n solo dato at%$ico -outlier. $uede tomar 

    f'cilmente el control de la recta ajustada y conducirnos a conclusiones ena/osas sobre la relaci#n

    entre 0 e !

    "a recta resistente de los tres ru$os evita esta dificultad! sta recta es muy *til en el an'lisis

    ex$loratorio de los datos yversusx!

    2el libro cl'sico 3 nderstandin 4obust and x$loratory 2ata 5nalysis. de 6oalin, 7osteller y

    8u9ey , se ex$ondr' el método de los tres ru$os $ara ajustar una recta resistente!

    Rct! r"i"tnt d #o" tr" $ru%o"

    &or'!ción d #o" tr" $ru%o":• 2ado (xi, y i) , i= 1, …, n, se em$iea $or ordenar los valores x de manera &ue x 1  x: …

    xn!

    • sobre estos valores ordenados, se divide los n $untos (xi; yi) en tres ru$os un ru$o

    i&uierdo (o su$erior), un ru$o central y un ru$o derecho (o inferior), del mismo tama/o

    como sea $osible!

    • l n*mero de $untos (xi, y i) en cada uno de los tres ru$os de$ende residuo de la divisi#n de

    n $or

  • 8/18/2019 Regresion No Parametrico

    2/9

    #

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    5hora utiliaremos los $untos centrales (medianas de 0 e ) $ara calcular la $endiente 3b. y la

    ordenada en el orien o nivel o interce$ci#n 3a. de la recta y = a+bx &ue ajusta los valores

    observados y $ermite la $redicci#n de los valores de y i a $artir de los xi observados y cual&uier otro

    valor a$ro$iado de x! n este sentido, la $endiente b nos dice cuantas unidades de y cambian $or una

    unidad de x!

    • >e halla la $endiente b A y el nivel a A de la recta inicial A = a A + bA(x )

    Dond: * . / ) 0 + 1 ) 0 +

      !. / 213 ))) 0 *.) 0 ++ ) 0 *.) 0 +++

    @omo los $untos centrales est'n basados en la mediana, aA y bA son resistentes!

    l ajuste de una recta en términos de $endiente e interce$ci#n (nivel) es convencional! "a

    interce$ci#n, &ue da el valor de y cuando x = A, $uede ser determinada de forma im$recisa,

    es$ecialmente cuando los valores de x est'n todos muy alejados del cero y cuando el cero es un valor 

    sin sentido en el rano de las x! 5justar la recta en términos de $endiente y un valor central de las x,

    como la mediana o , es mucho m's *til! Bosotros escoeremos $or conveniencia, entonces

    la recta inicial es y= a A + bA(x ); esta recta se toma como $unto de $artida $ara ajustar una

    mejor con iteraciones sucesivas!

    A5u"t d #o" r"iduo" itr!cion"

    na ve &ue hemos obtenido la $endiente y el nivel de la rct! inici!# !5u"t!d!, el siuiente $aso escalcular los residuos iniciales $ara cada $unto

    • ri A = yi Ca A+ bA(xi )D

    • "os r'ficos de los residuos son muy *tiles en la evaluaci#n del ajuste y $ara descubrir 

     $atrones de com$ortamiento ines$erados!

    • >i sustituimos los valores oriinales de y $or los residuos, es decir, si utiliamos )6i, ri+ enluar de (xi, yi), i = 1 ,…, n y r%ti'o" # %roc"o d !5u"t, entonces llearemos a un!5u"t cro7Para una l%nea recta esto sinifica &ue, con los $untos (xi; ri); i = 1,…, n como datos,

    obtendremos un! %ndint cro un ni-# cro! n otras $alabras, los residuos nocontienen m's a$ortaci#n a la recta ajustada, entonces el modelo es el adecuado, es decir toda

    la relaci#n lineal contenida en los datos est' contenida en el modelo! na im$ortante

    caracter%stica de los $rocedimientos resistentes es &ue habitualmente re&uieren iteraciones y

    ese es el caso de la recta resistente de los tres ru$os!

    • n concreto, utiliaremos los residuos iniciales ri A = yi Ca A+ bA(xi )D

    i = 1,…, n en luar de los yi y re$etiremos los $asos del $roceso de ajuste! @omo el conjunto

    de las xi no ha cambiado, los tres ru$os y las medianas de las x en los $untos centrales ser'n

    los mismos!

    Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine

    Villai!en!io Ramíre"

  • 8/18/2019 Regresion No Parametrico

    3/9

    $

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    l ajuste a una recta de los residuos obtenidos a $artir de la recta inicial da unos valores 3d.

     $ara la $endiente y 3. $ara el nivel, obteniendo la estimaci#n $ara la recta con $endiente b1= bA + d1 y nivel a1 = aA + 1E @on esta nueva estimaci#n $ara la recta 1 = a 1 + b1(x

     ~

     Xc   ) , se vuelve a calcular los

    residuales $ara ver si su $endiente es ahora $r#xima a cero!E as% continuamos en cada iteraci#n, obteniendo la nueva $endiente b adicionando la

     $endiente de los residuos 3 d. a la $endiente anterior; y el nuevo nivel adicionando el nivel

    de los residuales 3. al nivel anterior, es decir

     b1 = bA +d 1,  b: = b1 + d :,…, bj = b j1 + d  j, ……!!

    a1 = aA + 1, a:= a1 + :, ……, a j = a j1 +  j, ……

    • >i concluida la iésima iteraci#n encontramos &ue al calcular la $endiente de los residuos 3

    dj. es bastante cercana a cero entonces concluimos el aloritmo y habremos lleado al ajuste

    deseado y hallado la recta resistente adecuada!

    • n la $r'ctica se contin*a con las iteraciones hasta &ue el ajuste de la $endiente sea

    suficientemente $e&ue/o en manitud ( del 1F al A!A1F del tama/o de b A)• "as iteraciones son normalmente $ocas y los c'lculos no muy laros!

    • @uando se tiene dos $endientes residuales di1 y d i una con sino $ositivo y la otra con sino

    neativo, sabemos &ue la $endiente correcta est' entre ellas , y se estima la nueva $endiente

    d i+1; y si los residuos de la recta ajustada con $endiente d i+1 tiene $endiente cero, hemos

    lleado al ajuste deseado! la recta final ajustada tendr' $endiente b  j+1 y nivel a  j+1

    E5'%#o70 >e tiene la edad dada en meses y la altura dada en cent%metros de 1G ni/os de una escuela $articular, y se desea $redecir la altura!

    r'fico 1

    110 120 130 140

    edad(meses)_niños

    140.0

    150.0

    160.0

     

    Hbserve el r'fico y comente!

    Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine

    Villai!en!io Ramíre"

  • 8/18/2019 Regresion No Parametrico

    4/9

    %

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    n la siuiente tabla se muestra los datos ( xi,yi) y los residuales r i lueo del ajuste de la recta en cada

    iteraci#n!En la parte inferior de la tabla se muestra los cálculos para obtener la pendiente y el nivel en cada iteración.

    NOTA: en la mayoría de los casos se ha tratado de aproximar a decimales y por ello posiblemente exista problemas de redondeo.

    Niño altura (Y) edad(X) residuo inicial r0 resid. r1 resid.r2

    ! !"#.$ !%& %.#!"" '%."&! '%."()#

    ( !#.* !!" *.&"&$ *.%$&! *.!)#"

    " !"$.* !!) '".%#% '".##$) '".#%%&

    !%.# !!$ %.")&$ '%.(&&" '%.("%%

    ) !"(.# !!& '&.!(%" '&.)$## '&.)!#"

    $ !). !(% ".%*$) (.#%&) (.#)"$

    # !") !(! '#.*%$& '*.!!"" '*.%#))

    * !"" !( '!!.(*$* '!!."*!# '!!."$(*

    & !*.) !($ ".(($# ".(#(# ".(#&%

    !% !*." !(& !.)$* !.*%" !.#&!#

    !! !#.) !"% %.()") %.)*!) %.)$($

    !( !*.* !"" %.%#"$ %.$!"! %.)#)"

    !" !"".( !" '!$.%!&* '!).% '!).)"*

    ! !*.# !") '!.%!"% '%.""() '%."*(&

    !) !)( !"# !."%% (.!(!& (.%)*&

    !$ !)%.$ !"& '!.%*$( '%.!("# '%.!&&"

    !# !$)." !! !(.$(#( !".#"%# !".$()

    !* !&.& !( '".($$! '(.%&(! '(.!*$$

    S&'(CI&):

    Rct! inici!# Yo Y. / 2487.233 .74933) X 0 2;7

  • 8/18/2019 Regresion No Parametrico

    5/9

    *

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    S 'u"tr! #o" Y "t7, r"iduo" d!d corr"%ondint":

    Yest0 ro edad(X) Yest1 r1 edad(X) Yest2 r2 edad(X)

    !"$.*&

    %.#!""!%&

    !"*.%

    '%."&!!%&

    !"#.&"

    '%."()#!%&

    !"*.*$

    *.&"&$!!"

    !"&.#"

    *.%$&!!!"

    !"&.$

    *.!)#"!!"

    !"&.*)

    '".%#%!!)

    !%.)*

    '".##$)!!)

    !%.)%

    '".#%%&!!)

    !%."

    %.")&$!!$

    !!.%%

    '%.(&&"!!$

    !%.&"

    '%.("%%!!$

    !!.*(

    '&.!(%"!!&

    !(.(#

    '&.)$##!!&

    !(.((

    '&.)!#"!!&

    !(."!

    ".%*$)!(%

    !(.$&

    (.#%&)!(%

    !(.$)

    (.#)"$!(%

    !(.*!

    '#.*%$&!(! !".!!

    '*.!!""!(!

    !".%*

    '*.%#))!(!

    !.(&

    '!!.(*$*!(

    !."*

    '!!."*!#!(

    !."$

    '!!."$(*!(

    !).(#

    ".(($#!($

    !).("

    ".(#(#!($

    !).((

    ".(#&%!($

    !$.#)

    !.)$*!(&

    !$.)%

    !.*%"!(&

    !$.)!

    !.#&!#!(&

    !#.()

    %.()")!"%

    !$.&(

    %.)*!)!"%

    !$.&

    %.)$($!"%

    !*.#"

    %.%#"$!""

    !*.!&

    %.$!"!!""

    !*.((

    %.)#)"!""

    !&.((

    '!$.%!&*!"

    !*.$!

    '!).%!"

    !*.$)

    '!).)"*!"

    !&.#!

    '!.%!"%!")

    !&.%"

    '%.""()!")

    !&.%*

    '%."*(&!")

    !)%.#%

    !."%%!"#

    !&.**

    (.!(!&!"#

    !&.&

    (.%)*&!"#

    !)!.$&

    '!.%*$(!"&

    !)%.#(

    '%.!("#!"&

    !)%.*%

    '%.!&&"!"&

    !)(.$

    #

    !(.$(#(

    !!

    !)!.)

    #

    !".#"%#

    !!

    !)!.$

    $

    !".$()

    !!!)".!

    #'".($$!

    !(!)!.&

    &'(.%&(!

    !(!)(.%

    &'(.!*$$

    !(

    Medianas de + , - de los residuales en !ada ru/o:

    +ediana , +ediana - mediana ro mediana r! mediana r(

    superior !"&.!) !!).) %.)"$) '%."$&( '%.(##&

    entro !#.& !(#.) %.!$") %.)" %.)$&%

    inferior !)%.() !"* '!.%&$ '%.((*! '%.(&!!

    Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine

    Villai!en!io Ramíre"

  • 8/18/2019 Regresion No Parametrico

    6/9

    0

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    álculode lapend

    iente/d0 yelnivelointercepto /10enlasrectas

    a2ustadas3r 4x5

    álculo de la nueva pendiente /b0 yel nuevo nivel o intercepto /a0 encada iteración para obtener la rectaresistente.

      b: = b 1 + d :  b

  • 8/18/2019 Regresion No Parametrico

    7/9

    2

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    4esiduos r : versus edad, des$ués del ajuste $or la recta resistente!

    n eneral $odemos decir &ue el r'fico es bastante satisfactorio, los $untos &ue corres$onden a los

    ni/os con los n*meros 23 2; se a$artan mucho y son at%$icos; y los $untos &ue corres$onden a losni/os con los n*meros e observa &ue los dos $untos corres$ondientes a los ni/os 1< y 1I han tenido muy $oco

    efecto en el ajuste de los datos!

    >i ajustamos una recta $or el método de m%nimos cuadrados corre mucho m's rieso de dejarse

    influenciar $or estos $untos!

  • 8/18/2019 Regresion No Parametrico

    8/9

    3

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    110 120 130 140

    edad(meses)_niños

    -10.00000

    0.00000

    10.00000

    Hbservando los r'ficos J y

  • 8/18/2019 Regresion No Parametrico

    9/9

    4

    ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM

    Ia recta de re1resión mínimo cuadrática es: , 6 &).(&" 7 %."* -4 la cual tambi?n se puede expresar como: ,6 !".#"#7%."* 3-'!(#.)5. ue la pendiente está más próxima a la pendiente de la recta , "

    Gráfico !

    135.00000 140.00000 145.00000 150.00000

    Unstandardized Predicted Value

    -10.00000

    -5.00000

    0.00000

    5.00000

    10.00000

     

    Gráfico $

    110.00 120.00 130.00 140.00

    edad_17

    -10.00000

    -5.00000

    0.00000

    5.00000

    10.00000

     

      El 1ráfico $ difiere del 1ráfico 8=or >u?;

    Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine

    Villai!en!io Ramíre"