Upload
rene-calle-huamani
View
214
Download
0
Embed Size (px)
Citation preview
8/18/2019 Regresion No Parametrico
1/9
1
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
UNIDAD TEMATICA 4: RECTA RESISTENTE
ANÁLISIS EXPLORATORIO DE DATOS, Y VERSUS X
Introducción
Para ajustar una linea recta de la forma y = a + bx a un conjunto de datos (xi; yi); i = 1,…, n, se han
desarrollado varios métodos a lo laro de la historia! "a reresi#n $or m%nimos cuadrados &ue hemos
ex$licado es el método m's conocido y m's am$liamente utiliado! s un método &ue involucra
c'lculos alebraicamente sim$les, y re&uiere *nicamente una derivaci#n matem'tica sencilla! Pero,
la recta de reresi#n m%nimocuadr'tica no es resistente! n solo dato at%$ico -outlier. $uede tomar
f'cilmente el control de la recta ajustada y conducirnos a conclusiones ena/osas sobre la relaci#n
entre 0 e !
"a recta resistente de los tres ru$os evita esta dificultad! sta recta es muy *til en el an'lisis
ex$loratorio de los datos yversusx!
2el libro cl'sico 3 nderstandin 4obust and x$loratory 2ata 5nalysis. de 6oalin, 7osteller y
8u9ey , se ex$ondr' el método de los tres ru$os $ara ajustar una recta resistente!
Rct! r"i"tnt d #o" tr" $ru%o"
&or'!ción d #o" tr" $ru%o":• 2ado (xi, y i) , i= 1, …, n, se em$iea $or ordenar los valores x de manera &ue x 1 x: …
xn!
• sobre estos valores ordenados, se divide los n $untos (xi; yi) en tres ru$os un ru$o
i&uierdo (o su$erior), un ru$o central y un ru$o derecho (o inferior), del mismo tama/o
como sea $osible!
• l n*mero de $untos (xi, y i) en cada uno de los tres ru$os de$ende residuo de la divisi#n de
n $or
8/18/2019 Regresion No Parametrico
2/9
#
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
5hora utiliaremos los $untos centrales (medianas de 0 e ) $ara calcular la $endiente 3b. y la
ordenada en el orien o nivel o interce$ci#n 3a. de la recta y = a+bx &ue ajusta los valores
observados y $ermite la $redicci#n de los valores de y i a $artir de los xi observados y cual&uier otro
valor a$ro$iado de x! n este sentido, la $endiente b nos dice cuantas unidades de y cambian $or una
unidad de x!
• >e halla la $endiente b A y el nivel a A de la recta inicial A = a A + bA(x )
Dond: * . / ) 0 + 1 ) 0 +
!. / 213 ))) 0 *.) 0 ++ ) 0 *.) 0 +++
@omo los $untos centrales est'n basados en la mediana, aA y bA son resistentes!
l ajuste de una recta en términos de $endiente e interce$ci#n (nivel) es convencional! "a
interce$ci#n, &ue da el valor de y cuando x = A, $uede ser determinada de forma im$recisa,
es$ecialmente cuando los valores de x est'n todos muy alejados del cero y cuando el cero es un valor
sin sentido en el rano de las x! 5justar la recta en términos de $endiente y un valor central de las x,
como la mediana o , es mucho m's *til! Bosotros escoeremos $or conveniencia, entonces
la recta inicial es y= a A + bA(x ); esta recta se toma como $unto de $artida $ara ajustar una
mejor con iteraciones sucesivas!
A5u"t d #o" r"iduo" itr!cion"
na ve &ue hemos obtenido la $endiente y el nivel de la rct! inici!# !5u"t!d!, el siuiente $aso escalcular los residuos iniciales $ara cada $unto
• ri A = yi Ca A+ bA(xi )D
• "os r'ficos de los residuos son muy *tiles en la evaluaci#n del ajuste y $ara descubrir
$atrones de com$ortamiento ines$erados!
• >i sustituimos los valores oriinales de y $or los residuos, es decir, si utiliamos )6i, ri+ enluar de (xi, yi), i = 1 ,…, n y r%ti'o" # %roc"o d !5u"t, entonces llearemos a un!5u"t cro7Para una l%nea recta esto sinifica &ue, con los $untos (xi; ri); i = 1,…, n como datos,
obtendremos un! %ndint cro un ni-# cro! n otras $alabras, los residuos nocontienen m's a$ortaci#n a la recta ajustada, entonces el modelo es el adecuado, es decir toda
la relaci#n lineal contenida en los datos est' contenida en el modelo! na im$ortante
caracter%stica de los $rocedimientos resistentes es &ue habitualmente re&uieren iteraciones y
ese es el caso de la recta resistente de los tres ru$os!
• n concreto, utiliaremos los residuos iniciales ri A = yi Ca A+ bA(xi )D
i = 1,…, n en luar de los yi y re$etiremos los $asos del $roceso de ajuste! @omo el conjunto
de las xi no ha cambiado, los tres ru$os y las medianas de las x en los $untos centrales ser'n
los mismos!
Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine
Villai!en!io Ramíre"
8/18/2019 Regresion No Parametrico
3/9
$
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
l ajuste a una recta de los residuos obtenidos a $artir de la recta inicial da unos valores 3d.
$ara la $endiente y 3. $ara el nivel, obteniendo la estimaci#n $ara la recta con $endiente b1= bA + d1 y nivel a1 = aA + 1E @on esta nueva estimaci#n $ara la recta 1 = a 1 + b1(x
~
Xc ) , se vuelve a calcular los
residuales $ara ver si su $endiente es ahora $r#xima a cero!E as% continuamos en cada iteraci#n, obteniendo la nueva $endiente b adicionando la
$endiente de los residuos 3 d. a la $endiente anterior; y el nuevo nivel adicionando el nivel
de los residuales 3. al nivel anterior, es decir
b1 = bA +d 1, b: = b1 + d :,…, bj = b j1 + d j, ……!!
a1 = aA + 1, a:= a1 + :, ……, a j = a j1 + j, ……
• >i concluida la iésima iteraci#n encontramos &ue al calcular la $endiente de los residuos 3
dj. es bastante cercana a cero entonces concluimos el aloritmo y habremos lleado al ajuste
deseado y hallado la recta resistente adecuada!
• n la $r'ctica se contin*a con las iteraciones hasta &ue el ajuste de la $endiente sea
suficientemente $e&ue/o en manitud ( del 1F al A!A1F del tama/o de b A)• "as iteraciones son normalmente $ocas y los c'lculos no muy laros!
• @uando se tiene dos $endientes residuales di1 y d i una con sino $ositivo y la otra con sino
neativo, sabemos &ue la $endiente correcta est' entre ellas , y se estima la nueva $endiente
d i+1; y si los residuos de la recta ajustada con $endiente d i+1 tiene $endiente cero, hemos
lleado al ajuste deseado! la recta final ajustada tendr' $endiente b j+1 y nivel a j+1
E5'%#o70 >e tiene la edad dada en meses y la altura dada en cent%metros de 1G ni/os de una escuela $articular, y se desea $redecir la altura!
r'fico 1
110 120 130 140
edad(meses)_niños
140.0
150.0
160.0
Hbserve el r'fico y comente!
Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine
Villai!en!io Ramíre"
8/18/2019 Regresion No Parametrico
4/9
%
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
n la siuiente tabla se muestra los datos ( xi,yi) y los residuales r i lueo del ajuste de la recta en cada
iteraci#n!En la parte inferior de la tabla se muestra los cálculos para obtener la pendiente y el nivel en cada iteración.
NOTA: en la mayoría de los casos se ha tratado de aproximar a decimales y por ello posiblemente exista problemas de redondeo.
Niño altura (Y) edad(X) residuo inicial r0 resid. r1 resid.r2
! !"#.$ !%& %.#!"" '%."&! '%."()#
( !#.* !!" *.&"&$ *.%$&! *.!)#"
" !"$.* !!) '".%#% '".##$) '".#%%&
!%.# !!$ %.")&$ '%.(&&" '%.("%%
) !"(.# !!& '&.!(%" '&.)$## '&.)!#"
$ !). !(% ".%*$) (.#%&) (.#)"$
# !") !(! '#.*%$& '*.!!"" '*.%#))
* !"" !( '!!.(*$* '!!."*!# '!!."$(*
& !*.) !($ ".(($# ".(#(# ".(#&%
!% !*." !(& !.)$* !.*%" !.#&!#
!! !#.) !"% %.()") %.)*!) %.)$($
!( !*.* !"" %.%#"$ %.$!"! %.)#)"
!" !"".( !" '!$.%!&* '!).% '!).)"*
! !*.# !") '!.%!"% '%.""() '%."*(&
!) !)( !"# !."%% (.!(!& (.%)*&
!$ !)%.$ !"& '!.%*$( '%.!("# '%.!&&"
!# !$)." !! !(.$(#( !".#"%# !".$()
!* !&.& !( '".($$! '(.%&(! '(.!*$$
S&'(CI&):
Rct! inici!# Yo Y. / 2487.233 .74933) X 0 2;7
8/18/2019 Regresion No Parametrico
5/9
*
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
S 'u"tr! #o" Y "t7, r"iduo" d!d corr"%ondint":
Yest0 ro edad(X) Yest1 r1 edad(X) Yest2 r2 edad(X)
!"$.*&
%.#!""!%&
!"*.%
'%."&!!%&
!"#.&"
'%."()#!%&
!"*.*$
*.&"&$!!"
!"&.#"
*.%$&!!!"
!"&.$
*.!)#"!!"
!"&.*)
'".%#%!!)
!%.)*
'".##$)!!)
!%.)%
'".#%%&!!)
!%."
%.")&$!!$
!!.%%
'%.(&&"!!$
!%.&"
'%.("%%!!$
!!.*(
'&.!(%"!!&
!(.(#
'&.)$##!!&
!(.((
'&.)!#"!!&
!(."!
".%*$)!(%
!(.$&
(.#%&)!(%
!(.$)
(.#)"$!(%
!(.*!
'#.*%$&!(! !".!!
'*.!!""!(!
!".%*
'*.%#))!(!
!.(&
'!!.(*$*!(
!."*
'!!."*!#!(
!."$
'!!."$(*!(
!).(#
".(($#!($
!).("
".(#(#!($
!).((
".(#&%!($
!$.#)
!.)$*!(&
!$.)%
!.*%"!(&
!$.)!
!.#&!#!(&
!#.()
%.()")!"%
!$.&(
%.)*!)!"%
!$.&
%.)$($!"%
!*.#"
%.%#"$!""
!*.!&
%.$!"!!""
!*.((
%.)#)"!""
!&.((
'!$.%!&*!"
!*.$!
'!).%!"
!*.$)
'!).)"*!"
!&.#!
'!.%!"%!")
!&.%"
'%.""()!")
!&.%*
'%."*(&!")
!)%.#%
!."%%!"#
!&.**
(.!(!&!"#
!&.&
(.%)*&!"#
!)!.$&
'!.%*$(!"&
!)%.#(
'%.!("#!"&
!)%.*%
'%.!&&"!"&
!)(.$
#
!(.$(#(
!!
!)!.)
#
!".#"%#
!!
!)!.$
$
!".$()
!!!)".!
#'".($$!
!(!)!.&
&'(.%&(!
!(!)(.%
&'(.!*$$
!(
Medianas de + , - de los residuales en !ada ru/o:
+ediana , +ediana - mediana ro mediana r! mediana r(
superior !"&.!) !!).) %.)"$) '%."$&( '%.(##&
entro !#.& !(#.) %.!$") %.)" %.)$&%
inferior !)%.() !"* '!.%&$ '%.((*! '%.(&!!
Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine
Villai!en!io Ramíre"
8/18/2019 Regresion No Parametrico
6/9
0
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
álculode lapend
iente/d0 yelnivelointercepto /10enlasrectas
a2ustadas3r 4x5
álculo de la nueva pendiente /b0 yel nuevo nivel o intercepto /a0 encada iteración para obtener la rectaresistente.
b: = b 1 + d : b
8/18/2019 Regresion No Parametrico
7/9
2
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
4esiduos r : versus edad, des$ués del ajuste $or la recta resistente!
n eneral $odemos decir &ue el r'fico es bastante satisfactorio, los $untos &ue corres$onden a los
ni/os con los n*meros 23 2; se a$artan mucho y son at%$icos; y los $untos &ue corres$onden a losni/os con los n*meros e observa &ue los dos $untos corres$ondientes a los ni/os 1< y 1I han tenido muy $oco
efecto en el ajuste de los datos!
>i ajustamos una recta $or el método de m%nimos cuadrados corre mucho m's rieso de dejarse
influenciar $or estos $untos!
8/18/2019 Regresion No Parametrico
8/9
3
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
110 120 130 140
edad(meses)_niños
-10.00000
0.00000
10.00000
Hbservando los r'ficos J y
8/18/2019 Regresion No Parametrico
9/9
4
ESTADISTICA II SEMESTRE - EAPE-FCM.UNNMSM
Ia recta de re1resión mínimo cuadrática es: , 6 &).(&" 7 %."* -4 la cual tambi?n se puede expresar como: ,6 !".#"#7%."* 3-'!(#.)5. ue la pendiente está más próxima a la pendiente de la recta , "
Gráfico !
135.00000 140.00000 145.00000 150.00000
Unstandardized Predicted Value
-10.00000
-5.00000
0.00000
5.00000
10.00000
Gráfico $
110.00 120.00 130.00 140.00
edad_17
-10.00000
-5.00000
0.00000
5.00000
10.00000
El 1ráfico $ difiere del 1ráfico 8=or >u?;
Profesoras.: Ana María Cárdenas Rojas, Justa Caridad Huaroto Sumari, Ilse Janine
Villai!en!io Ramíre"