Capitulo 9 Interpretaciones Geometricas

Embed Size (px)

Citation preview

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    1/20

    Captulo 9 INTERPRETACIONES

    GEOMTRICAS

    9.1. INTRODUCCIN.

    En este captulo se presenta el tema del lgebra Lineal que mayor contribucintiene en el Anlisis de Datos Multivariante como lo son las InterpretacionesGeomtricas. Se exponen sus principales tpicos asociados como lo son laRepresentacin Grfica de los Vectores Filas y Columnas de una Matriz de

    Datos, ngulo entre 2 vectores y Rectas y Planos en

    n

    , y los Subespacios deMejor Ajuste Mnimo Cuadrtico, herramienta que justamente es la quepermite la reduccin de datos.

    9.2. REPRESENTACIN GRFICA DE LOS VECTORES FILAS YVECTORES COLUMNAS DE UNA MATRIZ DE DATOS.

    Sea XMnxp() una matriz de datos. Dicha matriz tiene n vectores filas quepuede representarse grficamente como puntos en p; estos puntos representana los elementos. Igualmente tiene p vectores columnas que puedenrepresentarse grficamente como puntos en n; estos puntos representan a lasvariables. Si p = 1, 2, 3 es posible representar grficamente a los elementos

    pero si p 4 esto resulta imposible. De la misma forma, si n = 1, 2, 3 esposible representar grficamente a las variables pero si n 4 esto resultaimposible. De all que es ms factible representar grficamente a los elementosde una matriz de datos que a las variables siempre y cuando se midan a losumo 3 variables.

    Ejemplo Aplicado 9.1.

    Consideremos la matriz de datos cuyas columnas son las 2 primeras columnasde la matriz de datos del ejemplo aplicado 1.3.:

    =

    0913

    1012

    1315

    1917

    1408

    12101112

    X

    En este caso se pueden representar grficamente los 7 vectores filas(elementos) sobre 2 (Figura 9.1.).

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    315

    Figura 9.1.

    El grfico obtenido es un grfico de dispersin. A primera vista se observan 3

    grupos de elementos: {C, B}, {A, F, G} y {E, D}. Sin embargo, no se disponede mayor informacin para caracterizar esos grupos. Para ello, consideremos lamatriz de datos centrada:

    =

    57,357,0

    57,243,0

    43,057,2

    43,657,4

    43,143,4

    57,043,2

    57,143,0

    X

    La representacin grfica de los 7 vectores filas (elementos) sobre 2 se puedeapreciar en la figura 9.2.:

    Figura 9.2.

    En este caso el punto (0,0) representa el punto de medias de las 2 columnas de

    X , de manera que los 4 cuadrantes del grfico anterior tienen caractersticasparticulares:

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    2/20

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    3/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    318

    Igualando (1) y (2) se tiene que:

    )(CosYX2YXYX2YX22t22 +=+

    YX2)(CosYX2 t= YX)(CosYX t=

    YX

    YX)(Cos

    t

    =

    Teorema 9.2.

    Sea XMnxp() una matriz de datos. Entonces el coseno del ngulo entre los

    vectores hX y jX es:

    hjr)(Cos =

    Siendo rhj el coeficiente de correlacin lineal de Pearson entre las variablesh-sima y j-sima.

    Demostracin

    1. = =

    ===n

    1i

    n

    1ihjjijhihijih

    jth nS)XX)(XX(XXX)X(

    2. h2hn

    1i

    2hih

    n

    1i

    2ih

    hthh

    SnnS)XX()X(X)X(X ===== ==

    3. j2jn1i

    2jij

    n

    1i

    2ij

    jtjj SnnS)XX()X(X)X(X ===== ==

    Luego,

    hjjh

    hj

    jh

    hj rSS

    S

    SnSn

    nS)(Cos ===

    Es decir, el coseno del ngulo entre los vectores hX y jX coincide con elcoeficiente de correlacin lineal de Pearson entre las variables h-sima y

    j-sima.

    Definicin 9.1.

    Sean X, Yn tales que X Y. Se define como recta que pasa por X e Y, y sedenota por LYX al conjunto:

    LYX = {Zn: Z = Y + c(X Y); c}

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    319

    El vector (X Y) se dice que es el vector director de la recta LYX. Si Y = nx1entonces la recta LX es una recta en n que pasa por el origen nx1. La figura9.4., muestra una recta LX en

    3.

    Figura 9.4.

    Ejemplo 9.1.

    Sean X, Y3 los vectores:

    X =

    2

    2

    1

    , Y =

    3

    0

    1

    En este caso,

    X Y =

    5

    2

    2

    Luego,

    LYX = {Z3: Z =

    3

    0

    1

    + c

    5

    2

    2

    ; c}

    Ejemplo 9.2.

    Sea X3 el vector:

    X =

    3

    2

    1

    LX

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    4/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    320

    La recta que pasa por el origen 3x1 y el vector X es:

    LX = {Z3: Z = c

    3

    2

    1

    ; c}

    Teorema 9.3.

    Sea Xn. Entonces la Recta LX es un subespacio de n.

    Demostracin

    Por definicin:

    LX = {Zn: Z = cX; c}

    Veamos que LX es un subespacio de n.

    1. Es claro que si c = 0 entonces Z = 0X = nx1. Luego, nx1LX.2. Sean Z1, Z2LX. Luego, existen c1, c2 tales que Z1 = c1X y

    Z2 = c2X. Luego, dZ1 + Z2 = d(c1X) + c2X, es decir,

    dZ1 + Z2 = (dc1 + c2)X; d. Por lo tanto, (dZ1 + Z2)LX.

    Por consiguiente, LX es un subespacio de n.

    Teorema 9.4.

    Sean X, Yn. Entonces la Proyeccin Ortogonal de Y sobre la Recta LX es:

    ( )XoyPr YLYL XX =

    Siendo ( )XX

    XYt

    tYL X

    =

    la componente de proyeccin.

    Demostracin

    Por el teorema 9.3., LX es un subespacio de n. Es claro que V = n es un

    espacio eucldeo con el producto interno usual YXY,X t=>< , X, Yn.

    Por definicin de proyeccin ortogonal (definicin 5.6.):

    YWoyPr =

    =

    >

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    5/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    322

    = (Yt ( XXX

    XYt

    t

    )t)(Y XXX

    XYt

    t

    )

    = (Yt tt

    t

    X)XX

    XY( )(Y X

    XX

    XYt

    t

    )

    = YtY Yt X)XXXY(

    t

    t YX)

    XXXY( t

    t

    t+ t

    t

    tX)

    XXXY( X

    XXXY

    t

    t

    = YtY XY)XX

    XY( t

    t

    t

    XY)XX

    XY( t

    t

    t

    + XX)XX

    XY)

    XX

    XY( t

    t

    t

    t

    t

    = YtY 2 XY)XX

    XY( t

    t

    t

    + XY)XX

    XY( t

    t

    t

    = YtY XY)XX

    XY( t

    t

    t

    = Yt

    Y )XX

    XX

    (XY)XX

    XY

    ( t

    tt

    t

    t

    = YtY XX)XX

    XY( t2

    t

    t

    = YtY XX)( t2YL X

    2. d2( YL XoyPr , nx1) = || YL XoyPr ||2 = ( YL XoyPr )t YL XoyPr = ( )( ) ( )XX YL

    tYL XX

    = ( ) XX t2YL X

    Ejemplo 9.3.

    Consideremos la recta LX del ejemplo 9.2.:

    LX = {Z3: Z = c

    3

    2

    1

    ; c}

    Calculemos la proyeccin ortogonal del vector Y =

    1

    2

    3

    sobre la recta LX:

    X)(oyPr YLYL XX

    =

    La componente de proyeccin es:

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    323

    [ ]

    [ ]

    14

    2

    3

    2

    1

    321

    3

    2

    1

    123

    XX

    XY)(

    t

    tYL X

    =

    ==

    Luego,

    =

    ==

    73

    72

    71

    3

    2

    1

    14

    2X)(oyPr YL

    YL XX

    Adems,

    d2(Y, LX) = YtY XX)( t2YL X

    = [ ] [ ]

    3

    2

    1

    32114

    2

    1

    2

    3

    1232

    = 14196

    414

    =7214

    =7

    96

    Finalmente,

    7

    214.

    14

    2XX)(),oy(Prd

    2t2Y

    L1x3YL

    2XX

    =

    ==

    Definicin 9.2.

    Sean X0, X1, X2, , Xpn vectores L.I. Se define como plano de dimensin

    p+1 en n generado por los vectores X0, X1, X2, , Xp y se denota por n 1pP + al

    conjunto:

    =

    + =+==p

    1jj

    jj

    0nn1p p}...,2,,1j,B;XBXZ:Z{P

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    6/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    324

    Si X0 = nx1 entonces se dice que el plano pasa por el origen, es generado por

    los vectores L.I. X1, X2, , Xp y se denota por npP . Es claro que si Zn

    1pP +

    entonces Z es combinacin lineal de los vectores X0, X1, X2, , Xp.

    Por otro lado,

    Si Z n 1pP + entonces =

    +=p

    1j

    jj

    0 XBXZ , es decir:

    [ ]

    =

    p

    2

    1p210

    B

    B

    B

    1

    XXXXZ

    M

    L = XB

    Siendo XMnx(p+1)() = [X0 X1 X2 . Xp] y Bp+1 =

    p

    2

    1

    B

    B

    B

    1

    M

    De modo que:

    }B),(MX;XBZ:Z{P 1p1)nx(pnn 1p +++ ==

    En particular, si p = 1 entonces:

    10XX11

    10nn

    11 L}B;XBXZ:Z{P =+==+

    Si adems X0 = nx1 entonces:

    }B),(MX;XBZ:Z{P pnxpnn

    p ==

    Para p = 1 entonces:

    1X11

    1nn

    1 L}B;XBZ:Z{P ===

    En la figura 9.6., se puede apreciar un plano 3pP .

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    325

    Figura 9.6.

    Ejemplo 9.4.

    Sean X1, X23 los vectores:

    X1 =

    2

    2

    1

    , X2 =

    3

    0

    1

    El plano de dimensin 2 en 3 que pasa por el origen y es generado por los

    vectores X1

    y X2

    es:

    }B;XBZ:Z{}B,B;

    3

    0

    1

    B

    2

    2

    1

    BZ:Z{P 23212133

    2 ==

    +

    ==

    Siendo:

    =

    32

    02

    11

    X y

    =

    2

    1

    B

    BB

    Teorema 9.5.

    Sean X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I. Entonces

    el plano npP que pasa por el origen y es generado por los vectores

    X1, X2, , Xp es un subespacio de n.

    Demostracin

    Por definicin:

    3pP

    X1X2

    Xp

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    7/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    326

    =

    ===p

    1jj

    jj

    nnp p}...,2,,1j,B;XBZ:Z{P

    Veamos que npP es un subespacio de n.

    1. Es claro que si B1 = B2 = = Bp = 0 entonces Z = nx1. Luego,nx1

    npP .

    2. Sean Z1, Z2 npP . Luego, existen Bij; i = 1, 2; j = 1, 2, , p talesque

    =

    =p

    1j

    jj1

    1 XBZ y =

    =p

    1j

    jj2

    2 XBZ . Luego,

    dZ1 + Z2 = ==

    +p

    1j

    jj2

    p

    1j

    jj1 XBXBd , es decir,

    dZ1 + Z2 = =

    +p

    1j

    jj2j1 X)BdB( ; d. Por lo tanto, (dZ

    1 + Z2) npP .

    Por consiguiente, npP es un subespacio de n.

    Teorema 9.6.

    Sean Y, X1, X2, , Xpn tales que los vectores X1, X2, , Xp son L.I.

    Entonces la Proyeccin Ortogonal de Y sobre el plano npP generado por los

    vectores X1, X2, , Xp es:

    HYoyPr YPnp

    =

    Siendo:

    1. X = [ p21 XXX L ]2. t1t X)XX(XH = . Esta matriz se denomina Matriz de Proyeccin.

    Demostracin

    Por el teorema 9.5., npP es un subespacio de n. Es claro que V = n es un

    espacio eucldeo con el producto interno usual YXY,X t=>< , X, Yn.Por definicin de proyeccin ortogonal (definicin 5.6.):

    YWoyPr =

    =

    ><

    ====

    Luego,

    Y

    PnpoyPr =

    = =

    p

    1j

    p

    1i

    ijij ))XC(D(

    YPnpoyPr = = =p

    1j

    p

    1i

    ijij XCD

    YPnp

    oyPr = = =

    p

    1i

    p

    1j

    ijij XCD

    YPnp

    oyPr = [ p21 XXX L ]

    =

    =

    =

    p

    1jjpj

    p

    1j2jj

    p

    1j1jj

    CD

    CD

    CD

    M

    YPnp

    oyPr = [ p21 XXX L ]

    p

    2

    1

    ppp2p1

    2p2212

    1p2111

    D

    D

    D

    CCC

    CCC

    CCC

    M

    L

    MMM

    L

    L

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    8/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    328

    YPnp

    oyPr = [ p21 XXX L ]

    =

    =

    =

    p

    1i

    tipi

    p

    1i

    tii2

    p

    1i

    tii1

    ppp2p1

    2p2212

    1p2111

    Y)X(C

    Y)X(C

    Y)X(C

    CCC

    CCC

    CCC

    ML

    MMM

    L

    L

    YPnp

    oyPr = [ p21 XXX L ] Y

    )X(C

    )X(C

    )X(C

    CCC

    CCC

    CCC

    p

    1i

    tipi

    p

    1i

    tii2

    p

    1i

    tii1

    ppp2p1

    2p2212

    1p2111

    =

    =

    =

    ML

    MMM

    L

    L

    YPnp

    oyPr =

    [ p21 XXX L ] Y

    )X(

    )X(

    )X(

    CCC

    CCC

    CCC

    CCC

    CCC

    CCC

    tp

    t2

    t1

    pp2p1p

    p22221

    p11211

    ppp2p1

    2p2212

    1p2111

    M

    L

    MMM

    L

    L

    L

    MMM

    L

    L

    YPnp

    oyPr = [ p21 XXX L ]

    Y)X(

    )X(

    )X(

    CCCCC

    CCCCC

    CCCCC

    tp

    t2

    t1

    p

    1r

    2rp

    p

    1r2rrp

    p

    1r1rrp

    p

    1r

    rp2r

    p

    1r

    22r

    p

    1r

    1r2r

    p

    1rrp1r

    p

    1r2r1r

    p

    1r

    21r

    ===

    ===

    ===

    M

    L

    MMM

    L

    L

    YPnp

    oyPr = XCXtY; siendo:

    =

    ===

    ===

    ===

    p

    1r

    2rp

    p

    1r2rrp

    p

    1r1rrp

    p

    1rrp2r

    p

    1r

    2

    2r

    p

    1r1r2r

    p

    1rrp1r

    p

    1r2r1r

    p

    1r

    21r

    CCCCC

    CCCCC

    CCCCC

    C

    L

    MMM

    L

    L

    una matriz de orden pxp

    Por otra parte,

    np

    Y

    PPoyPr n

    p (Y Y

    PnpoyPr ) npP

    (Y YPnp

    oyPr ) Xj; j = 1, 2, , p (Ver figura 9.7. en 3)

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    329

    Figura 9.7.

    Luego,

    (Y YPnp

    oyPr )tXj = 0

    (Y YPnp

    oyPr )tXj = 0

    YtXj ( YPnp

    oyPr )tXj = 0

    YtXj = ( YPnp

    oyPr )tXj

    Por lo tanto,

    [ pt2t1t XYXYXY L ] = [ ptYP

    2tYP

    1tYP

    X)oy(PrX)oy(PrX)oy(Pr np

    np

    np

    L ]

    Yt[ p21 XXX L ] = tYP

    )oy(Pr np

    [ p21 XXX L ]

    YtX = tYP

    )oy(Pr np

    X

    (YtX)t = ( tYP

    )oy(Pr np

    X)t

    XtY = Xt YPnp

    oyPr

    XtY = XtXCXtY

    Como X tiene sus p columnas L.I. entonces Rango(X) = p. En consecuencia,por el teorema 8.10., la matriz XtX es definida positiva y por lo tanto nosingular. Luego,

    (XtX)-1XtY = CXtY ((XtX)-1 C)XtY = px1

    Como XtY px1 entonces (XtX)-1 C = pxp. Por consiguiente, C = (X

    tX)-1. Deesta forma:

    3pP

    X1 X2

    XpYP3p

    oyPr

    )oyPrY( YP3p

    Y

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    9/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    330

    Y

    PnpoyPr = XCXtY = X(XtX)-1XtY = HY

    Observaciones:

    1. Por el teorema 5.11., d2(Y, npP ) = d2(Y, YPnpoyPr ), es decir:d2(Y, npP ) = d

    2(Y, HY)

    = (Y HY)t(Y HY)= ((In H)Y)

    t(In H)Y= Yt(In H)

    t(In H)Y= YtQtQY

    Siendo Q = In H. Las matrices Q y H son simtricas eidempotentes (ver Ejercicio 23, Captulo 1).

    Por lo tanto:

    d2(Y, npP ) = YtQY

    Es decir, el cuadrado de la distancia de un vector Y al plano npP es

    una forma cuadrtica con matriz simtrica asociada Q, la cual porser simtrica e idempotente de orden nxn y de rango n p essemidefinida positiva.

    En particular, si los p vectores columnas que generan el planonpP

    forman una base ortonormal de n entonces ( ) 1XX jtj = , j = 1, 2, , p y XtX = Ip. Luego, Q = In H = In XXt y

    ( )jt

    jtj

    jtY

    L XYXX

    XYjX

    ==

    . En consecuencia:

    d2(Y, npP ) = YtQY = Yt(In XX

    t)Y

    = YtY YtXXtY

    = Y)X(XYYY

    n

    1i

    tii

    tt

    =

    = Y)X(XYYYn

    1j

    tjjtt =

    = =

    n

    1j

    tjjtt Y)X(XYYY

    = )Y)X)((XY(YYn

    1j

    tjjtt =

    = )XY)(XY(YY

    n

    1j

    jtjtt

    =

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    331

    = =

    n

    1j

    2jtt )XY(YY

    = =

    n

    1j

    2Y

    Lt

    jXYY

    2. d2( YPnp

    oyPr , nx1) = (Y

    PnpoyPr )t Y

    PnpoyPr = (HY)t(HY) = YtHtHY =

    YtHY. Es decir, el cuadrado de la longitud de la proyeccin

    ortogonal de Y sobre el plano npP es una forma cuadrtica con

    matriz simtrica asociada H, la cual por ser simtrica e idempotentede orden nxn y de rango p es semidefinida positiva.

    3. Si los vectores X1, X2, , Xp forman una base ortonormal de nentonces XtX = Ip. Luego, H = XX

    t y Q = Ip XXt. En

    consecuencia:

    3.1. YPnp

    oyPr = HY = XXtY.

    3.2. d2(Y, npP ) = Yt(Ip XXt)Y.3.3. d2( Y

    PnpoyPr , nx1) = Y

    tXXtY.

    Ejemplo 9.5.

    Consideremos el plano 32P del ejemplo 9.3.:

    }B,B;

    3

    0

    1

    B

    2

    2

    1

    BZ:Z{P 212133

    2

    +

    ==

    Calculemos la proyeccin ortogonal del vector Y =

    1

    2

    3

    sobre el plano 32P :

    En este caso,

    =

    32

    02

    11

    X

    Luego,

    =

    =

    107

    79

    32

    02

    11

    301

    221XX t

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    10/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    332

    Se puede determinar que:

    =

    419

    417

    417

    4110

    )XX( 1t

    La matriz de proyeccin es:

    t1t X)XX(XH =

    =

    =

    4137

    41241

    1241

    241

    40416

    4112

    416

    415

    301

    221

    419

    417

    417

    4110

    32

    02

    11

    H

    Por lo tanto,

    =

    ==

    4177

    4164

    4115

    1

    2

    3

    4137

    41241

    1241

    241

    40416

    4112

    416

    415

    HYowPr YP32

    Por otra parte,

    =

    ==

    41441

    241

    12412411416

    4112

    41641

    36

    4137

    412

    4112

    4124140416

    4112

    416

    415

    100010

    001

    HIQ 3

    En consecuencia,

    d2(Y, 32P ) = [ ]123

    41441

    241

    1241

    241

    1416

    4112

    41641

    36

    1

    2

    3

    =41

    324

    Finalmente,

    d2( YP32

    oyPr , 3x1) = YtHY = [ ]41

    250

    4177

    4164

    4115

    123 =

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    333

    9.4. SUBESPACIOS DE MEJOR AJUSTE MNIMO CUADRTICO.

    Definicin 9.3.

    Sea XMnxp() tal que Rango(X) = p. Se define como subespacio de mejor

    ajuste mnimo cuadrtico de dimensin q (q < p) al conjunto de vectores filasde X y se denota por q)X(SMA al plano generado por vectores ortonormales

    V1, V2, , Vq que verifica que =

    n

    1iqi

    2 ))X(SMA,X(d es mnima.

    Observaciones:

    1. Como )oyPr,X(d))X(SMA,X(d iq

    X)X(SMAi

    2qi

    2 = entonces el

    subespacio de mejor ajuste mnimo cuadrtico q)X(SMA es aquel

    que verifica que =

    n

    1i

    X)X(SMAi

    2 )oyPr,X(d iq

    es mnima.

    2. Si X es una matriz de datos entonces independientemente del valorde p es posible representar los vectores filas (elementos) de X sobreun plano de dimensin q (q = 1, 2, 3).

    Teorema 9.7.

    Sea XMnxp() tal que Rango(X) = p. Entonces se cumple que:

    1)X(SMA = 1VL

    Siendo V1 el autovector normalizado de la matriz XtX asociado con su mayorautovalor.

    Demostracin

    Por definicin, el subespacio de mejor ajuste mnimo cuadrtico 1)X(SMA es

    el plano de dimensin 1 generado por un vector normalizado V1 con la

    condicin (V1)tV1 = 1 que verifica que

    =n

    1i 1i

    2 ))X(SMA,X(d es mnima. Es

    claro que SMA(X)1 es la recta 1VL (ver figura 9.8., en 3).

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    11/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    334

    Figura 9.8.

    Ahora bien,

    )oyPr,X(d)L,X(d))X(SMA,X(d i1V

    1X

    Li2

    Vi2

    1i2

    ==

    Por la observacin 1 del teorema 9.4.:

    ( ) 1t12

    XLi

    ti

    XLi

    2 VVX)X()oyPr,X(d i1V

    i

    1V

    =

    Pero ( ) 1VV 1t1 = . Luego,

    2X

    Lit

    iX

    Li2 i

    1V

    i

    1VX)X()oyPr,X(d

    =

    =

    n

    1i

    XLi

    2 )oyPr,X(d i1V

    = =

    n

    1ii

    ti X)X(

    =

    n

    1i

    2XL

    i

    1V

    El trmino =

    n

    1ii

    ti X)X( es constante. Por lo tanto, minimizar

    =

    n

    1i

    XLi

    2 )oyPr,X(d i1V

    equivale a maximizar

    =

    n

    1i

    2XL

    i

    1V

    , expresin que puede

    escribirse de la siguiente manera:

    =

    n

    1i

    2XL

    i

    1V=

    ( )=

    n

    1i

    2

    t1

    1ti

    V)V(

    VX

    = ( )( )=

    n

    1i

    21ti VX

    = ( )( ) ( )( )=

    n

    1i

    1ti

    1ti VXVX

    1

    1V

    XLoyPr

    1V

    L

    X1 )L,X(d 1V1

    X22

    1V

    XLoyPr

    Xnn

    1V

    XLoyPr

    )L,X(d 1V2

    )L,X(d 1Vn

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    335

    = ( ) ( )( )=

    n

    1i

    1tii

    t1 VXX)V(

    = 1n

    1i

    tii

    t1 V)X(X)V(

    =

    = [ ]

    ( )( )

    ( )

    1

    tn

    t2

    t1

    n21t1 V

    X

    X

    X

    XXX)V(

    ML

    = 1tt1 XVX)V(

    Es decir, =

    n

    1i

    2X

    Li

    1Ves una forma cuadrtica con matriz simtrica asociada

    XtX. Por lo tanto, el subespacio de mejor ajuste mnimo cuadrtico dedimensin 1 es la recta 1VL que maximiza la forma cuadrtica (V

    1)tXtXV1

    con la restriccin (V1)tV1 = 1. Para hallar el vector V1 utilizaremos el mtodode los multiplicadores de Lagrange:

    Definimos las funciones:

    f(V1) = (V1)tXtXV1 y g(V1) = (V1)tV1 1

    La expresin (V1)tV1 es una forma cuadrtica con matriz simtrica asociada Ip.

    Luego,

    )V(g)V(f 11 =

    )VI2(XVX2 1p1t =

    11t V2XVX2 =

    11t VXVX =

    11t VXVX =

    Por lo tanto, el multiplicador de Lagrange es autovalor de la matriz XtX con

    autovector asociado V1

    . Adems, si premultiplicamos a ambos lados de laigualdad anterior por (V1)t se obtiene que:

    === 1t11t11tt1 V)V()V()V(XVX)V(

    f(V1) =

    Es decir, maximizar f(V1) sujeto a (V1)tV1 = 1 equivale a maximizar , siendoste ltimo autovalor de XtX con autovector asociado V1. En consecuencia, elvector V1 es el autovector normalizado asociado al mayor autovalor de lamatriz XtX.

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    12/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    336

    Observacin:

    Las filas de X en lugar de representarse en p se pueden representar en el

    subespacio de ajuste mnimo cuadrtico )X(Pp1 = 1VL a travs de su

    proyeccin ortogonal sobre dicha recta, especficamente a travs de sucomponente de proyeccin, la cual toma la siguiente forma:

    ( ) ( ) ( ) 1ti1t

    i1t1

    1tiX

    L VX1

    VX

    V)V(

    VXi

    1V===

    = [ ]

    ( )( )

    ( )

    p1

    21

    11

    ip2i1i

    V

    V

    V

    XXXM

    L = ( )=

    p

    1jj

    1ij VX

    Es decir, la componente de proyeccin de la i-sima fila de X sobre la recta demejor ajuste mnimo cuadrtico es una combinacin lineal de las medicionesde las p variables sobre el i-simo elemento. De tal forma que el coeficiente

    ( )j1V mide la contribucin de la j-sima variable en la componente. Estopermite caracterizar intervalos de la recta de mejor ajuste mnimo cuadrticopara as caracterizar los grupos de elementos de X cuyas componentes deproyeccin se encuentran en dichos intervalos.

    Para obtener el vector de componentes de proyeccin se hace lo siguiente:

    11

    tn

    t2

    t1

    1tn

    1t2

    1t1

    XL

    XL

    XL

    XL XVV

    )X(

    )X()X(

    V)X(

    V)X(V)X(

    n

    1V

    2

    1V

    11V

    1V=

    =

    =

    =

    MMM

    Ejemplo Aplicado 9.2.

    En el perodo II-2004 se le consult a un grupo de once (11) alumnos del cursode Algebra Lineal II su apreciacin acerca del nivel de dificultad de las cuatro(4) materias del 4 semestre de la EECA, es decir, Algebra Lineal II,

    Matemtica IV, Introduccin a la Economa y Teora de la Probabilidad II.Para cada respuesta se adopt la siguiente escala:

    1: Nivel de dificultad alto.0: Nivel de dificultad medio.-1: Nivel de dificultad bajo.

    Los resultados de la consulta se muestran a continuacin:

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    337

    AlumnoAlgebraLineal II

    MatemticaIV

    Introduccin ala Economa

    Teora de laProbabilidad II

    A 1 -1 -1 1B 1 0 -1 0C 1 0 -1 1

    D 1 -1 -1 1E 0 0 -1 1F 1 0 0 0G 1 0 -1 1H 1 0 -1 1I 1 1 -1 1J 1 -1 0 0K 1 0 0 1

    Determinemos 1)X(SMA .

    En este caso, la matriz de datos es:

    =

    1001

    0011

    11111101

    1101

    0001

    1100

    1111

    1101

    0101

    1111

    X

    Se puede verificar que:

    =

    8717

    7817

    1142

    77210

    XX t

    Igualmente se puede constatar que los autovalores y autovectoresortonormalizados de la matriz XtX son:

    231 = , 42 = , 23 = y 14 =

    =

    5518,0

    5518,0

    1226,0

    6131,0

    V1 ,

    =

    2294,0

    2294,0

    9177,0

    2294,0

    V2 ,

    =

    3780,0

    3780,0

    3780,0

    7559,0

    V3 y

    =

    7071,0

    7071,0

    0

    0

    V4

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    13/20

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    14/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    340

    Siendo p2P el plano de dimensin 2 en p generado por los vectores V1 y V2,

    autovectores ortonormalizados de la matriz XtX asociados con sus 2 mayoresautovalores.

    Demostracin

    Por definicin el subespacio de mejor ajuste mnimo cuadrtico 2)X(SMA es

    el plano de dimensin 2 generado por 2 vectores ortonormalizados V1 y V2((V1)tV1 = 1, (V2)tV2 = 1 y (V1)tV2 = 0) que verifica que

    =

    n

    1i

    X)X(SMAi

    2 )oyPr,X(d i2

    es mnima, es decir, es el plano p2P generado por los

    vectores V1 y V2 que verifica que =

    n

    1i

    X

    Pi2 )oyPr,X(d ip

    2es mnima (ver figura

    9.11., en 3).

    Figura 9.11.

    El vector V1 necesariamente debe ser el vector director de la recta de mejorajuste mnimo cuadrtico SMA(X)1, ya que de lo contrario existira otro planode dimensin 2 mejor. El objetivo es determinar el vector V2.

    Ahora bien,

    )oyPr,X(d)P,X(d))X(SMA,X(dip2

    X

    Pi2p

    2i2

    2i2

    ==

    Como V1 y V2 forman una base ortonormal de p entonces por la observacin1 del teorema 9.6., se tiene que:

    2X

    L

    2X

    Lit

    iX

    Pi2 i

    2V

    i

    1V

    ip2

    X)X()oyPr,X(d

    =

    =

    n

    1i

    XLi

    2 )oyPr,X(d i1V

    = =

    n

    1ii

    ti X)X(

    =

    n

    1i

    2XL

    i

    1V

    =

    n

    1i

    2XL

    i

    2V

    De forma anloga al teorema anterior se deduce que:

    132

    X

    PoyPr

    32P

    X1 )P,X(d 321X2

    232

    X

    PoyPr Xn

    n32

    X

    PoyPr )P,X(d 322

    )P,X(d 32n

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    341

    =

    n

    1i

    XLi

    2 )oyPr,X(d i1V

    = =

    n

    1ii

    ti X)X( ( ) 1t

    t1 XVXV ( ) 2tt2 XVXV

    =

    n

    1i

    XLi

    2 )oyPr,X(d i1V

    = =

    n

    1ii

    ti X)X( 1 ( ) 2t

    t2 XVXV

    Donde 1 es el mayor autovalor de XtX y el trmino =

    n

    1ii

    ti X)X( es constante.

    Por lo tanto, minimizar =

    n

    1i

    XLi

    2 )oyPr,X(d i1V

    equivale a maximizar la forma

    cuadrtica 2tt2 XVX)V( con las restricciones (V2)tV2 = 1 y (V2)tV1 = 0. Para

    hallar el vector V2 utilizaremos el mtodo de los multiplicadores de Lagrange:Definimos las funciones:

    f(V2

    ) = (V2

    )t

    Xt

    XV2

    , g(V2

    ) = (V2

    )t

    V2

    1 y h(V2

    ) = (V2

    )t

    V1

    La expresin (V2)tV2 es una forma cuadrtica con matriz simtrica asociada Ipy (V2)tV1 es una funcin lineal en V2.

    Luego,

    )V(h)V(g)V(f 212

    22 +=

    112

    p22t V)VI2(XVX2 +=

    112

    22t VV2XVX2 +=

    ( ) ( ) ( )( ) ( ) ( ) 11

    t222

    t22tt2

    11t122t12tt1

    VVV2VXVX2VVVV2VXVX2V

    +=+=

    ( ) ( ) ( )( ) ( ) ( ) 1t212

    t22

    2tt2

    1t11

    2t12

    2tt1

    VVVV2XVXV2

    VVVV2XVXV2

    +=

    +=

    ( )( ) 0.1.2XVXV2

    1.0.2XVXV2

    122tt2

    122tt1

    +=

    +=

    ( )

    ( ) 22tt2

    12tt1

    XVXV

    XVXV2

    =

    =

    Ahora bien, V1 es autovector de XtX con autovalor asociado 1, es decir,XtXV1 = 1V1. Por lo tanto:

    (XtXV1)t = (1V1)t

    (V1)tXtX = 1(V1)t

    En consecuencia,

    ( ) 22tt2

    12t1

    1

    XVXV

    V)V(2

    =

    = ( ) 22t

    t211

    XVXV

    0.2

    =

    = ( ) 22t

    t21

    XVXV

    0

    =

    =

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    15/20

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    16/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    344

    Figura 9.12.

    Se puede observar que el grfico se divide en 2 cuadrantes; el I y el IV. En el Icuadrante se encuentran los alumnos cuyas componentes son positivas conrespecto a V1 y V2, es decir, los alumnos que en general opinan que lgebraLineal II, Matemtica IV y Teora de la Probabilidad II son materias con altonivel de dificultad. En el IV cuadrante se encuentran los alumnos cuyascomponentes son positivas con respecto a V1 y negativas con respecto a V2, esdecir, los alumnos que en general opinan que lgebra Lineal II y Teora de laProbabilidad II son materias con alto nivel de dificultad pero Matemtica IVtiene bajo nivel de dificultad. De esta forma se pueden obtener con mayorprecisin grupos de alumnos internamente homogneos y externamenteheterogneos (figura 9.13.).

    Figura 9.13.

    Teorema 9.10.

    Sean XMnxp() tal que Rango(X) = r, VMpxr() y UMnxr(). Si V y Uson las matrices cuyas columnas son los autovectores ortonormalizados de lasmatrices XtX y XXt, respectivamente, asociados con los autovalores comunesno nulos entonces:

    tV)A(UDX

    =

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    345

    Siendo )A(D

    Mrxr() la matriz diagonal definida por:

    ( )

    ==

    jisi0

    jisi)A(D i

    ij

    Donde 1, 2, , r son los autovalores comunes no nulos de XtX y XXt.

    Demostracin

    Por el teorema 7.23., se sabe que:

    =

    =r

    1i

    tiii )V(UX

    [ ]( )( )

    ( )

    =

    tr

    t2

    t1

    rr

    22

    11

    V

    V

    V

    UUUXM

    L

    [ ]( )( )

    ( )

    =

    tr

    t2

    t1

    r

    2

    1

    r21

    V

    V

    V

    00

    00

    00

    UUUXM

    L

    MMM

    L

    L

    L

    tV)A(UDX

    =

    Definicin 9.4.

    Sea XMnxp() tal que Rango(X) = p. Se define como matriz aproximada deX por el subespacio de mejor ajuste mnimo cuadrtico de dimensin q

    q)X(SMA y se denota por qX~

    a la matriz )(MX~

    nxpq definida por:

    tq V)A(UDX

    ~

    =

    Siendo VMpxq() y UMnxq() las matrices cuyas columnas son losautovectores ortonormalizados de las matrices XtX y XXt, respectivamente,asociados con los q mayores autovalores comunes de ambas matrices.

    Definicin 9.5.

    Sea XMnxp(). Se define como Norma de Frobenius de X y se denota por

    FX al escalar siguiente:

    FX = )XX(Traza t

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    17/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    346

    Observacin:

    Por el teorema 7.13. (lema de Schur), si 1, 2, , p son los autovalores

    comunes no nulos de XtX entonces Traza(XtX) = =

    p

    1ii . Luego,

    FX =

    =

    p

    1ii

    Definicin 9.6.

    Sea XMnxp(). Se define como Medida de la Bondad del Ajuste delSubespacio de Mejor Ajuste Mnimo Cuadrtico de dimensin q a las filas deX y se denota por BSMA(X)q a:

    ( )2F

    2

    Fq

    qX

    X~

    )X(BSMA

    = .100%

    Teorema 9.11.

    Sean XMnxp() y 1, 2, , p. Si 1, 2, , p son los autovalores de lamatriz XtX tales que 12 p entonces:

    =

    =

    =p

    1ii

    q

    1i i

    q)X(BSMA .100%

    Demostracin

    Por definicin:

    ( )2

    F

    2

    Fq

    q

    X

    X~

    )X(BSMA

    = .100%

    Tambin por definicin:

    1. =

    ==

    =

    q

    1iiq

    tq

    2

    qt

    q

    2

    Fq )X

    ~)X

    ~((Traza)X

    ~)X

    ~((TrazaX

    ~.

    2. ( ) =

    ==

    =

    p

    1ii

    t2

    t2

    F)XX(Traza)XX(TrazaX .

    En consecuencia,

    ALGEBRA LINEAL PARA ESTADSTICOS Y ACTUARIOS

    347

    =

    =

    =p

    1ii

    q

    1ii

    q)X(BSMA .100%

    Ejemplo Aplicado 9.4.

    En relacin a los ejemplos aplicados 9.2., y 9.3., se tiene que:

    12423

    23)X(BSMA 1 +++

    = .100% = 76,67%

    y

    12423

    423)X(BSMA

    2 +++

    += .100% = 90,00%

    Se aprecia que el subespacio de mejor ajuste mnimo cuadrtico de dimensin1 tiene una bondad de la aproximacin del 76,67%, medida que esrelativamente alta y bastante buena para ser 1 dimensin. Sin embargo, elsubespacio de mejor ajuste mnimo cuadrtico de dimensin 2 tiene unabondad de la aproximacin del 90%, medida que es excelente por lo cualresulta el subespacio de mejor ajuste mnimo cuadrtico idneo para analizar elcomportamiento de los vectores filas de X (elementos).

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    18/20

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    19/20

  • 8/6/2019 Capitulo 9 Interpretaciones Geometricas

    20/20

    CAPTULO 9: INTERPRETACIONES GEOMTRICAS

    352

    13.3. Calcule y grafique las componentes de proyeccinortogonal de las filas de la matriz de datos sobre el sub-espacio de 3 generado en el apartado 13.1. Realice einterprete el grfico.

    14. Se le consult a un grupo de diez (10) personas si les gusta o no hacerlas siguientes actividades: Ir al Cine, Ir a la Playa, Pasear enCentros Comerciales. y Rumbear. Para ello se utiliz la siguienteescala: 1: Si les gusta y 0: No les gusta. A continuacin se muestranlos resultados:

    Persona Ir al Cine Ir a la Playa Pasear en C.C. Rumbear

    A 1 1 0 0

    B 0 0 1 1

    C 1 1 0 1

    D 1 1 0 0E 0 1 0 0

    F 0 0 0 1

    G 0 1 0 0

    H 1 1 1 1

    I 0 1 0 0

    J 1 0 1 0

    14.1. Determine el sub-espacio de ajuste mnimo cuadrtico a lasfilas de la matriz de datos anterior que Ud. mejor considerepara este caso. Justifique su respuesta.

    14.2. Interprete la estructura general de la(s) componente(s) deproyeccin.

    14.3. Calcule y grafique las componentes de proyeccin de lasfilas de la matriz de datos sobre el sub-espacio de 4generado en el apartado 16.1. Interprete el grfico.