metodos Multivariantes

  • Upload
    cadells

  • View
    1.508

  • Download
    1

Embed Size (px)

Citation preview

NUEVOS MTODOS DE ANLISISMULTIVARIANTECarles M. Cuadras21 de junio de 20102Es propiedad del autor.c _C. M. CuadrasCMC EditionsManacor 3008023 Barcelona, Spainndice general1. DATOS MULTIVARIANTES 111.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.2. Matrices de datos . . . . . . . . . . . . . . . . . . . . . . . . . 111.3. La matriz de centrado . . . . . . . . . . . . . . . . . . . . . . 121.4. Medias, covarianzas y correlaciones . . . . . . . . . . . . . . . 131.5. Variables compuestas . . . . . . . . . . . . . . . . . . . . . . . 141.6. Transformaciones lineales . . . . . . . . . . . . . . . . . . . . . 141.7. Teorema de la dimensin . . . . . . . . . . . . . . . . . . . . . 151.8. Medidas globales de variabilidad y dependencia . . . . . . . . 161.9. Distancias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.10. Dos aspectos del clculo matricial. . . . . . . . . . . . . . . . 191.10.1. Descomposicin singular . . . . . . . . . . . . . . . . . 191.10.2. Inversa generalizada . . . . . . . . . . . . . . . . . . . 191.11. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202. NORMALIDAD MULTIVARIANTE 232.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.2. Distribucin normal multivariante . . . . . . . . . . . . . . . . 242.2.1. Denicin. . . . . . . . . . . . . . . . . . . . . . . . . 242.2.2. Propiedades . . . . . . . . . . . . . . . . . . . . . . . . 252.2.3. Caso bivariante . . . . . . . . . . . . . . . . . . . . . . 262.3. Distribucin de Wishart . . . . . . . . . . . . . . . . . . . . . 272.4. Distribucin de Hotelling . . . . . . . . . . . . . . . . . . . . . 282.5. Distribucin de Wilks . . . . . . . . . . . . . . . . . . . . . . . 292.6. Relaciones entre Wilks, Hotelling y F . . . . . . . . . . . . . . 312.7. Distribucin multinomial . . . . . . . . . . . . . . . . . . . . . 322.8. Distribuciones con marginales dadas . . . . . . . . . . . . . . . 322.9. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 3434 NDICE GENERAL3. INFERENCIA MULTIVARIANTE 373.1. Conceptos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . 373.2. Estimacin de medias y covarianzas . . . . . . . . . . . . . . . 383.3. Tests multivariantes . . . . . . . . . . . . . . . . . . . . . . . . 393.3.1. Test sobre la media: una poblacin . . . . . . . . . . . 393.3.2. Test sobre la media: dos poblaciones . . . . . . . . . . 403.3.3. Comparacin de medias . . . . . . . . . . . . . . . . . 403.4. Teorema de Cochran . . . . . . . . . . . . . . . . . . . . . . . 413.5. Construccin de tests multivariantes . . . . . . . . . . . . . . 443.5.1. Razn de verosimilitud . . . . . . . . . . . . . . . . . . 443.5.2. Principio de unin-interseccin . . . . . . . . . . . . . . 463.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.7. Anlisis de perles . . . . . . . . . . . . . . . . . . . . . . . . 533.8. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 544. ANALISIS DE CORRELACION CANONICA 574.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 574.2. Correlacin mltiple . . . . . . . . . . . . . . . . . . . . . . . 574.3. Correlacin cannica . . . . . . . . . . . . . . . . . . . . . . . 594.4. Correlacin cannica y descomposicin singular . . . . . . . . 624.5. Signicacin de las correlaciones cannicas . . . . . . . . . . . 634.6. Test de independencia . . . . . . . . . . . . . . . . . . . . . . 634.6.1. Razn de verosimilitud . . . . . . . . . . . . . . . . . . 644.6.2. Principio de unin interseccin . . . . . . . . . . . . . . 644.7. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 654.8. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 675. ANALISIS DE COMPONENTES PRINCIPALES 695.1. Denicin y obtencin de las componentes principales . . . . . 695.2. Variabilidad explicada por las componentes principales . . . . 715.3. Representacin de una matriz de datos . . . . . . . . . . . . . 725.4. Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745.4.1. Estimacin y distribucin asinttica . . . . . . . . . . . 755.4.2. Tests de hiptesis . . . . . . . . . . . . . . . . . . . . . 765.5. Nmero de componentes principales . . . . . . . . . . . . . . . 785.5.1. Criterio del porcentaje . . . . . . . . . . . . . . . . . . 785.5.2. Criterio de Kaiser . . . . . . . . . . . . . . . . . . . . . 795.5.3. Test de esfericidad . . . . . . . . . . . . . . . . . . . . 79NDICE GENERAL 55.5.4. Criterio del bastn roto . . . . . . . . . . . . . . . . . . 795.6. Biplot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 805.7. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 815.8. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 856. ANLISIS FACTORIAL 876.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 876.2. El modelo unifactorial . . . . . . . . . . . . . . . . . . . . . . 886.3. El modelo multifactorial . . . . . . . . . . . . . . . . . . . . . 906.3.1. El modelo. . . . . . . . . . . . . . . . . . . . . . . . . 906.3.2. La matriz factorial . . . . . . . . . . . . . . . . . . . . 916.3.3. Las comunalidades . . . . . . . . . . . . . . . . . . . . 916.3.4. Nmero mximo de factores comunes . . . . . . . . . . 926.3.5. El caso de Heywood . . . . . . . . . . . . . . . . . . . 936.3.6. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . 936.4. Teoremas fundamentales . . . . . . . . . . . . . . . . . . . . . 956.5. Mtodo del factor principal . . . . . . . . . . . . . . . . . . . 976.6. Mtodo de la mxima verosimilitud . . . . . . . . . . . . . . . 986.6.1. Estimacin de la matriz factorial . . . . . . . . . . . . 986.6.2. Hiptesis sobre el nmero de factores . . . . . . . . . . 996.7. Rotaciones de factores . . . . . . . . . . . . . . . . . . . . . . 1006.7.1. Rotaciones ortogonales . . . . . . . . . . . . . . . . . . 1006.7.2. Factores oblicuos . . . . . . . . . . . . . . . . . . . . . 1016.7.3. Rotacin oblicua . . . . . . . . . . . . . . . . . . . . . 1026.7.4. Factores de segundo orden . . . . . . . . . . . . . . . . 1046.8. Medicin de factores . . . . . . . . . . . . . . . . . . . . . . . 1056.9. Anlisis factorial conrmatorio . . . . . . . . . . . . . . . . . . 1066.10. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1087. ANALISIS CANONICO DE POBLACIONES 1117.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1117.2. Variables cannicas . . . . . . . . . . . . . . . . . . . . . . . . 1127.3. Distancia de Mahalanobis y transformacin cannica . . . . . 1147.4. Representacin cannica . . . . . . . . . . . . . . . . . . . . . 1157.5. Aspectos inferenciales . . . . . . . . . . . . . . . . . . . . . . . 1177.5.1. Comparacin de medias . . . . . . . . . . . . . . . . . 1177.5.2. Comparacin de covarianzas . . . . . . . . . . . . . . . 1177.5.3. Test de dimensionalidad . . . . . . . . . . . . . . . . . 1186 NDICE GENERAL7.5.4. Regiones condenciales . . . . . . . . . . . . . . . . . . 1197.6. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1238. ESCALADO MULTIDIMENSIONAL (MDS) 1258.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1258.2. Cuando una distancia es eucldea? . . . . . . . . . . . . . . . . 1268.3. El anlisis de coordenadas principales . . . . . . . . . . . . . . 1288.4. Similaridades . . . . . . . . . . . . . . . . . . . . . . . . . . . 1318.5. Nociones de MDS no mtrico . . . . . . . . . . . . . . . . . . 1338.6. Distancias estadsticas . . . . . . . . . . . . . . . . . . . . . . 1368.6.1. Variables cuantitativas . . . . . . . . . . . . . . . . . . 1368.6.2. Variables binarias . . . . . . . . . . . . . . . . . . . . . 1378.6.3. Variables categricas . . . . . . . . . . . . . . . . . . . 1388.6.4. Variables mixtas . . . . . . . . . . . . . . . . . . . . . 1388.6.5. Otras distancias . . . . . . . . . . . . . . . . . . . . . . 1398.7. Dos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1418.8. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 1459. ANALISIS DE CORRESPONDENCIAS 1479.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1479.2. Cuanticacin de las variables categricas . . . . . . . . . . . 1499.3. Representacin de las y columnas . . . . . . . . . . . . . . . 1509.4. Relacin entre las y columnas y representacin conjunta . . . 1529.5. Soluciones simtrica y asimtrica . . . . . . . . . . . . . . . . 1549.6. Variabilidad geomtrica (inercia) . . . . . . . . . . . . . . . . 1569.7. Analisis de Correspondencias Mltiples . . . . . . . . . . . . . 1599.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1619.9. MDS ponderado . . . . . . . . . . . . . . . . . . . . . . . . . . 1659.10. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 16810.CLASIFICACION 17310.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17310.2. Jerarqua indexada . . . . . . . . . . . . . . . . . . . . . . . . 17410.3. Geometra ultramtrica . . . . . . . . . . . . . . . . . . . . . . 17610.4. Algoritmo fundamental de clasicacin. . . . . . . . . . . . . 18010.5. Equivalencia entre jerarqua indexada y ultramtrica . . . . . 18010.6. Algoritmos de clasicacin jerrquica. . . . . . . . . . . . . . 18110.6.1. Mtodo del mnimo . . . . . . . . . . . . . . . . . . . . 183NDICE GENERAL 710.6.2. Mtodo del mximo . . . . . . . . . . . . . . . . . . . . 18410.7. Otras propiedades del mtodo del mnimo . . . . . . . . . . . 18610.8. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18810.9. Clasicacin no jerrquica . . . . . . . . . . . . . . . . . . . . 19110.10.Nmero de clusters . . . . . . . . . . . . . . . . . . . . . . . . 19210.11.Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 19311.ANALISIS DISCRIMINANTE 19511.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19511.2. Clasicacin en dos poblaciones . . . . . . . . . . . . . . . . . 19611.2.1. Discriminador lineal . . . . . . . . . . . . . . . . . . . 19611.2.2. Regla de la mxima verosimilitud. . . . . . . . . . . . 19711.2.3. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . 19711.3. Clasicacin en poblaciones normales . . . . . . . . . . . . . . 19811.3.1. Discriminador lineal . . . . . . . . . . . . . . . . . . . 19811.3.2. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . 19911.3.3. Probabilidad de clasicacin errnea . . . . . . . . . . 19911.3.4. Discriminador cuadrtico . . . . . . . . . . . . . . . . . 19911.3.5. Clasicacin cuando los parmetros son estimados . . . 20011.3.6. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . 20011.4. Discriminacin en el caso de k poblaciones . . . . . . . . . . . 20311.4.1. Discriminadores lineales . . . . . . . . . . . . . . . . . 20311.4.2. Regla de la mxima verosimilitud. . . . . . . . . . . . 20411.4.3. Regla de Bayes . . . . . . . . . . . . . . . . . . . . . . 20411.4.4. Un ejemplo clsico . . . . . . . . . . . . . . . . . . . . 20512.DISCRIMINACIONLOGISTICAYBASADAENDISTAN-CIAS 20712.1. Anlisis discriminante logstico . . . . . . . . . . . . . . . . . . 20712.1.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . 20712.1.2. Modelo de regresin logstica . . . . . . . . . . . . . . . 20812.1.3. Estimacin de los parmetros . . . . . . . . . . . . . . 20912.1.4. Distribucin asinttica y test de Wald . . . . . . . . . 21012.1.5. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . 21112.1.6. Curva ROC. . . . . . . . . . . . . . . . . . . . . . . . 21212.1.7. Comparacin entre discriminador lineal y logstico . . . 21412.2. Anlisis discriminante basado en distancias . . . . . . . . . . . 21712.2.1. La funcin de proximidad . . . . . . . . . . . . . . . . 2178 NDICE GENERAL12.2.2. La regla discriminante DB . . . . . . . . . . . . . . . . 21812.2.3. La regla DB comparada con otras . . . . . . . . . . . . 21912.2.4. La regla DB en el caso de muestras . . . . . . . . . . . 22012.3. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 22213.EL MODELO LINEAL 22513.1. El modelo lineal . . . . . . . . . . . . . . . . . . . . . . . . . . 22513.2. Suposiciones bsicas del modelo. . . . . . . . . . . . . . . . . 22613.3. Estimacin de parmetros . . . . . . . . . . . . . . . . . . . . 22713.3.1. Parmetros de regresin . . . . . . . . . . . . . . . . . 22713.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 22813.4. Algunos modelos lineales . . . . . . . . . . . . . . . . . . . . . 22913.4.1. Regresin mltiple . . . . . . . . . . . . . . . . . . . . 22913.4.2. Diseo de un factor . . . . . . . . . . . . . . . . . . . . 23013.4.3. Diseo de dos factores . . . . . . . . . . . . . . . . . . 23013.5. Hiptesis lineales . . . . . . . . . . . . . . . . . . . . . . . . . 23113.6. Inferencia en regresin mltiple . . . . . . . . . . . . . . . . . 23413.7. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 23514.ANLISIS DE LA VARIANZA (ANOVA) 23714.1. Diseo de un factor . . . . . . . . . . . . . . . . . . . . . . . . 23714.2. Diseo de dos factores . . . . . . . . . . . . . . . . . . . . . . 23914.3. Diseo de dos factores con interaccin . . . . . . . . . . . . . . 24114.4. Diseos multifactoriales . . . . . . . . . . . . . . . . . . . . . . 24314.5. Modelos log-lineales . . . . . . . . . . . . . . . . . . . . . . . . 24414.5.1. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 24714.6. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 24815.ANLISIS DE LA VARIANZA (MANOVA) 24915.1. Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24915.2. Estimacin de parmetros . . . . . . . . . . . . . . . . . . . . 25015.3. Tests de hiptesis lineales . . . . . . . . . . . . . . . . . . . . 25315.4. Manova de un factor . . . . . . . . . . . . . . . . . . . . . . . 25515.5. Manova de dos factores . . . . . . . . . . . . . . . . . . . . . . 25615.6. Manova de dos factores con interaccin . . . . . . . . . . . . . 25715.7. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25815.8. Otros criterios . . . . . . . . . . . . . . . . . . . . . . . . . . . 26115.9. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 262NDICE GENERAL 916.FUNCIONES ESTIMABLES MULTIVARIANTES 26316.1. Funciones estimables . . . . . . . . . . . . . . . . . . . . . . . 26316.2. Teorema de Gauss-Markov . . . . . . . . . . . . . . . . . . . . 26416.3. Funciones estimables multivariantes . . . . . . . . . . . . . . . 26516.4. Anlisis cannico de fpem. . . . . . . . . . . . . . . . . . . . 26616.4.1. Distancia de Mahalanobis . . . . . . . . . . . . . . . . 26616.4.2. Coordenadas cannicas . . . . . . . . . . . . . . . . . . 26716.4.3. Regiones condenciales . . . . . . . . . . . . . . . . . . 26816.5. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26816.6. Complementos . . . . . . . . . . . . . . . . . . . . . . . . . . . 27110 NDICE GENERAL11 C1CGCEl Anlisis Multivariante es un conjunto de mtodos estadsticos y matem-ticos, destinados a describir e interpretar los datos que provienen de la ob-servacin de varias variables estadsticas, estudiadas conjuntamente.Este libro es una presentacin convencional de los principales modelos ymtodos del Anlisis Multivariante, con referencias a algunas contribucionesrecientes.La exposicin mantiene un cierto rigor matemtico, compensado con unaclara orientacin aplicada. Todos los mtodos se ilustran con ejemplos, quejustican su aplicabilidad. Para examinar los datos y ver ms ejemplos con-sltese la pgina webwww.ub.edu,stat,cuadras,cuad.htmlEsta obra tiene como precedentes la monograa Mtodos de Anlisis Fac-torial (Pub. no. 7, Laboratorio de Clculo, Universidad de Barcelona, 1974),y el libro Mtodos de Anlisis Multivariante (EUNIBAR, 1981; PPU, 1991;EUB, 1996, Barcelona).El autor se reserva el derecho de ampliar el texto e introducir mejoras.La primera versin apareci en 2007. La segunda versin (2010) contienecorrecciones, ampliaciones y un ndice alfabtico.Cmo citar este libro:C. M. CuadrasNuevos Mtodos de Anlisis MultivarianteCMC EditionsBarcelona, 2010Captulo 1DATOS MULTIVARIANTES1.1. IntroduccinEl anlisis multivariante (AM) es la parte de la estadstica y del anlisisde datos que estudia, analiza, representa e interpreta los datos que resultende observar un nmero j1 de variables estadsticas sobre una muestra de :individuos. Las variables observables son homogneas y correlacionadas, sinque alguna predomine sobre las dems. La informacin estadstica en AM esde carcter multidimensional, por lo tanto la geometra, el clculo matricialy las distribuciones multivariantes juegan un papel fundamental.La informacin multivariante es una matriz de datos, pero a menudo, enAM la informacin de entrada consiste en matrices de distancias o similari-dades, que miden el grado de discrepancia entre los individuos. Comenzare-mos con las tcnicas que se basan en matrices de datos.1.2. Matrices de datosSupongamos : individuos .1. . . . . .a y j variables A1. . . . . Aj. Sea ri) =A)(.i) la observacin de la variable A) sobre el individuo .i. La matriz de1112 CAPTULO 1. DATOS MULTIVARIANTESdatos multivariantes esX =_______r11r1)r1j...............ri1ri) rij...............ra1ra)raj_______Las las de X se identican con los individuos y las columnas de X con lasvariables. Indicaremos:1. xi la la i-sima de X.2. A) la columna j-sima de X.3. x = (r1. . . . . r). . . . . rj)t el vector (la) de las medias de las variables,siendor) = 1:a

i=1ri).4. La matriz simtrica j j de covarianzas muestralesS =____:11:12:1j:21:22:2j. . . . . .:j1:j2:jj____.siendo:))0 = 1:a

i=1(ri)r))(ri)0 r)0 )la covarianza entre las variables ,. ,t. Naturalmente, x y S son medidasmultivariantes de tendencia central y dispersin.1.3. La matriz de centradoSi 1 =(1. . . . . 1)t es el vector columna de unos de orden : 1, y J = 11tes la matriz : : de unos, ciertas caractersticas multivariantes se expresanmejor a partir de la matriz de centrado H. denida comoH = I1:J1.4. MEDIAS, COVARIANZAS Y CORRELACIONES 13Propiedades:Ht = H.H2= H.H1 = 1tH = 0.rang(H) =: 1.Los valores propios de H son 0 1.X = HX es la matriz de datos centrados (las columnnas de X suman0).1.4. Medias, covarianzas y correlacionesEl vector de medias, la matriz de covarianzas, etc., tienen expresionesmatriciales simples.1. xt =1a1tX.2. Matriz de datos centrados:X= X1xt = HX.3. Matriz de covarianzas:S =1:XtX = 1:XtHX.4. Matriz de correlaciones:El coeciente de correlacin entre las variables ,. ,t viene dado por:))0 =:))0:):)0.siendo :). :)0las desviaciones tpicas. Adems de la matriz de covarianzasinteresa tambin la matriz de correlacionesH =____1 :12:1j:211:2j. . . . . .:j1:j21____.14 CAPTULO 1. DATOS MULTIVARIANTESdonde :i) =cor(Ai. A)) es el coeciente de correlacin (muestral) entre lasvariables Ai. A). que verica:H = O1SO1. S = OHO. (1.1)siendo O la matriz diagonal con las desviaciones tpicas de las variables.1.5. Variables compuestasAlgunos mtodos de AM consisten en obtener e interpretar combina-ciones lineales adecuadas de las variables observables. Una variable compues-ta 1 es una combinacin lineal de las variables observables con coecientesa = (c1. . . . . cj)t1 = c1A1 + +cjAj.Si X =[A1. . . . . Aj] es la matriz de datos, tambin podemos escribir1 = Xa.Si 2 = /1A1 + +/jAj = XI es otra variable compuesta, se verica:1. 1 = xta. 2=xtI.2. var(1 ) = atSa, var(2) = ItSI.3. cov(1. 2) = atSI.Ciertas variables compuestas reciben diferentes nombres segn la tc-nica multivariante: componentes principales, variables cannicas, funcionesdiscriminantes, etc. Uno de los objetivos del Anlisis Multivariante es encon-trar variables compuestas adecuadas que expliquen aspectos relevantes de losdatos.1.6. Transformaciones linealesSea T una matriz j . Una transformacin lineal de la matriz de datoses = XT.Las columnas 11. . . . . 1q de son las variables transformadas.Propiedades:1.7. TEOREMA DE LA DIMENSIN 151. yt=xtT. donde y es el vector de medias de .2. SY = TtST. donde SY es la matriz de covarianzas de .Demost.:yt=1a1t =1a1tXT =xtT. SY =1atH =1aTtXtHXT = TtST.1.7. Teorema de la dimensinLa matriz de covarianzas S es (semi)denida positiva, puesto que:atSa =1:atXtHXa =1:atXtHHXa = ItI _0.siendo I =:12HXa.El rango : = rang(S) determina la dimensin del espacio vectorial gener-ado por las variables observables, es decir, el nmero de variables linealmenteindependientes es igual al rango de S.Teorema 1.7.1 Si : = rang(S) _j hay : variables linealmente independi-entes y las otras j : son combinacin lineal de estas : variables.Demost.: Podemos ordenar las j variables de manera que la matriz de covar-ianzas de A1. . . . . Av sea no singular___ :11:1v.........:v1:vv___:)1:)vSea A). ,:. Las covarianzas entre A) y A1. . . . . Av verican::)) =v

i=1ci:)i. :)i =v

i0=1ci0 :ii0 .Entoncesc:(A)

vi=1ciAi) = :)) +

vi,i0=1cici0 :ii0 2

vi=1ci:)i=

vi=1ci:)i +

vi=1ci(

vi0=1ci0 :ii0 ) 2

vi=1ci:)i=

vi=1ci:)i +

vi=1ci:)i2

vi=1ci:)i= 0.16 CAPTULO 1. DATOS MULTIVARIANTESPor lo tantoA)v

i=1ciAi = c ==A) = c +v

i=1ciAidonde c es una constante.Corolario 1.7.2 Si todas las variables tienen varianza positiva (es decir,ninguna se reduce a una constante) y : = rang(H) _ j. hay : variableslinealmente independientes y las otras j : son combinacin lineal de estas: variables.Demost.: De (1.1) deducimos que : = rang(H) = rang(S).1.8. Medidas globales de variabilidad y de-pendenciaUna medida de la variabilidad global de las j variables debe ser funcinde la matriz de covarianzas S. Sean `1. . . . . `j los valores propios de S. Lassiguientes medidas tienen especial inters en AM.a) Varianza generalizada:[S[ =`1 `j.b) Variacin total:tr(S) =`1 + +`jUna medida de dependencia global debe ser funcin de la matriz de cor-relaciones H. Un coeciente de dependencia esj2= 1 [H[.que verica:1. 0 _ j2_ 1.2. j2= 0 si y slo si las j variables estan incorrelacionadas.3. j2= 1 si y slo si hay relaciones lineales entre las variables.1.9. DISTANCIAS 17Demost.:1. Sean `1. . . . . `j los valores propios de H. Si q y c son las medias ge-omtrica y aritmtica de j nmeros positivos, se verica q _ c. Entonces, detr(H) =j([H[)1j= (`1 `j)1j_ (`1 + +`j),j = 1y por lo tanto 0 _ det(H) _ 1.2. H = I (matriz identidad) si y slo si las j variables estn incorrela-cionadas y entonces 1 [I[ =0.3. Si j2= 1. es decir, [H[ =0. entonces rang(H)