694

E c o n o m e t r à a m o d e l o s (4a. ed.)

Embed Size (px)

DESCRIPTION

libro de Pindyck y Rubinfield de modelos econométricos

Citation preview

  • ECONOMETRA: MODELOS Y PRONSTICOS

  • ECONOMETRA: MODELOS Y PRONSTICOS

    Cuarta edicin

    ROBERT S. PINDYCK Massachusetts Institute of Technology

    DANIEL L. RUBINFELD University of California at Berkeley

    Traduccin Jorge Alberto Velzquez Arellano

    Traductor profesional

    Revisin tcnica Vctor Aguirre Torres

    Instituto Tecnolgico Autnomo de Mxico

    Ma. Teresa Lpez lvarez Consultor independiente

    McGRAW-HILL

    MXICO BUENOS AIRES CARACAS GUATEMALA LISBOA MADRID NUEVA YORK SAN JUAN SANTAF DE BOGOT SANTIAGO SAO PAULO

    AUCKLAND LONDRES MILN MONTREAL NUEVA DELHI SAN FRANCISCO SINGAPUR ST. LOUIS SIDNEY TORONTO

  • Gerente de producto: Ricardo del Bosque Alayn Supervisor de edicin: Arturo Gonzlez Maya Supervisor de produccin: Zeferino Garca Garca

    ECONOMETRIA: MODELOS Y PRONSTICOS Cuarta edicin

    Prohibida la reproduccin total o parcial de esta obra, por cualquier medio, sin autorizacin escrita del editor.

    DERECHOS RESERVADOS 2001, respecto a la primera edicin en espaol por: McGRAW-HlLL/INTERAMERlCANA EDITORES, S.A. de C.V. A Subsidiary of The McGraw-Hill Companies, Inc.

    Cedro Nm. 512, Col. Atlampa, Delegacin Cuauhtmoc, C.P. 06450, Mxico, D.F. Miembro de la Cmara Nacional de la Industria Editorial Mexicana, Reg. Nm. 736

    ISBN 970-10-2925-9

    Translated from the fourth English edition of: ECONOMETRIC MODELS AND ECONOMETRIC FORECASTS Copyright 1998 by R. Pindick and D. Rubinfeld Copyright 1998 by the McGraw-Hill Companies, Inc. All rights reserved. ISBN 0-07-913292-8

    1234567890 098765432 01

    Impreso en Mxico Printed in Mxico

    Esta obra se termin de imprimir en Octubre del 2000 en Impresora OFGLOMA S.A. de C.V. Calle Rosa Blanca Nm. 12 Col. Santiago Acahualtepec Mxico, 13 D.F.

    Se tiraron 7,000 ejemplares

  • ACERCA DE LOS AUTORES

    ROBERT S. PINDYCK es Profesor Mitsubishi Bank de Economa Aplicada en la Sloan School of Management del Massachusetts Institute of Technology. El profesor Pindyck se incorpor al cuerpo docente del M.I.T. despus de recibir un doctorado ah en 1971. Tambin ha sido Profesor Visitante de Economa en la Universidad de Tel Aviv y es Investigador Asociado del National Bureau of Economic Research. Es coautor, con Daniel Rubinfeld, de Microeconomics, que en la actualidad se encuentra en su cuarta edicin.

    DANIEL L. RUBINFELD es Profesor Robert L. Bridges de Leyes y Profesor de Economa en la University of California, Berkeley. El profesor Rubinfeld recibi un doctorado en 1972 del M.I.T. Ha enseado en la Suffolk University, Wellesley College y en la University of Michigan. Ha sido miembro del National Bureau of Economic Research, The Center for Advanced Study in the Behavioral Sciences y The Guggenheim Foundation, y en la actualidad es coeditor de la revista International Review of Law and Economics.

  • Para nuestras esposas, Nurit y Gail

  • CONTENIDO

    EJEMPLOS xiv PREFACIO XV INTRODUCCIN xix

    PARTE 1 LOS FUNDAMENTOS DEL ANLISIS DE REGRESIN 1

    1 Introduccin al modelo de regresin 3

    1.1 AJUSTE DE CURVA 3 1.2 DERIVACIN DE MNIMOS CUADRADOS 7

    Apndice 1.1 El uso del operador sumatoria 13 Apndice 1.2 Derivacin de los estimadores de parmetros de mnimos cuadrados 17

    2 Estadstica elemental: a revisin 20 2.1 VARIABLES ALEATORIAS 20 2.2 ESTIMACIN 25 2.3 PROPIEDADES DESEABLES DE LOS ESTIMADORES 30 2.4 DISTRIBUCIONES DE PROBABILIDAD 34 2.5 PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA 40 2.6 ESTADSTICA DESCRIPTIVA 47

    Apndice 2.1 Las propiedades del operador de expectativas 50 Apndice 2.2 Estimacin de mxima verosimilitud 53

    ix

  • CONTENIDO

    3 El modelo de regresin de dos variables 59 3.1 EL MODELO 59 3.2 MEJOR ESTIMACIN LINEAL INSESGADA 63 3.3 PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA 69 3.4 ANLISIS DE VARIANZA Y CORRELACIN 73

    Apndice 3.1 Varianza del estimador de la pendiente de los mnimos cuadrados 82

    Apndice 3.2 Algunas propiedades de los residuales de mnimos cuadrados 83

    4 El modelo de regresin mltiple 87 4.1 EL MODELO 87 4.2 ESTADSTICAS DE REGRESIN 90 4.3 PRUEBAS F, R2Y R2 CORREGIDA 91 4.4 MULTICOLINEALIDAD 98 4.5 COEFICIENTES ESTANDARIZADOS Y ELASTICIDADES 101 4.6 CORRELACIN PARCIAL Y REGRESIN POR ETAPAS 102

    Apndice 4.1 Estimacin del parmetro de mnimos cuadrados 108 Apndice 4.2 Coeficientes de regresin 109 Apndice 4.3 El modelo de regresin mltiple en forma matricial 110

    PARTE 2 MODELOS DE REGRESIN DE UNA SOLA ECUACIN 119

    5 Usando el modelo de regresin mltiple 121 5.1 EL MODELO LINEAL GENERAL 121 5.2 USO DE VARIABLES INDICADORAS 126 5.3 EL USO DE PRUEBAS f Y FPARA HIPTESIS QUE INVOLUCRAN MS

    DE UN PARMETRO 132 5.4 REGRESIQN LINEAL POR SEGMENTOS 141 5.5 EL MODELO DE REGRESIN MLTIPLE CON VARIABLES EXPLICATIVAS

    ESTOCSTICAS 143 Apndice 5.1 Pruebas que involucran coeficientes de variable indicadora 144

    6 Correlacin serial y heterocedasticidad 150 6.1 HETEROCEDASTICIDAD 151 6.2 CORRELACIN SERIAL 164

    Apndice 6.1 Estimacin de mnimos cuadrados generalizados 177

    7 Variables instrumentales y especificacin del modelo 186 7.1 CORRELACIN ENTRE UNA VARIABLE INDEPENDIENTE Y EL

    TRMINO DEL ERROR 187 7.2 ERRORES EN LAS VARIABLES 188

  • CONTENIDO XI

    7.3 ERROR DE ESPECIFICACIN 192 7.4 DIAGNSTICO DE REGRESIN 198 7.5 PRUEBAS DE ESPECIFICACIN 203

    Apndice 7.1 Estimacin de variables instrumentales en forma de matricial 207

    8 Pronstico con un modelo de regresin de una sola ecuacin 211 8.1 PRONSTICO INCONDICIONAL 213 8.2 PRONSTICO CON ERRORES CORRELACIONADOS EN FORMA SERIAL 224 8.3 PRONSTICO CONDICIONAL 231

    Apndice 8.1 Pronstico con el modelo de regresin mltiple 234

    9 Estimacin de una sola ecuacin: temas avanzados 239 9.1 MODELOS DE REZAGO DISTRIBUIDO 239 9.2 PRUEBAS PARA CAUSALIDAD 253 9.3 OBSERVACIONES FALTANTES 257 9.4 EL USO DE DATOS DE PANEL 261

    Apndice 9.1 Estimacin de intervalos de confianza para elasticidades a largo plazo 273

    10 Estimacin no lineal y de mxima verosimilitud 277 10.1 ESTIMACIN NO LINEAL 278 10.2 ESTIMACIN POR MXIMA VEROSIMILITUD 285 10.3 MODELOS ARCH Y GARCH 298

    Apndice 10.1 Estimacin por el mtodo de momentos generalizado 306

    11 Modelos de eleccin cualitativa 312 11.1 MODELOS DE ELECCIN BINARIA 312 11.2 MODELOS DE ELECCIN MLTIPLE 334 11.3 MODELOS DE REGRESIN CENSURADA 340

    Apndice 11.1 Estimacin de mxima verosimilitud de los modelos logit y probit 345

    PARTE 3 MODELOS DE ECUACIONES MLTIPLES 351

    12 Estimacin de ecuaciones simultneas 353 12.1 INTRODUCCIN A LOS MODELOS DE ECUACIONES SIMULTNEAS 354 12.2 EL PROBLEMA DE LA IDENTIFICACIN 358 12.3 ESTIMACIN CONSISTENTE DE LOS PARMETROS 363 12.4 MNIMOS CUADRADOS DE DOS ETAPAS 365 12.5 ESTIMACIN DE ECUACIN SIMULTNEA CON CORRELACIN

    SERIAL Y VARIABLES DEPENDIENTES REZAGADAS 373

  • Xii CONTENIDO

    12.6 MTODOS DE ESTIMACIN MS AVANZADOS 375 Apndice 12.1 El problema de la identificacin en forma matricial 383 Apndice 12.2 Mnimos cuadrados de dos etapas en forma matricial 389 Apndice 12.3 Estimacin de regresin aparentemente no relacionada en

    forma matricial 392

    13 Introduccin a los modelos de simulacin 398 13.1 EL PROCESO DE SIMULACIN 399 13.2 EVALUACIN DE MODELOS DE SIMULACIN 404 13.3 UN EJEMPLO DE SIMULACIN 410 13.4 ESTIMACIN DEL MODELO 416 13.5 MODELOS NO ESTRUCTURALES: AUTORREGRESIONES VECTORIALES 420 13.6 MODELADO CON DATOS LIMITADOS 427

    14 Comportamiento dinmico de los modelos de simulacin 434 14.1 COMPORTAMIENTO DEL MODELO: ESTABILIDAD Y OSCILACIONES 435 14.2 COMPORTAMIENTO DEL MODELO: MULTIPLICADORES Y RESPUESTA

    DINMICA 443 14.3 LA FUNCIN DE RESPUESTA AL IMPULSO Y AUTORREGRESIONES

    VECTORIALES 453 14.4 AJUSTE DE MODELOS DE SIMULACIN 457 14.5 SIMULACIN ESTOCSTICA 461

    Apndice 14.1 Un modelo macroeconmico pequeo 464

    PARTE 4 MODELOS DE SERIES DE TIEMPO 487

    15 Suavizamiento y extrapolacin de series de tiempo 491 15.1 MODELOS DE EXTRAPOLACIN SIMPLE 491 15.2 SUAVIZAMIENTO Y AJUSTE ESTACIONAL 502

    16 Propiedades de las series de tiempo estocsticas 514 16.1 INTRODUCCIN A LOS MODELOS DE SERIES DE TIEMPO ESTOCSTICAS 514 16.2 CARACTERIZACIN DE SERIES DE TIEMPO: LA FUNCIN

    DE AUTOCORRELACIN 520 16.3 PRUEBAS PARA CAMINATAS ALEATORIAS 532 16.4 SERIES DE TIEMPO COINTEGRADAS 539

    Apndice 16.1 La funcin de autocorrelacin para un proceso estacionario 542

    17 Modelos lineales de series de tiempo 547 17.1 MODELOS DE PROMEDIO MVIL 548 17.2 MODELOS AUTORREGRESIVOS 553 17.3 MODELO MIXTO AUTORREGRESIVO-PROMEDIO MVIL 561

  • CONTENIDO Xiii

    17.4 PROCESOS NO ESTACIONARIOS HOMOGNEOS: MODELOS ARIMA 564 17.5 ESPECIFICACIN DE MODELOS ARIMA 567

    Apndice 17.1 Estacionariedad, invertibilidad y homogeneidad 570

    18 Estimacin y pronstico con modelos de series de tiempo 575 18.1 ESTIMACIN DEL MODELO 575 18.2 VERIFICACIN DIAGNSTICA 581 18.3 PRONSTICOS CON ERROR CUADRTICO MEDIO MNIMO 586 18.4 CLCULO DE UN PRONSTICO 588 18.5 EL ERROR DE PRONSTICO 589 18.6 INTERVALOS DE CONFIANZA DE PRONSTICOS 590 18.7 PROPIEDADES DE LOS PRONSTICOS ARIMA 591 18.8 DOS EJEMPLOS 599

    19 Aplicaciones de los modelos de series de tiempo 606 19.1 REVISIN DEL PROCESO DE MODELADO 607 19.2 MODELOS DE VARIABLES ECONMICAS: INVERSIN EN INVENTARIOS 608 19.3 PRONSTICO DE DATOS TELEFNICOS ESTACIONALES 613 19.4 COMBINACIN DEL ANLISIS DE REGRESIN CON UN MODELO

    DE SERIES DE TIEMPO: MODELOS DE FUNCIN DE TRANSFERENCIA 617 19.5 UN MODELO COMBINADO DE REGRESIN Y SERIES DE TIEMPO

    PARA PRONSTICO DE FLUJOS DE DEPSITO DE AHORROS A CORTO PLAZO 619

    19.6 UN MODELO COMBINADO DE REGRESIN Y SERIES DE TIEMPO PARA PRONSTICO DE TASAS DE INTERS 624

    TABLAS ESTADSTICAS 631 SOLUCIONES A PROBLEMAS SELECTOS 639

  • EJEMPLOS 1.1 Promedio de calificaciones, 10 1.2 La explosin de los litigios, 12 1.3 Precios de acciones de compaas de servicio

    pblicas, 13 2.1 Covarianza y correlacin, 24 2.2 Error cuadrtico medio, 32 2.3 Distribucin normal, 36 2.4 xito en las solicitudes de empleo, 46

    3.1 Promedio de calificaciones, 68 (continuacin) 3.2 Gastos de consumo, 72 3.3 Ventas de automviles al menudeo, 78 3.4 Promedio de calificaciones, 80 (continuacin) 3.5 Inscripcin en universidades pblicas y privadas, 80 4.1 Ventas de automviles, 89

    4.1 Ventas de automviles, 94 (continuacin) 4.2 Tasas de inters, 95 4.3 Funcin de consumo, 96 4.4 El valor de los boletos de ftbol revendidos, 104 4.5 Ventas de bienes duraderos, 106 5.1 Una funcin de costo para la industria de ahorros

    y prstamos, 124 5.2 Prediccin de precios de vinos, 125 5.3 Diferenciales de salarios, 130 5.4 Certificados de depsito, 131 5.5 Demanda de vivienda, 135 5.6 Demanda de vivienda, 138 5.7 Demanda de vivienda, 139

    6.1 Gastos de vivienda, 156 6.2 Prueba de Goldfeld-Quandt, 159 6.3 Pruebas de Breusch-Pagan y White, 162 6.4 Correccin de la heterocedasticidad, 163 6.5 Carbn bituminoso, 173 6.6 Tasas de inters, 174 6.7 Consumo agregado, 177

    7.1 Demanda de dinero, 197 7.2 El efecto de la contaminacin del aire y el crimen en

    el valor de la propiedad, 201 7.3 Prueba para error de medicin en un modelo de gasto

    pblico, 206 8.1 Pronstico de promedios de calificaciones, 221 8.2 Pronstico de tasas de inters, 222 8.3 Pronstico de tasas de inters, 226 8.4 Pronstico de la demanda de carbn, 227

    9.1 Funcin de consumo, 250 9.2 Inversin en inventario, 251 9.3 El petrleo y la economa, 255 9.4 Cul fue primero: la gallina o el huevo?, 256

    9.5 Ayuda a los estados, 260 9.6 Aplicaciones de patentes y gasto en investigacin y

    desarrollo, 268 9.7 Ayuda extranjera, 271

    10.1 Funcin de consumo, 284 10.2 Energa, clima y el valor de la vivienda residencial, 292 10.3 Prueba de la linealidad de una funcin de

    consumo, 297 10.4 Tasas de inters a largo plazo, 301 10.5 Rendimiento de acciones, 304

    11.1 Prediccin de incumplimiento de bonos, 317 11.2 Comportamiento de la votacin, 321 11.3 Votacin para un presupuesto escolar, 328 11.4 Prediccin del comportamiento de asistencia a la

    universidad, 330 11.5 Logro ocupacional, 337 11.6 Voto del Congreso sobre Medicare, 339 11.7 La demanda de escuelas pblicas, 343

    12.1 Demanda de electricidad, 368 12.2 Gasto pblico, 372 12.3 Asistencia pblica, 379 12.4 Modelo macroeconmico, 381 13.1 Modelado de la dinmica del mercado de la

    calefaccin con petrleo, 422 14.1 Modelo St. Louis, 445 14.2 Demanda de automviles, 448 14.3 Otro modelo macroeconomtrico, 450 14.4 Comportamiento dinmico del mercado del petrleo

    para la calefaccin, 455 15.1 Pronstico de las ventas de una tienda de

    departamentos, 497 15.2 Construccin residencial nueva mensual, 505 15.3 Construccin residencial nueva mensual, 508

    16.1 Tasa de inters, 526 16.2 Precios diarios de cerdos, 528 16.3 Produccin porcina, 530 16.4 Los precios de las mercancas siguen caminatas

    aleatorias?, 535 16.5 La cointegracin del consumo y el ingreso, 541 17.1 Inversin en inventario, 560 17.2 Precio del papel peridico, 568 17.3 Tasas de inters, 569 17.4 Produccin porcina, 570

    18.1 Tasas de inters, 583 18.2 Produccin porcina, 585 18.3 Pronstico de tasas de inters, 599 18.4 Pronstico de la produccin porcina, 602

    XIV

  • PREFACIO

    Las nuevas tendencias en econometra, as como los comentarios y sugerencias de una gran cantidad de usuarios de las primeras tres ediciones de este libro, nos han conducido a realizar cambios extensos en esta cuarta edicin. Hemos agregado varios temas y ejemplos nuevos y actualizado muchos de los ejemplos anteriores. Adems, hemos reestructurado el libro en cuatro partes en lugar de tres.

    En funcin del contenido del libro, la parte uno abarca temas que proporcio-nan al estudiante una comprensin bsica del modelo de regresin mltiple. El captulo 2, que expone la estadstica elemental, ha sido revisado y ampliado. Tambin se incluye material y ejemplos nuevos sobre estadstica descriptiva.

    La parte dos cubre temas sobre modelos de regresin de una sola ecuacin. El captulo 10 es nuevo, presenta un tratamiento profundo de la estimacin no lineal y de mxima verosimilitud. La adicin de este captulo refleja la creciente importancia de estos temas en aos recientes. El captulo 10 tambin contiene una seccin nueva sobre la estimacin y uso de los modelos Arch y Garch, los cuales han encontrado muchas aplicaciones en las finanzas y la macroecono-ma. Otros cambios importantes en la parte dos es que se incluye material nuevo sobre pruebas para heterocedasticidad en el captulo 6 y la seccin sobre el uso de los datos de panel en el captulo 9.

    La parte tres del libro se concentra en los modelos de ecuaciones mltiples. Adems de contener ejemplos nuevos y actualizados, se ha revisado gran parte de la exposicin y hemos incluido un pequeo modelo macroeconmico especi-ficado y estimado de nuevo (construido por Michael Donahue del Colby Colle-ge) en el apndice 14.1.

    En la parte cuatro se incluye una exposicin revisada y actualizada de los anlisis de series de tiempo. El captulo 18 combina dos captulos de la tercera edicin, el primero sobre estimacin y el segundo sobre pronstico con modelos de series de tiempo.

    xv

  • XVi PREFACIO

    Como en la edicin anterior, los datos para muchos de los ejemplos se han incluido en el texto mismo o en el Manual del maestro. Acompaando a esta edicin, proporcionamos un disquet con los datos de los ejemplos. El Manual del maestro contiene las respuestas a todas las preguntas planteadas al final de los captulos. Todas las preguntas empricas se relacionan con los conjuntos de datos proporcionados en el texto y en el Manual del maestro, adems de incluirse en el disquet, de modo que los maestros puedan usar en forma directa las tareas en sus cursos.

    Al elaborar este libro para la cuarta edicin, nos hemos beneficiado mucho de los comentarios y crticas de nuestros colegas y estudiantes al igual que de las sugerencias que nos hicieron una gran variedad de personas. Agradecemos a Steven Dietrich y Annette Hall, quienes nos ayudaron a planear y editar la primera edicin; a Bonnie Lieberman y Susan Norton, quienes ayudaron con la segunda edicin, y a Scolt Stratford, quien inspir nuestro trabajo para la tercera edicin. Lucille Sutton y sus asociados en McGraw-Hill han sido de gran ayuda en la preparacin de esta cuarta edicin.

    No nos es posible agradecer a todas las personas que nos proporcionaron ayuda con esta nueva edicin, pero deseamos agradecer en especial a Sergio Schmukler, quien nos ayud a redactar de nuevo y actualizar muchos de los ejemplos; a Michael Donahue, quien elabor el nuevo modelo macroeconmico que aparece en el apndice del captulo 14, y a Jeanette Sayre y Lynn Steele, por proporcionar un valioso apoyo editorial y administrativo. Tambin deseamos dar las gracias a nuestros colegas Ernst Berndt, Bronwyn Hall, Paul Ruud y Thomas Stoker por ofrecernos numerosos comentarios y sugerencias tiles.

    Tambin deseamos agradecer a los revisores que nos orientaron durante la planeacin y elaboracin de la cuarta edicin; Walter Park de la American University; Houson Stokes de la University of Illinois-Chicago; William Parke de la University of North Carolina, Chapel Hill; Walter Mayer de la University of Mississippi; Mukhtar M. Al de la University of Kentucky; Tom Taylor de la Wright State University; Cari Moody del College of William and Mary; David Selover de la Wesleyan University; Steven Hansen de la Western Washington University. Adems, debemos mencionar a algunas de las personas que han establecido correspondencia con nosotros, sugiriendo muchos cambios y mejo-ras para el libro. Nos referimos a Imad Al-Akhdar del Central Bank of Jordn; Walter Bell de la Princeton University; Christiaan Heij y Marius Ooms de la Universidad Erasmo en Rotterdam; Hiroyuki Kawakatsu de la University of California en Irvine, California; Huston McCulloch de la Ohio State University; Jeffrey Perloff de la University of California en Berkeley; Roben Rycroft del Mary Washington College; Sergio Schmukler de Berkeley, California, y Kenneth White de la University of British Columbia.

    Tambin nos gustara extender nuestro agradecimiento a Data Resources Incorporated, subsidiaria de McGraw-Hill, Inc., por poner a nuestra disposicin su base de datos Citibase para el desarrollo de muchos de nuestros ejemplos, a David Lilien y Quantitative Micro Software de Irvine, California, por permitir-nos usar el programa de software EVIEWS, y a Bronwyn Hall y TSP Internatio-nal por su oferta comparable de su programa PC-TSP.

  • PREFACIO XVii

    El Manual del maestro se actualiz a partir de la tercera edicin. Se encuen-tran disponibles dos guas en software: el manual EVIEWS de Hiroyuki Kawakatsu y el manual TSP de Sergio Schmukler. Estas guas en software, al igual que el Manual del maestro, pueden obtenerse en forma directa en McGraw-Hill.

    Robert S. Pindyck Daniel L. Rubinfeld

  • INTRODUCCIN

    Las personas que pretendan predecir el futuro sern consideradas alborotadoras bajo la subdivisin 3, seccin 901 del cdigo criminal, y se harn acreedoras a una multa de 250 dlares y lo seis meses de prisin.

    Seccin 889, Cdigo de Procedimientos Penales del Estado de Nueva York. Este libro es una introduccin a la ciencia y el arte de construir y usar modelos. Al contrario de las leyes penales de Nueva York, dirigidas a aquellos que preten-dan predecir con bolas de cristal, creemos que estos modelos pueden ser una herramienta de pronstico muy til. La ciencia de la construccin de modelos consiste de un conjunto de herramientas cuantitativas que se usan para cons-truir y luego probar representaciones matemticas del mundo real. La elabora-cin y uso de estas herramientas se incluyen bajo el encabezado temtico de la econometra. El arte de construir modelos es, por desgracia, difcil de describir con palabras, pues consiste principalmente de juicios intuitivos que se hacen durante el proceso de modelado. En vista de que no hay reglas definidas para hacer estos juicios, el arte de la construccin de modelos tambin puede ser difcil de dominar. No obstante, uno de los propsitos de este libro es transmitir la naturaleza de este arte. Esto se lograr en parte con ejemplos y exposiciones de la tcnica, pero tambin alentando a los lectores a construir sus propios modelos.

    El libro se centra en modelos de procesos que se producen, en general, en el comercio, la economa y las ciencias sociales. Estos modelos de procesos pueden incluir modelos de actividad econmica agregada, las ventas de una empresa individual o un proceso poltico. Como podra esperarse, pueden usarse y a menudo se han usado muchos tipos de modelos para pronstico y anlisis de polticas. Este libro no intenta abarcar el espectro de los tipos de modelos y metodologas de modelado; en lugar de ello, se concentra en modelos que pue-den expresarse en forma de ecuacin, relacionando variables en forma cuanti-

    xix

  • XX INTRODUCCIN

    tativa. Entonces, se usan los datos para estimar los parmetros de la ecuacin o ecuaciones, y las relaciones tericas se prueban en forma estadstica. Esto an deja una gama bastante amplia de modelos de donde escoger. En un extremo de esta gama podra determinarse el efecto de polticas monetarias alternativas en el comportamiento de la economa estadounidense, construyendo un modelo economtrico grande de ecuaciones mltiples de la economa y luego simularlo usando diferentes polticas monetarias. El modelo resultante sera bastante complicado y supondra explicar una estructura compleja en el mundo real. En el otro extremo de la gama podra desearse pronosticar el volumen de ventas de una empresa y, creyendo que dichas ventas siguen un patrn cclico fuerte, usar un modelo de series de tiempo para extrapolar a partir del comportamiento pasado de las ventas.

    Esta gama de modelos es el tema de este libro y el objetivo es dar al lector alguna comprensin de la ciencia y arte de determinar qu tipo de modelo cons-truir -el ms apropiado-, probar el modelo en forma estadstica y luego aplicarlo a problemas prcticos en pronstico y anlisis.

    1 POR QU MODELOS?

    Muchos de nosotros a menudo usamos o hacemos pronsticos de una forma u otra. Pocos de nosotros reconocemos, sin embargo, que alguna clase de estruc-tura lgica o modelo, est implcita en cada pronstico. Considere, por ejemplo, que un corredor de bolsa le dice que el Promedio Industrial Dow Jones se ele-var el prximo ao. El corredor de bolsa puede haber hecho este pronstico debido a que el promedio Dow Jones se ha elevado durante los aos anteriores y el corredor siente que sea lo que sea que ha hecho que aumente continuar hacindolo en el futuro. De manera alternativa, el sentimiento de que el Dow Jones se elevar el prximo ao puede resultar de una creencia de que esta variable est vinculada con un conjunto de variables econmicas y polticas a travs de una serie de relaciones compleja. El corredor de bolsa puede creer, por ejemplo, que el promedio Dow Jones est relacionado, de cierta manera, con el producto interno bruto y con las tasas de inters, de modo que dadas otras creencias acerca del comportamiento futuro ms probable de esas variables, parecera probable un incremento en el promedio Dow Jones.

    Si tenemos que encontrar una palabra para describir el mtodo por el que nuestro corredor de bolsa hizo este pronstico, es probable que dijramos que fue intuitivo, aunque la cadena de razonamiento difiri de manera considerable en los dos casos citados antes. Pero en cada caso estaba involucrada alguna forma implcita de construccin de modelo. Un corredor de bolsa que ha basado el pronstico optimista para el promedio Dow Jones en incrementos anteriores en efecto ha construido un modelo de series de tiempo que extrapola tendencias pasadas al futuro. Si, en lugar de ello, el pronstico estaba basado en un cono-cimiento de la economa, an estara involucrado de manera implcita un mode-lo; estara compuesto de las relaciones que fueron concebidas en forma vaga en la mente del corredor de bolsa como resultado de su experiencia pasada.

  • INTRODUCCIN XXi

    Por tanto, incluso un pronosticador intuitivo construye algn tipo de mode-lo, quiz sin percatarse de que lo hace. Por supuesto, es razonable preguntar por qu uno podra querer trabajar con un modelo explcito para producir pro-nsticos? Valdra la pena, por ejemplo, que nuestro corredor de bolsa leyera este libro para construir un modelo explcito, estimarlo y probarlo en forma estadstica? Nuestra respuesta es que hay varias ventajas en trabajar con mode-los de manera explcita. Construir modelos obliga al individuo a pensar con claridad y explicar todas las interrelaciones importantes implicadas en un pro-blema. Fiarse de la intuicin puede ser peligroso a veces debido a la posibilidad de que se ignoren o se usen de manera inapropiada relaciones importantes. Adems, es importante que las relaciones individuales sean validadas de alguna manera. Por desgracia, generalmente no se hace esto cuando se realizan prons-ticos intuitivos. Sin embargo, en el proceso de construir un modelo, una persona debe validar no slo el modelo en conjunto sino tambin las relaciones indivi-duales que forman el modelo.

    Al hacer un pronstico, tambin es importante proporcionar una medida de la precisin que esperamos del pronstico. El uso de mtodos intuitivos, por lo general, impide cualquier medida cuantitativa de confianza en el pronstico resultante. El anlisis estadstico de las relaciones individuales que forman un modelo, y del modelo como un conjunto, hace posible adjuntar una medida de confianza a los pronsticos del modelo.

    Una vez que se ha construido un modelo y se ha adecuado a los datos, puede usarse un anlisis de sensibilidad para estudiar muchas de sus propiedades. En particular, pueden evaluarse los efectos de cambios pequeos en variables indi-viduales en el modelo. Por ejemplo, en el caso de un modelo que describe y predice tasas de inters, uno podra medir el efecto en una tasa de inters par-ticular de un cambio en el ndice de inflacin. Este tipo de estudio de sensibili-dad slo puede realizarse si el modelo est en forma explcita.

    2 TIPOS DE MODELOS

    En este libro se examinan tres clases generales de modelos que pueden cons-truirse para propsitos de pronstico o anlisis de polticas. Cada una implica un grado diferente de complejidad de modelo y supone un nivel diferente de com-prensin acerca de los procesos que uno est tratando de modelar.

    Modelos de series de tiempo En esta clase de modelos suponemos no saber nada sobre la causalidad que afecta a la variable que estamos tratando de pronosticar. En lugar de ello, examinamos el comportamiento pasado de una serie de tiempo a fin de inferir algo acerca de su comportamiento futuro. Cada mtodo usado para producir un pronstico puede implicar el uso de un modelo determinista simple como una extrapolacin lineal o el uso de un modelo esto-cstico complejo para pronstico adaptable.

    Un ejemplo del uso del anlisis de series de tiempo sera una extrapolacin simple de una tendencia pasada en la prediccin del crecimiento de la pobla-

  • XXii INTRODUCCIN

    cin. Otro ejemplo puede ser la elaboracin de un modelo estocstico lineal complejo para nmero de pasajeros en una lnea area. Los modelos de series de tiempo se han usado para el pronstico de la demanda de capacidad para la aerolnea, la demanda telefnica estacional, el movimiento de las tasas de inte-rs a corto plazo y otras variables econmicas. Estos modelos tambin son tiles en particular cuando se sabe poco acerca del proceso subyacente que uno est tratando de pronosticar. La estructura limitada de los modelos de series de tiem-po los hace confiables slo a corto plazo, pero no obstante son bastante tiles.

    Modelos de regresin de una sola ecuacin En esta clase de modelos la variable bajo estudio es explicada por una funcin nica (lineal o no lineal) de un nmero de variables explicativas. La ecuacin a menudo ser dependiente del tiempo (es decir, el ndice de tiempo aparecer de manera explcita en el modelo), de modo que uno puede predecir la respuesta a travs del tiempo de la variable bajo estudio ante los cambios en una o ms de las variables explica-tivas.

    Un ejemplo de un modelo de regresin de una sola ecuacin podra ser una ecuacin que relacione una tasa de inters particular, como la tasa de un bono de Tesorera a tres meses, con un conjunto de variables explicativas como la oferta de dinero, el ndice de inflacin y la tasa de cambio en el producto interno bruto.

    Modelos de ecuaciones mltiples En estos modelos la variable que se va a estudiar puede ser una funcin de diversas variables explicativas, las cuales ahora son relacionadas entre s al igual que la variable bajo estudio por medio de un conjunto de ecuaciones. La construccin de un modelo de ecuaciones mltiples comienza con la especificacin de un conjunto de relaciones indi-viduales, cada una de las cuales es ajustada a los datos disponibles. La simula-cin es el proceso de resolver estas ecuaciones simultneamente sobre algn intervalo.

    Un ejemplo de un modelo de ecuaciones mltiples sera un modelo completo de la industria textil estadounidense que contiene ecuaciones que explican variables como la demanda textil, la produccin textil, el empleo de trabajadores de produccin en la industria textil, la inversin en la industria y los precios textiles. Estas variables se relacionaran entre s y con otras variables (como el ingreso nacional total, el ndice de precios al consumidor y las tasas de inters) por medio de un conjunto de ecuaciones lineales o no lineales. Dadas las supo-siciones acerca del comportamiento futuro del ingreso nacional, las tasas de inters, etc., uno podra simular este modelo en el futuro y obtener un prons-tico para cada una de las variables del modelo. Un modelo como ste puede usarse para analizar el impacto en una industria de los cambios en variables econmicas externas.

    Los modelos de ecuaciones mltiples explican mucho la estructura del pro-ceso real que se est estudiando. Es decir, no slo se especifican relaciones individuales, el modelo tambin explica la interaccin de todas estas interrela-ciones. Por tanto, un modelo de cinco ecuaciones en realidad contiene ms

  • INTRODUCCIN XXiii

    informacin que la suma de cinco ecuaciones de regresin individuales. Esto es, el modelo no slo explica las cinco relaciones individuales sino tambin descri-be la estructura dinmica implicada por la operacin simultnea de estas rela-ciones.

    La eleccin del tipo de modelo a elaborar implica hacer intercambios entre tiempo, energa, costos y la precisin deseada del pronstico. La construccin de un modelo de simulacin de ecuaciones mltiples puede requerir grandes gastos de tiempo y dinero. Las ganancias de este esfuerzo pueden incluir una mejor comprensin de las relaciones y estructura involucrada al igual que la capacidad para hacer un mejor pronstico. Sin embargo, en algunos casos estas ganancias pueden ser lo bastante pequeas para ser superadas por los grandes costos im-plicados. Debido a que el modelo de ecuaciones mltiples necesita una buena cantidad de conocimiento sobre el proceso que se est estudiando, la construc-cin de estos modelos puede ser extremadamente difcil.

    La decisin de construir un modelo de series de tiempo, por lo general, ocurre cuando se sabe poco o nada sobre los determinantes de la variable que se est estudiando, cuando se dispone de una gran cantidad de puntos de datos y cuando el modelo se va a usar en gran medida para pronsticos a corto plazo. Sin embargo, dada alguna informacin sobre los procesos relacionados, puede ser razonable que un pronosticador construya ambos tipos de modelos y compare su desempeo relativo.

    3 QU CONTIENE EL LIBRO

    El libro est dividido en cuatro partes, cada una de las cuales contiene una clase diferente de modelos. La clase ms fundamental, expuesta en la primera y se-gunda partes del libro, es el modelo de regresin de una sola ecuacin. Estos mtodos economtricos elaborados y usados para construir modelos de regre-sin de una sola ecuacin encontrarn aplicacin, con modificaciones, en la construccin de los modelos de ecuaciones mltiples y los modelos de series de tiempo.

    Los captulos 1 y 2 inician la parte uno con una introduccin a los conceptos bsicos del anlisis de regresin y una revisin de la estadstica elemental. Lue-go se desarrolla en detalle el modelo de regresin, comenzando con un modelo de dos variables en el captulo 3 y procediendo hasta el modelo de regresin mltiple en el captulo 4.

    El captulo 5 da comienzo a la parte dos, continuando el desarrollo del captulo 4 de las pruebas y procedimientos estadsticos que pueden usarse para evaluar un modelo de regresin. En las tcnicas de estimacin usadas en el anlisis de regresin simple se requiere que se hagan ciertas suposiciones acerca de los datos y del modelo y a veces estas suposiciones no se cumplen. En los captulos 6 y 7 se inicia una exposicin de lo que puede hacerse en algunos de estos casos. El captulo 6 trata de la heterocedasticidad y la correlacin serial e incluye pruebas estadsticas para estos problemas al igual que los mtodos de estimacin que los corrigen. El captulo 7 trata del error de medicin y los erro-

  • XXiV INTRODUCCIN

    res causados por una especificacin errnea, concentrndose adems, en la ela-boracin de la tcnica de estimacin por variable instrumental y diagnsticos de la regresin.

    El captulo 8 expone el uso de un modelo de regresin de una sola ecuacin para propsitos de pronstico. El captulo no slo expone los mtodos con los que se produce un pronstico sino tambin las medidas que describen la confiabilidad de ste, como los intervalos de confianza y el error del pronstico.

    Los ltimos tres captulos en la parte dos presentan una visin ms amplia del modelo de regresin. Estos captulos son un poco ms avanzados y pueden ser omitidos por estudiantes principiantes. El captulo 9 trata de los problemas de observaciones faltantes, modelos de retraso distribuido, el uso de datos de panel y las pruebas de causalidad. El captulo 10 expone la estimacin no lineal y la de mxima verosimilitud, incluyendo los modelos Arch y Garch. El captulo 11 trata de los modelos en los que la variable que se va a explicar es de naturaleza cualitativa. En estos modelos se incluyen los modelos de probabili-dad lineal, probit, logit y de regresin censurada.

    Los fundamentos de econometra de las partes uno y dos son esenciales para la elaboracin de modelos de ecuaciones mltiples en la parte tres del libro. Esta parte comienza con un captulo sobre tcnicas de estimacin particulares para modelos de ecuaciones simultneas. ste incluye problemas de identificacin del modelo al igual que tcnicas como mnimos cuadrados en dos etapas y en tres etapas. Los captulos 13 y 14 exponen la metodologa para construir y usar modelos de ecuaciones mltiples. El captulo 13 es una introduccin a los mo-delos de simulacin en los que se incluyen una exposicin del proceso de esti-macin, mtodos para evaluar los modelos de simulacin, mtodos alternativos para estimar modelos de simulacin y enfoques generales de la construccin de modelos. El captulo 14 es de naturaleza ms tcnica y expone mtodos para analizar el comportamiento dinmico de los modelos de simulacin, adems de incluir aspectos de estabilidad del modelo, multiplicadores dinmicos y mtodos para afinar y ajustar modelos de simulacin. El captulo 14 concluye con una exposicin del anlisis de sensibilidad y de la simulacin estocstica. Se cons-truye un macromodelo pequeo de la economa estadounidense y se usa para un anlisis simple de polticas en el apndice del captulo.

    La parte cuatro de este libro est dedicada a los modelos de series de tiempo, los cuales pueden verse como una clase especial de los modelos de regresin de una sola ecuacin. Por tanto, las herramientas economtricas elaboradas en las partes uno y dos encontrarn una aplicacin extensa en la parte cuatro. Los captulos 15 y 16 dan inicio a la parte cuatro, en stos se exponen tcnicas de suavizacin y extrapolacin bsicas, introducen las propiedades bsicas de las series de tiempo aleatorias al igual que la nocin de un modelo de series de tiempo. El captulo 16 tambin expone las propiedades de las series de tiempo estacionarias y no estacionarias, la funcin de autocorrelacin, las pruebas de raz unitaria y el concepto de series de tiempo cointegradas.

    Los captulos 17 y 18 elaboran mtodos, por medio de los cuales se especi-fican, estiman y usan para el pronstico los modelos de series de tiempo. El captulo 17 cubre los modelos de series de tiempo lineales en detalle, incluyendo

  • INTRODUCCIN XXV

    modelos de promedio mvil, modelos autorregresivos, modelos mixtos y por ltimo modelos de series de tiempo no estacionarias. El captulo 18 desarrolla mtodos de regresin que pueden usarse para estimar un modelo de series de tiempo como tambin mtodos para verificacin diagnstica que pueden usarse para asegurar lo bien que se "ajusta" a los datos el modelo estimado. El captulo 18 tambin trata del clculo del pronstico con error cuadrtico medio mnimo, el error de pronstico y los intervalos de confianza del pronstico.

    El ltimo captulo de la parte cuatro se dedica por completo a ejemplos de la construccin y uso de los modelos de series de tiempo. Despus de que revi-samos el proceso de modelado, construimos modelos de diversas variables eco-nmicas y los usamos para producir pronsticos a corto plazo. Por ltimo, de-mostramos cmo pueden construirse modelos que combinen series de tiempo con anlisis de regresin.

    4 USO DE HERRAMIENTAS MATEMTICAS

    Este libro est escrito en un nivel bastante elemental, y puede ser comprendido por lectores con un conocimiento limitado de clculo y sin conocimiento del lgebra matricial. Las derivaciones y pruebas matemticas, por lo general, se reservan para los apndices o se suprimen por completo. En las partes uno y dos del libro, la elaboracin del modelo de regresin en forma matricial se incluye en los apndices. Por tanto, la mayor parte del libro, si no es que todo, deber ser accesible para los estudiantes de licenciatura avanzados como para los estudian-tes graduados.

    Es deseable que el lector tenga algunos antecedentes de estadstica. Aunque el captulo 2 contiene una revisin breve de probabilidad y estadstica, un estu-diante sin estos antecedentes puede encontrar algunas dificultades en algunas partes del libro. De manera tpica, este libro se usara en un curso de econome-tra aplicada o de pronstico comercial que un estudiante podra tomar despus de terminar un curso introductorio de estadstica.

    5 USOS ALTERNATIVOS DEL LIBRO

    El libro tiene el propsito de tener un espectro amplio de usos. Estos usos en los planes de estudio incluyen un curso de licenciatura o introductorio de posgrado sobre econometra y un curso de licenciatura o de posgrado en pronstico de negocios. Adems, este libro puede ser de valor considerable como libro de re-ferencia para personas que hacen anlisis estadsticos de datos econmicos y comerciales o para el cientfico social o analista de negocios interesados en la aplicacin de modelos de simulacin dinmica para pronstico o anlisis de polticas.

    La cobertura en un curso introductorio de econometra o de pronstico de negocios depender en alguna medida, por supuesto, de los antecedentes de los estudiantes y las metas del maestro. El nfasis en el uso de tcnicas econom-tricas con el propsito de pronosticar proporcionar un enfoque, pero se dispone

  • XXVi INTRODUCCIN

    de otras alternativas. A continuacin enumeramos varios usos alternativos del libro, pero enfatizamos que por la variedad del material se deja una buena can-tidad a criterio del maestro.

    1. Econometra para licenciatura (un semestre) a) Estndar

    Parte uno: captulos 1 a 4 Parte dos: captulos 5 a 7; porciones de los captulos 8 a 11 opcionales

    b) nfasis en la simulacin Parte uno: captulos 1 a 4 Parte dos: captulos 5, 6, 8 Parte tres: captulos 12 a 14 Ambos cursos omitiran todos los apndices de matrices.

    2. Primer ao de posgrado en econometra a) Un semestre

    Parte uno: captulos 1 a 4 Parte dos: captulos 5, 6, 8; captulos 9 a 11 opcionales Parte tres: captulos 12 a 14 Fragmentos de lo anterior y los apndices pueden ser opcionales.

    b) Dos semestres Parte uno: captulos 1 a 4 Parte dos: captulos 5 a 11 Parte tres: captulos 12 a 14 Parte cuatro: captulos 15 a 17; algunas secciones del captulo 17 a 19 opcionales El nfasis en la simulacin y/o el anlisis de series de tiempo dependera del inters del maestro.

    3. Pronstico de negocios (posgrado o estudiantes de licenciatura avanzados) a) Un semestre

    Parte dos: captulo 8 ms una revisin de los captulos 1 a 7 Parte tres: captulos 13, 14 Parte cuatro: captulos 15 a 19 (fragmentos seleccionados)

    b) Dos semestres Parte uno: captulos 1 a 4 Parte dos: captulos 5 a 8 Parte tres: captulos 12 a 14 Parte cuatro: captulos 15 a 19

    4. Mtodos cuantitativos para el anlisis de polticas a) Licenciatura, un semestre

    Parte uno: captulos 1 a 4 Parte dos: captulos 5 a 8 Parte tres: captulos 13, 14

    b) Posgrado, un semestre Parte uno: captulos 1 a 4 Parte dos: captulos 5 a 8 Parte tres: captulos 12 a 14

  • INTRODUCCIN XXVii

    c) Posgrado, dos semestres Parte uno: captulos 1 a 4 Parte dos: captulos 5 a 8; captulos 9 a 11 opcionales Parte tres: captulos 12 a 14 Parte cuatro: captulos 15 a 19

    El libro tambin puede ser usado para cursos sobre modelado cuantitativo en ciencias sociales (como se ensea en los departamentos de sociologa o cien-cias polticas). Es probable que un curso as que use este libro como texto abar-cara la mayor parte de las partes uno a tres.

    6 QU DISTINGUE A ESTE LIBRO DE OTROS?

    La mayor parte de los libros de texto sobre econometra elaboran el modelo de regresin de una sola ecuacin como una entidad autnoma y aislada. El lector a menudo infiere que los modelos de regresin estadstica son algo distintos e independientes de otros aspectos del modelado, as como el anlisis de la estruc-tura dinmica del modelo y el uso de anlisis de series de tiempo para pronos-ticar una o ms variables exgenas en el modelo. Por supuesto que ste no es el caso. Al elaborar un modelo de ecuacin mltiple, por ejemplo, uno debe estar informado no slo de los mtodos de regresin sino tambin acerca de la forma en que el comportamiento dinmico de un modelo resulta de la interaccin de sus ecuaciones individuales.

    Creemos que esta amplitud en la cobertura es deseable. Las tcnicas de simulacin y de series de tiempo que forman las partes tres y cuatro de este libro, por lo general, slo son presentadas en un nivel avanzado. Sentimos que la ventaja de este libro es que la cobertura es amplia e incluye estas tcnicas avanzadas pero est presentado en un nivel que puede ser comprendido y apre-ciado por un estudiante principiante.

  • PARTE

    UNO LOS FUNDAMENTOS

    DEL ANLISIS DE REGRESIN

    La parte uno de este libro trata de los conceptos ms bsicos del modelado economtrico, centrndose en los modelos de regresin de una sola ecuacin, los cuales son simples en la forma, pero bastante poderosos en funcin de la variedad de sus posibles aplicaciones en los negocios y la economa. En estos modelos, la variable bajo estudio se considera una funcin lineal de diversas variables explicativas. Los modelos de regresin de una sola ecuacin son im-portantes, no slo porque pueden usarse para probar hiptesis y para pronosti-car, sino tambin debido a que forman la base para el anlisis de modelos de ecuaciones simultneas y modelos de series de tiempo.

    En el captulo 1 se exponen los conceptos elementales de ajuste de curvas y la nocin de mnimos cuadrados. El captulo 2 contiene una revisin extensa de las ideas estadsticas bsicas que son necesarias para los anlisis que siguen. En el captulo 3 el modelo de dos variables se usa como un medio para enfocarse en las propiedades estadsticas que son necesarias para las estimaciones de par-metros de regresin. Este captulo pone nfasis en la prueba de hiptesis y en la medicin de la bondad de ajuste. El captulo 4 extiende el modelo de regresin al caso de variables mltiples. La presencia de ms de una variable explicativa en el modelo de regresin conduce a problemas economtricos adicionales, in-cluyendo la multicolinealidad que afecta la interpretacin de los coeficientes de regresin. Tambin se comentan las estadsticas de regresin adicionales que ayudan con estos problemas.

    1

  • CAPTULO

    1 INTRODUCCIN AL MODELO

    DE REGRESIN

    En este captulo comenzamos nuestra exposicin de la econometra con el mo-delo de regresin lineal de dos variables. En la primera seccin, se comenta el ajuste de la curva usando un ejemplo basado en los promedios de calificaciones de los estudiantes. Se presenta el criterio de mnimos cuadrados para el ajuste de la curva y se compara con varios esquemas alternativos para este ajuste. En la segunda seccin derivamos el procedimiento de estimacin de mnimos cua-drados. El captulo concluye con tres aplicaciones elementales de la tcnica de regresin de mnimos cuadrados.

    1.1 AJUSTE DE CURVA Los datos que resultan de la medicin de variables pueden provenir de cualquier cantidad de fuentes y en diversas formas. Los datos que describen el movimien-to de una variable a lo largo del tiempo son llamados datos de series de tiempo y pueden ser diarios, semanales, mensuales, trimestrales o anuales. Los datos que describen las actividades de personas individuales, empresas u otras unidades en un punto dado en el tiempo son llamados datos de corte transversal. Estos datos pueden ser empleados, por ejemplo, en un estudio de mercado que tiene que ver con los gastos familiares en un tiempo dado. Tambin podran usarse para examinar un grupo de declaraciones de contabilidad comercial, con el pro-psito de estudiar patrones de comportamiento entre empresas individuales en una industria. Los datos combinados, los cuales combinan datos de series de tiem-po y de corte transversal, pueden usarse para estudiar el comportamiento de un grupo de empresas a lo largo del tiempo.

    3

  • 4 PARTE UNO: Los fundamentos del anlisis de regresin

    CUADRO 1.1 PROMEDIO DE CALIFICACIONES E INGRESO FAMILIAR

    Y X(promedio de calificaciones) (ingreso de los padres en miles de dlares)

    4.0 21.03.0 15.03.5 15.02.0 9.03.0 12.03.5 18.02.5 6.02.5 12.0

    Supngase que estamos interesados en la relacin entre dos variables X y Y. Para describir esta relacin de manera estadstica necesitamos un conjunto de observaciones para cada variable y una hiptesis que exponga la forma matem-tica explcita de la relacin. El conjunto de observaciones se llama muestra} Nos interesaremos inicialmente en el caso en que se supone que la relacin entre X y y es lineal, es decir, descrita por una lnea recta. Dada la linealidad, nuestro objetivo es especificar una regla por la que pueda determinarse la "mejor" lnea recta que relacione a X y Y.

    Por ejemplo, supngase que deseamos probar la hiptesis de que el prome-dio de calificaciones de un estudiante puede explicarse por el ingreso econmico de sus padres. Se obtuvieron (hipotticamente) ocho puntos mustrales que se describen en el cuadro 1.1. y se colocaron en una grfica como un diagrama de dispersin en la figura 1.1. Pueden elegirse muchas lneas rectas para ajustar los puntos, una de ellas podra conectar los puntos del valor menor de X con el valor mayor de X (lnea l1), o se podra dibujar una lnea punteada que parezca ajus-tarse a la dispersin completa de puntos (lnea l2). Un procedimiento mejor podra ser elegir una lnea de modo que la suma de las distancias verticales (positiva y negativa) de los puntos en la grfica a la lnea sea cero. (Estas dis-tancias, conocidas como desviaciones, se muestran en la figura 1.2). Este criterio asegurara que a las desviaciones que son iguales en magnitud e iguales en signo se les da igual importancia. Por desgracia, este procedimiento tiene la propiedad indeseable de que las desviaciones que son iguales en tamao pero de signo opuesto se cancelan, y como resultado, se podra encontrar una lnea (o ms de una, respecto a eso) que tenga una suma de desviaciones igual a cero pero que no se ajuste a los datos como se pretende.

    Se puede mejorar este mtodo si minimizamos el valor absoluto de las des-viaciones de los puntos mustrales de la lnea ajustada. Aqu est implcito el juicio de que la importancia de la desviacin es proporcional a su magnitud. Aunque la minimizacin de la suma de las desviaciones absolutas es atractiva,

    1 Los datos de una muestra son observaciones que se han elegido de una poblacin subyacente, la cual representa la relacin verdadera bajo estudio.

  • CAPITULO 1: Introduccin al modelo de regresin 5

    Figura 1.1 Diagrama de dispersin.

    sufre de varias desventajas. La primera es que el procedimiento es difcil desde el punto de vista del clculo. Tambin podra ser que las desviaciones grandes sern tratadas con una atencin relativamente mayor que las desviaciones pe-queas. Por ejemplo, es probable que una prediccin que implique un error de dos unidades se considerara peor que una prediccin que implicara dos errores de una unidad cada uno.

    Existe un procedimiento cuyo clculo es simple y que penaliza relativamen-te ms los errores grandes que los errores pequeos. ste es el mtodo de mni-

    Figura 1.2 Desviaciones.

  • PARTE UNO: Los fundamentos del anlisis de regresin

    mos cuadrados. El criterio de mnimos cuadrados es el siguiente: Se dice que la "lnea de mejor ajuste" es aquella que minimiza la suma de las desviaciones al cuadrado de los puntos de la grfica desde los puntos de la lnea recta (con distancias medidas en

    forma vertical). Veremos en los dos captulos siguientes que los mnimos cua-drados tambin son convenientes porque permiten realizar pruebas estadsticas.

    En este libro nos basaremos mucho en el procedimiento de mnimos cua-drados, pero tambin hay otras tcnicas de estimacin que son factibles y en ocasiones deseables. Podemos ver cmo los mnimos cuadrados se relacionan con algunas de estas tcnicas alternativas observando la figura 1.3a y b. En la figura 1.3a se presenta la grfica de la desviacin de un punto de los datos desde la lnea recta en el eje horizontal y la "prdida" asociada con esta desviacin en el eje vertical. Con los mnimos cuadrados, la prdida asociada con cada desvia-cin individual es esa desviacin al cuadrado. Con la estimacin del valor abso-luto mnimo, la prdida es el valor absoluto de la desviacin. Las funciones de prdida asociadas con los mnimos cuadrados y con los valores absolutos mni-mos, son simtricas con respecto al signo de la desviacin, pero la funcin de prdida de mnimos cuadrados penaliza ms las desviaciones grandes que la funcin de prdida del valor absoluto mnimo.

    Un problema con los mnimos cuadrados ocurre cuando hay una o ms desviaciones grandes. Supngase que se cometi un error de reporte con respec-to al promedio de calificaciones del primer estudiante, habindose reportado

    Figura 1.3 a) Funcin de prdida b) funcin de prdida alternativa.

    a)

    Prdida

  • CAPTULO 1: Introduccin al modelo de regresin 7

    una calificacin de 1.0 en lugar de la cifra correcta de 4.0. Si la lnea l2 en la figura 1.1 fuera considerada como una posible lnea de mnimos cuadrados, la desviacin asociada con el primer punto de los datos sera muy grande y la desviacin al cuadrado sera an ms grande. La recta de mnimos cuadrados de mejor ajuste cambiara en forma considerable, es decir, su pendiente se hara ms plana. La penalidad grande asociada con los mnimos cuadrados ha forzado al procedimiento de estimacin a poner mayor nfasis en la relacin entre la lnea recta y el primer punto de los datos. El resultado es que la pendiente (y el intercepto) de la recta de mnimos cuadrados es muy sensible a los puntos que se encuentran lejos de la verdadera lnea de regresin. Llamamos puntos atpicos a aquellos puntos que estn a ms de una cierta distancia de la lnea de regre-sin. Por supuesto, los puntos atpicos pueden representar informacin impor-tante acerca de la relacin entre diversas variables, por tanto, nunca deben desecharse sin un mayor anlisis. El examen cuidadoso de los puntos atpi-cos puede ayudarnos a encontrar errores, en cuyo caso puede hacerse una co-rreccin.

    Qu puede hacerse con respecto a la sensibilidad de los mnimos cuadrados con los puntos atpicos? La solucin ms simple es volver a calcular la recta de mnimos cuadrados eliminando el punto atpico. Al reportar tanto la pendiente de mnimos cuadrados original como la nueva y las intersecciones, podemos determinar la sensibilidad de nuestros resultados ante la presencia de pun-tos atpicos. Debido a que la decisin es arbitraria respecto a cules son puntos atpicos, un procedimiento mejor colocara relativamente menos peso en las desviaciones grandes. Un ejemplo de este procedimiento se da en la figura 1.3b, en la cual se muestra una funcin de prdida que es menos sensible a los puntos atpicos que los mnimos cuadrados o el valor absoluto mnimo.

    1.2 DERIVACIN DE MNIMOS CUADRADOS El propsito de construir relaciones estadsticas es, por lo general, predecir o explicar los efectos de una variable resultante de los cambios en una o ms variables predictoras o explicativas. Para la dispersin de puntos en la figura 1.1, podemos escribir la ecuacin lineal Y = a + bX, donde Y, la variable de la izquier-da, es llamada variable dependiente y X, la variable de la derecha, es llamada variable independiente. Debido a que se trata de explicar o predecir movimientos en Y, es natural elegir como nuestro objetivo la minimizacin de la suma vertical de las desviaciones cuadrticas a partir de la recta ajustada.2

    2 En general, nuestra decisin de escribir una ecuacin en la forma Y = a + bX, en lugar de la forma inversa X = A + BY, implica que se ha hecho un juicio de que los movimientos en la variable Y son "causados" por movimientos en la variable X y no viceversa. Por tanto, en el ejemplo del promedio de calificaciones hemos asumido de manera implcita que el promedio de calificaciones es determinado por el ingreso familiar. Si revisamos nuestra opinin de la causalidad a una que esta-blezca que el ingreso familiar es determinado por el promedio de calificaciones, escribiramos la ecuacin X = A + BY y de acuerdo con esto estara nuestro criterio de ajuste de curvas. Esto es importante debido a que las dos ecuaciones generan dos rectas de regresin diferentes.

  • 8 PARTE UNO: Los fundamentos del anlisis de regresin

    Para obtener la frmula de mnimos cuadrados para calcular los valores de a y b, debemos usar algunas herramientas matemticas bsicas. Se sugiere una revisin del apndice 1.1, el cual habla acerca de las propiedades de los operadores de sumatoria y enfatizamos que no es importante que se entiendan todos los detalles sobre el uso de derivados parciales.

    El criterio de los mnimos cuadrados puede replantearse de manera formal como sigue:

    (1.1)

    donde i= a + bXi representa la ecuacin para una lnea recta con un intercepto a y pendiente b. En esta notacin Yi es el valor real de Y para la observacin i y corresponde al valor de X para esa observacin, mientras que N es el nmero de observaciones. i, llamado valor ajustado o pronosticado de Yi, es el valor de Y en la lnea recta asociado con la observacin Xi. Esto puede verse con claridad en la figura 1.4, donde la desviacin se calcula restando el valor ajustado de Yi del valor real. Es decir, para cada observacin en X, hay una desviacin correspon-diente del valor ajustado del valor real de Y. La suma de cuadrados de estas desviaciones es la que deseamos minimizar y que nos permitir (en el captulo 3) calcular una medida de lo bien que se ajusta la lnea recta a los datos.

    El problema es elegir valores para a y b que minimicen la expresin en la ecuacin (1.1). Esto puede hacerse usando clculo elemental o lgebra. Los detalles de la derivacin del clculo se estudiarn en el apndice 1.1.3 Como se muestra ah, las soluciones de mnimos cuadrados para la pendiente y el inter-cepto son:

    (1.2)

    (1.3)

    donde Y y X son las medias mustrales de Y y X, respectivamente.

    Ahora consideremos cmo las frmulas en las ecuaciones (1.2) y (1.3) se simplifican en el caso especial, donde X y Y tienen medias mustrales igual a 0. Primero, escribiendo de nuevo la ecuacin (1.3), notamos que:

    a = Y b X = 0 (1.4)

    3 Alentamos al lector a seguir la derivacin para familiarizarse ms con nuestra notacin y nuestro uso de los operadores de sumatoria.

  • CAPTULO 1: Introduccin al modelo de regresin 9 Figura 1.4 Valores ajustados.

    Por tanto, cuando las medias mustrales de X y Y son 0, el intercepto de la lnea de regresin ajustada ser 0. Para obtener la estimacin de la pendiente corres-pondiente en este caso especial, se divide tanto el numerador como el denomi-nador de la ecuacin (1.2) entre N2:

    Sustituyendo Y y X nos da

    Pero Y = X = 0 por suposicin. Por consiguiente,

    (1.5)

    El hecho de que la ecuacin (1.5) sea menos complicada que la ecuacin (1.2) sugiere que simplificar las cosas e incrementar nuestra comprensin si escri-bimos los estimadores de mnimos cuadrados en funcin de variables que son expresadas como desviaciones de sus respectivas medias mustrales, sean o no estas medias cero. Para hacer esto, transformamos los datos a forma de desviacio-nes expresando cada observacin en X y Y en trminos de desviaciones de sus respectivas medias:

    Con esta definicin, el estimador de la pendiente de mnimos cuadrados .puede obtenerse (en el caso general) directamente de la ecuacin (1.5), en vista de que las variables x y y tienen media cero.4 En efecto hemos centrado los datos mo-

    4 Por ejemplo,

  • 10 PARTE UNO: Los fundamentos del anlisis de regresin

    viendo el origen de la grfica que relaciona X y Y a la media muestral. En este caso las variables en minscula son versiones "centradas" de las variables en mayscula.

    El estimador de la pendiente de mnimos cuadrados es:

    (1.6)

    El proceso de centrado que transforma las variables en forma de desviacio-nes se describe en la figura 1.5 a y b. La lnea de regresin se representa en la grfica a usando las observaciones originales, mientras que en b se usan las desviaciones. Ntese que las pendientes estimadas de ambas lneas de regresin son idnticas. Esto es obvio a partir de la ecuacin (1.6), en vista de que slo las variables en forma de desviaciones entran en el clculo. Sin embargo, el inter-cepto de la lnea de regresin en la figura 1.5b es idnticamente igual a 0. Esto se deriva de la ecuacin (1.4) y del hecho de que x y y son iguales a 0. Por tanto, si elegimos trabajar con los datos en forma de desviaciones, se mueve el origen de la lnea de regresin a la media muestral pero no se altera la pendiente. Observe tambin que la lnea en la figura 1.5b pasa por el origen. Esto es equivalente al hecho de que la lnea en la figura 1.5a pasa por el punto de las medias ( Y , X ).

    EJEMPLO 1.1 Promedio de calificaciones En el ejemplo del promedio de calificaciones descrito en el texto, el procedi-miento de mnimos cuadrados nos permite obtener un intercepto de 1.375 y una

    Figura 1.5 Uso de la forma de desviaciones.

    Ingreso familiar (en miles de dlares)

    a) Recta de regresin original

    b) Regresin transformada x=X-13.5 y= V-3.0

  • CAPTULO 1: Introduccin al modelo de regresin 11

    pendiente de .12, produciendo la lnea = 1.375 + .12X.5 Los detalles de los clculos aparecen en el cuadro 1.2. (La lnea de regresin l2 y los puntos de los datos originales se muestran en la figura 1.2.) Para cualquier ingreso fami-liar dado X, la lnea de regresin nos permite predecir un valor para el promedio de calificaciones Y. Por ejemplo, un ingreso familiar de 12 mil dlares nos lleva-ra a un promedio de calificaciones pronosticado de = 1.375 + .12(12) = 2.815. Aunque el promedio de calificaciones pronosticado no dar necesariamente una estimacin exacta cada vez, proporcionar una buena aproximacin. Por ejem-plo, podramos notar que los dos estudiantes en la muestra original (vase el cuadro 1.1) con padres que tienen ingresos de 12 mil dlares tenan promedios de calificaciones de 3.0 y 2.5. El promedio de calificaciones pronosticado resulta encontrarse entre los dos puntos de datos reales.

    La pendiente nos dice que un cambio de mil dlares en el ingreso familiar conducira a un cambio esperado de .12 en el promedio de calificaciones. El valor positivo para la pendiente es consistente con la hiptesis de que los estu-diantes con promedios de calificaciones relativamente altos vienen de familias con ingresos relativamente altos. El intercept de 1.375 nos dice que si el ingre-so familiar fuera proyectado a cero, la mejor prediccin para el promedio de calificaciones sera 1.375. En vista de que ninguna de las familias en nuestra muestra tena un ingreso cercano a cero, no confiaremos mucho en este resul-tado.

    CUADRO 1.2

    5 A lo largo de la parte uno de este libro colocamos un "sombrero" encima de la variable depen-

    diente para denotar el valor ajustado. Relajaremos esta regla en otras partes del texto para simplificar la presentacin.

  • 12 PARTE UNO: Los fundamentos del anlisis de regresin

    El modelo de regresin lineal de dos variables se examinar con mucho mayor detalle en el captulo 3, pero es apropiado hacer aqu un comentario final. En el modelo Y = a + bX, la inclinacin b es una estimacin de dY/dX, la razn de un cambio en Y para un cambio en X Esto nos permite interpretar la pendiente de regresin en forma bastante natural. La interpretacin de el intercepto, sin embargo, depende de si se dispone de suficientes observaciones cercanas a X= 0 para producir resultados estadsticamente significativos. Si ste es el caso, se puede interpretar el intercepto como un estimado de Y cuando X = 0. Sin embargo, si no se dispone de suficientes observaciones, la interseccin tan slo es la altura de la recta de mnimos cuadrados.

    EJEMPLO 1.2 La explosin de los litigios Qu tan rpido ha crecido con el tiempo el nmero de casos presentados en los tribunales de Estados Unidos, y qu tan constante ha sido este crecimiento? Un estudio reciente proporciona informacin til sobre las tendencias en las de-mandas de derechos civiles.6 Usando datos de series de tiempo trimestrales para el periodo que comienza en el segundo trimestre de 1977 y llega al tercer trimes-tre de 1988, se estim una ecuacin de regresin que relaciona el nmero de demandas presentadas por trimestre Y, con una variable de tendencia de tiempo T, la cual se define igual a 1 en el segundo trimestre de 1977 y con un incremento de 1 en cada trimestre posterior. La ecuacin estimada es:

    = 13.00 + 51.03T

    El coeficiente de la pendiente de regresin nos dice que en efecto hay una ex-plosin, en el nmero de casos presentados incrementndose por poco ms de 51 en cada trimestre. Por supuesto, una ecuacin de regresin no es esencial para calcular este ndice de crecimiento de los litigios. Veremos en el captulo 3 que una Ventaja importante, del enfoque de la regresin, es que nos permite determinar la significacin estadstica de la estimacin de la razn de creci-miento.

    El estudio encontr que el crecimiento de los litigios no fue constante a lo largo del periodo y que este crecimiento es sensible al ciclo comercial; entre mayor es el ndice de desempleo U, es ms probable que se presenten demandas de derechos civiles. La ecuacin de regresin estimada es:

    = -144.38 + 168.91U

    6 Vase P. Siegelman y J.J. Donohue III, "The Selection of Employment Discrimination Disputes for Litigation: Using Business Cycle Effects to Test the Priest-Klein Hypothesis", Journal of Legal Studies, vol. 24, pp. 427-462, junio de 1995. Estos resultados reportados son una simplificacin del estudio, considerablemente, ms completo descrito en el artculo.

  • CAPTULO 1: Introduccin al modelo de regresin 13

    Esta ecuacin nos dice que para cada incremento del 1% en el ndice de desem-pleo, se presentaron casi 170 casos adicionales.

    EJEMPLO 1.3 Precios de acciones de compaas de servicio pblicas Como parte de un ambicioso estudio financiero corporativo, se ha planteado la hiptesis de que las razones entre precio e ingresos para las compaas de ser-vicio pblicas son influidas por sus razones entre deuda y capital contable. Esto es razonable, en vista de que uno esperara que una razn mayor entre deuda y capital contable conducira a un patrn de ingresos ms variable para una com-paa y que este riesgo aadido conducira a un precio menor de las acciones, y por tanto a una razn menor entre precio e ingresos. El modelo puede expresar-se de manera formal como:

    Y = a + bX

    donde Y= la razn entre precio e ingresos de la compaa (el precio de una accin de la reserva comn dividida entre los ingresos por accin)

    X = su razn entre deuda y capital contable (deuda a largo plazo dividi- da entre la deuda ms el capital contable)

    Esperamos que b tenga un valor negativo pero no tenemos una expectativa a priori respecto al valor del intercepto. Se obtuvieron observaciones para las variables Y y X para un corte transversal de compaas de servicio pblicas (en un punto fijo en el tiempo). El resultado de la regresin lineal es:

    = 10.2 - 4.07X

    El coeficiente de -4.07 parece confirmar la hiptesis planteada. Sin embargo, para conocer con ms detalle cunta confianza debemos tener en la hiptesis, necesitamos usar algunas de las pruebas estadsticas que se exponen en el cap-tulo 2.

    APNDICE 1.1 El uso del operador sumatoria

    Debido a que muchas proposiciones elementales en econometra implica el uso de sumas de nmeros, ser til revisar (o conocer) los signos de sumatoria. A lo largo del libro la letra griega sigma mayscula , representa la sumatoria de los valores de cada una de las observaciones para una variable. Por ejemplo, supon-

  • 14 PARTE UNO: Los fundamentos del anlisis de regresin

    gamos que X representa la variable "ingreso familiar". Entonces, usando la no-tacin con subndices, se escribe:

    X1, X2, . . . , XN

    y representan los valores tomados por cada una de las N observaciones de ingre-so familiar. Entonces el ingreso familiar total (X1 +X2 + +XN) puede representarse como

    (A1. l )

    Las siguientes reglas del operador sumatoria son tiles.

    Regla 1 La sumatoria de una constante por k veces una variable es igual a la constante por la sumatoria de esa variable.

    (A1.2)

    Regla 2 La sumatoria de la suma de observaciones en dos variables es igual a la suma de sus sumatorias.

    N N N (Xi + Yi) = Xi + Yi (Al.3) i =1 i =1 i =1

    Regla 3 La sumatoria de una constante sobre N observaciones es igual al producto de la constante por N.

    N

    k = kN (A1.4) i =1

    Usando estas tres reglas, se pueden obtener algunos resultados tiles con-cernientes a las medias, varianzas y covarianzas de variables aleatorias. En vista de que estos conceptos se exponen en forma ms completa en el captulo 2, nos restringiremos aqu a una exposicin de propiedades algebraicas (en lugar de estadsticas). Primero, definiremos que la media o promedio de N observaciones en la variable X es:

    (A1.5)

    Usando esta definicin, podemos demostrar la regla 4.

  • CAPITULO 1: Introduccin al modelo de regresin 15

    Regla 4 La sumatoria de las desviaciones de observaciones sobre X alrede-dor de su media es cero.

    N (Xi - X ) = 0 (A1.6)

    i =1

    (Vase la nota de pie de pgina 4 para la prueba.) En el texto tendremos oportunidades frecuentes para usar la forma de desviaciones. Usando letras minsculas para representar la forma de desviaciones, es decir, xi = Xi X , la regla 4 se vuelve:

    N xi = 0 (A1.7) i=1

    Ahora definimos la varianza de X como:

    (A1.8)

    y la covarianza de X y Y como:

    (A1.9)

    Usando estas definiciones y los resultados anteriores, se pueden demostrar las ltimas dos reglas de sumatorias.

    Regla 5 La covarianza entre X y Y es igual al promedio de los productos de observaciones en X y Y menos el producto de sus medias:

    (Al.10)

    PRUEBA

    y usando la regla 1, se obtiene

  • 16 PARTE UNO: Los fundamentos del anlisis de regresin

    Ahora, recordando la definicin de la media de X y la media de Y, se tiene:

    La regla 6 se deriva con facilidad de la regla 5, en vista de que se aplica al caso en el que X y Y son la misma variable.

    Regla 6 La varianza de X es igual al promedio de los cuadrados de las observaciones en X menos su media al cuadrado.

    (Al.11)

    Ntese, de manera incidental, que cuando X y Y resultan tener medias iguales a cero (como ocurre cuando son medidas como desviaciones alrededor de sus medias), las definiciones de covarianza y varianza se vuelven: (aqu se ha omi-tido el rango del ndice)

    En ciertas situaciones ser necesario usar sumatorias que se aplican a dos

    variables aleatorias, llamadas sumatorias dobles. De manera especfica, suponga-mos que Xij es una variable aleatoria que adopta N valores para cada resultado de i y j. Habr, por supuesto, N2 resultados totales. Ahora definimos la sumato- ria doble de estos N2 resultados como:

    Las siguientes dos reglas de sumatoria doble sern tiles.

  • CAPTULO 1: Introduccin al modelo de regresin 17

    Regla 7 (Al.12)

    Ntese que la sumatoria doble en la regla 7 es muy diferente de la sumatoria sencilla N i =1XiYi la cual contiene N (en lugar de N2) trminos.

    Regla 8 (A1.13)

    APNDICE 1.2 Derivacin de los estimadores de parmetros de mnimos cuadrados

    Como se estableci en el texto, nuestra meta es minimizar (Yi - i)2, donde i =a + bXi es el valor ajustado de Yi correspondiente a una observacin Xi par-ticular.

    Minimizamos la expresin tomando las derivadas parciales con respecto a a Y b, estableciendo cada una igual a 0, y solucionando el par resultante de ecuaciones simultneas:7

    (Al.14)

    (Al.15)

    Al igualar estas derivadas a cero y dividirlas entre -2, obtenemos:

    (Yi - a - bXi) = 0 (Al.16)

    Xi (Yi - a - bXi) = 0 (Al.17)

    Por ltimo, escribiendo de nuevo las ecuaciones (Al.16 y Al.17) obtenemos un par de ecuaciones simultneas (conocidas como las ecuaciones normales):

    Yi = aN + bXi (Al. 18)

    XiYi = aXi + bX 2i (Al. 19)

    7 No aparece ndice en los signos de sumatoria, pero se asume que el ndice abarca todas las observaciones 1, 2, . . . . N.

  • 18 PARTE UNO: Los fundamentos del anlisis de regresin

    Ahora se puede resolver para a y b de manera simultnea al multiplicar la ecua-cin (Al. 18) por Xi y al multiplicar la ecuacin (Al. 19) por N:

    Xi Yi = aN Xi+ b(Xi)2

    NXiYi = aN Xi + bN X 2i

    (A1.20)

    (A1.21)

    Al restar la ecuacin (Al.20) de la ecuacin (A1.21), se obtiene:

    NXiYi - Xi Yi = b[N X 2i - (Xi)2] (A1.22)

    de lo cual se desprende que

    (A1.23)

    Dado b, podemos calcular a con la ecuacin (Al. 18):

    (A1.24) EJERCICIOS 1.1 Suponga que est a cargo de una autoridad monetaria central en un pas mtico. Se le dan los siguientes datos histricos sobre la cantidad de dinero e ingreso nacional (ambos en millones de dlares):

    Cantidad Ingreso Cantidad IngresoAo de dinero nacional Ao de dinero nacional1987 2.0 5.0 1992 4.0 7.71988 2.5 5.5 1993 4.2 8.41989 3.2 6.0 1994 4.6 9.01990 3.6 7.0 1995 4.8 9.71991 3.3 7.2 1996 5.0 10.0

    a) Haga una grfica de estos puntos en un diagrama de dispersin. Luego estime la regresin del ingreso nacional Y sobre la cantidad de dinero X y haga la grfica de la recta en el diagrama de dispersin.

    b) Cmo interpreta el intercepto y la pendiente de la recta de regresin? c) Si tuviera el control nico sobre el suministro de dinero y deseara lograr un nivel

    de ingreso nacional de 12.0 en 1997, en qu nivel establecera el suministro de dinero? Explquelo.

  • CAPITULO 1: Introduccin al modelo de regresin 19

    1.2 Calcule la regresin del ingreso sobre el promedio de calificaciones en el ejemplo descrito en este captulo y comprela con la regresin del promedio de calificaciones sobre el ingreso. Por qu son diferentes estos dos resultados? 1.3 a) Suponga que se obtienen los estimadores de mnimos cuadrados para la relacin Y = a + bX. Despus de terminar el trabajo, se decide multiplicar las unidades de la variable X por un factor de 10. Qu le suceder a la pendiente e intercepto de mnimos cuadrados resultante?

    b) Generalice el resultado de la parte a) evaluando los efectos en la regresin del cambio de unidades de X y Y en la siguiente manera:

    Y* = C1 + c2Y X* = d1 + d2X

    Qu puede concluir? 1.4 Qu le sucede a la estimacin del intercepto y la pendiente de los mnimos cuadra dos cuando todas las observaciones en la variable independiente son idnticas? Puede explicar de manera intuitiva por qu ocurre esto? 1.5 Demuestre que la lnea de regresin estimada pasa por el punto de las medias (Y , X ). Pista: Muestre que Y y X satisfacen la ecuacin Y = a + bX, donde a y b son definidas en las ecuaciones (1.2) y (1.3). 1.6 Cmo interpretara el valor -144.38 del intercepto en la regresin de Y en U en el ejemplo 1.2? Explique por qu no es probable que el valor del intercepto sea de mucho inters prctico. 1.7 Para probar la sensibilidad de los estimadores de mnimos cuadrados del intercepto y la pendiente ante la presencia de puntos a tpicos, realice los siguientes clculos:

    1. Estime de nuevo la pendiente y el intercepto en el ejemplo 1.1 bajo la suposicin de que la primera observacin fue (21.0, 1.0) en lugar de (21.0, 4.0).

    2. Estime de nuevo la pendiente y el intercepto dejando fuera la primera observa-cin de la muestra.

    a) Describa cmo los estimadores de la pendiente e interceptos en 1 y 2 se compa-ran con aquellos dados en el ejemplo. Una grfica de ambas lneas rectas sera til. Por qu los estimadores de mnimos cuadrados son tan sensibles a los puntos individuales?

    b) Habiendo trazado la grfica de la lnea de mnimos cuadrados en el caso 1, concluira que el primer punto de los datos es un punto atpico? Explique.

  • CAPTULO

    2 ESTADSTICA ELEMENTAL:

    A REVISIN

    El estudio de la econometra, aun en su forma ms prctica, requiere un buen entendimiento de la estadstica. Asumimos que la mayora de nuestros lectores poseen estudios de estadstica pero puede ser que este conocimiento deba actua-lizarse. Antes de continuar el estudio de la econometra, revisaremos las ideas estadsticas que se usarn en varias etapas en el texto. Para ayudar al lector a enfocarse en ideas importantes en lugar de en los detalles, hemos colocado la mayor parte de las derivaciones en el apndice 2.1.

    2.1 VARIABLES ALEATORIAS Una variable aleatoria es una variable que toma valores alternativos, cada uno con una probabilidad menor que o igual a 1. Podemos describir una variable aleato-ria al examinar el proceso que genera sus valores. Este proceso, llamado distribu-cin de probabilidad, enumera todos los resultados posibles y la probabilidad de que ocurra cada uno. Se puede definir una variable aleatoria, como una funcin que asigna un nmero real a cada resultado de un experimento. Por ejemplo, supongamos que asignamos un valor de 1 a las caras de lanzamientos de una moneda y el valor de 0 al nmero de cruces (si usamos una moneda legal, la probabilidad de las caras ser de ). En este caso podemos interpretar el valor de los lanzamientos de una moneda como una variable aleatoria; el proceso generado por la variable aleatoria es la distribucin de probabilidad binomial.

    Es til distinguir entre variables aleatorias discretas y continuas. Una varia-ble aleatoria continua puede tomar cualquier valor en la lnea de nmeros reales, mientras que una variable aleatoria discreta slo puede tomar un nmero espec-

    20

    1 2

  • CAPTULO 2: Estadstica elemental: a revisin 21

    Figura 2.1 Densidades de probabilidad.

    fico de valores reales. La figura 2.1 ilustra las funciones de probabilidad discre-tas y continuas. Con la distribucin discreta, vemos que los valores 10 y 20 ocurren con probabilidad de .25, mientras el valor 40 se presenta con una pro-babilidad de .50. Con la distribucin continua, la probabilidad de que un valor particular se encuentre entre cualesquiera dos valores de la distribucin es de-terminada por el rea bajo la funcin de densidad continua entre esos dos valo-res. En este ejemplo, la probabilidad de que los valores de la distribucin se encuentren entre 10 y 20 es aproximadamente igual a .30, como se muestra en el rea sombreada de la figura.

    2.1.1 Valores esperados

    Las distribuciones de probabilidad, a menudo, se describen en funcin de sus medias y varianzas, las que a su vez son definidas en funcin del operador de valor esperado E. En virtud de que trabajaremos al principio con variables aleatorias discretas, entonces supongamos que X1, X2,, XN representan los N resultados posibles asociados con la variable aleatoria X. Es decir, la media o valor esperado de X es un promedio ponderado de los resultados posibles, donde las probabili-dades de los resultados sirven como los pesos apropiados. De manera especfica, la media de X, denotada x, se define por:

    (2.1)

    donde pi es la probabilidad de que ocurra Xi, pi = 1 y E( ) es el operador de valor esperado.

    El valor esperado debe distinguirse de la media muestral, la cual nos dice el promedio de los resultados obtenidos en una muestra en la que se han elegido un nmero de observaciones (por lo general al azar) de la distribucin de pro-babilidad subyacente. Denotamos la media muestral de un conjunto de resulta-dos de X por X .

  • 22 PARTE UNO: Los fundamentos del anlisis de regresin

    La varianza de una variable aleatoria proporciona una medida de la exten-sin o dispersin alrededor de la media. Es denotada por 2x , y (en el caso discreto) se define como

    (2.2)

    Por tanto, la varianza es un promedio ponderado de los cuadrados de las desvia-ciones de los resultados de X de su valor esperado, sirviendo como ponderacio-nes las probabilidades correspondientes de que cada resultado ocurra. La varianza en la ecuacin (2.2) es en s misma un valor esperado, ya que

    (2.3)

    La raz cuadrada (positiva) de la varianza se llama desviacin estndar. Hay varias propiedades del operador de valor esperado que encontraremos

    tiles, en especial al exponer las medias y varianzas de variables aleatorias. Alentamos al lector para que examine con cuidado los detalles que se describen en el apndice 2.1. Tres de los resultados principales concernientes al operador de valor esperado son los siguientes:

    Resultado 1 E(aX + b) = aE(X) + b

    donde X es una variable aleatoria y a y b son constantes.

    Resultado 2 E[(aX)2] = a2E(X 2)

    Resultado 3 Var (aX + b) = a2 Var (X)

    2.1.2 Distribuciones conjuntas de variables aleatorias

    Ser til estudiar las distribuciones conjuntas de X y una segunda variable alea-toria Y. En el caso discreto, las distribuciones conjuntas se describen con una lista de probabilidades de ocurrencia de todos los resultados posibles tanto de X como de Y. Por ejemplo, si Y es una variable aleatoria que toma el valor de 1 si el jefe de una familia tiene una educacin universitaria y de 0 si esa persona no la tiene, mientras que X es la variable del ingreso familiar descrita con anterio-ridad, entonces la distribucin conjunta de X y Y podra ser como sigue:

  • CAPTULO 2: Estadstica elemental: a revisin 23

    Ntese que todas las probabilidades son no negativas y suman 1. Como en el caso de una sola variable aleatoria, el operador de valor esperado

    es til para describir las caractersticas importantes de las distribuciones con-juntas. La covarianza de X y Y se define como el valor esperado del producto de X y Y cuando ambas son medidas como desviaciones alrededor de sus medias;

    Cov (X, Y) = E[(X - E(X))(Y - E(Y))]

    (2.4)

    donde pij representa la probabilidad conjunta de que ocurran X y Y. La covarianza es una medida de la asociacin lineal entre X y Y. Si ambas

    variables siempre estn por encima y por debajo de sus medias al mismo tiempo, la covarianza ser positiva, como en la figura 2.2b. Si X est por encima de su media cuando Y est por debajo de su media y viceversa, la covarianza ser negativa, como se muestra en la figura 2.2a. El valor de la covarianza depende de las unidades en las que sean medidas ,Y y Y. Como resultado, frecuentemente tendremos la oportunidad para usar el coeficiente de correlacin

    (2.5)

    donde x y Y representan las desviaciones estndar de X y Y, respectivamente. A diferencia de la covarianza, el coeficiente de correlacin se ha normalizado y es independiente de la escala. Puede mostrarse que el coeficiente de correlacin siempre caer entre -1 y +1. Una correlacin positiva indica que las variables se mueven en la misma direccin, mientras que una correlacin negativa implica que se mueven en direcciones opuestas.

    Figura 2.2 Covarianza.

  • 24 PARTE UNO: Los fundamentos del anlisis de regresin

    Varias de las propiedades del operador de valor esperado son tiles cuando se trata con distribuciones de probabilidad conjuntas. stas se plantean aqu y se demuestran en el apndice 2.1.

    Resultado 4 Si X y Y son variables aleatorias, E(X + Y) = E(X) + E(Y)

    Resultado 5 Var (X+Y)= Var (X) + Var (Y) + 2 Cov (X, Y)

    EJEMPLO 2.1 Covarianza y correlacin La distribucin de probabilidad conjunta del ingreso (en miles de dlares) y la educacin (en aos) para los cinco empleados de una empresa pequea es la siguiente:

    Ingreso (X) 5 10 15 20 25

    Educacin (Y) 10 8 10 15 12

    Las medias y varianzas de cada una de las variables son:

    E(X) = (5 + 10 + 15 + 20 + 25)/5 = 15 Var(X) = [(-10)2 + (-5)2 + 02 + 52 + 102]/5 = 50

    E(Y) = (10 + 8 + 10 + 15 + 12)/5 = 11

    Var(7) = [(-1)2 + (-3)2 + (-1)2 + 42 + l2]/5 = 5.6

    Entonces la covarianza entre X y Y est dada por:

    Cov(X,Y) = [(-10)(-l) + (-5)(-3) + (0)(-l) + (5)(4) + (10)(1)]/5=11

    Por ltimo, la correlacin entre X y Y es:

    p(X, Y) = ll/[(50)(5.6)]1/2 = .66

    2.1.3 Independencia y correlacin

    La probabilidad de un resultado asociado con Y, en ciertos casos, no estar relacionado con el resultado asociado con X y viceversa. En este caso decimos que X y Y son variables aleatorias independientes. Como un ejemplo, considrese el lanzamiento de una moneda para la cual la probabilidad de caras y la proba-bilidad de cruces son ambas de . Ahora supngase que los primeros cinco lanzamientos son todos caras. La probabilidad de que ocurra una cruz en el sexto lanzamiento ser de y sta es independiente de los lanzamientos ante-riores.

    1 2

    1 2

  • CAPTULO 2: Estadstica elemental: a revisin 25

    Cuando dos variables son independientes, los clculos que introducen al operador de valor esperado se simplifican. La consecuencia es resumida en los resultados 6 y 7 para el operador de valor esperado, los cuales se demuestran en el apndice 2.1.

    Resultado 6 Si X y Y son independientes, E(XY) = E(X)E(Y).

    Resultado 7 Si X y Y son independientes, Cov (X, Y) = 0.

    El resultado 7 establece que si dos variables aleatorias son independientes, la covarianza entre ellas es 0. Esto tiene sentido de manera intuitiva, debido a que la independencia de X y Y significa que, no hay relacin entre los resultados de una variable y los resultados de la otra variable. Si no hay relacin, espera-ramos que las desviaciones en X alrededor de su media no estuvieran relaciona-das con las desviaciones en Y. Es importante observar, sin embargo, que el resultado no se sostiene en la direccin opuesta. Dos variables pueden tener una covarianza de cero, pero puede haber dependencia entre las variables. La clave es que la covarianza y la correlacin miden dependencia lineal, las variables pueden estar relacionadas no linealmente pero an as tener una covarianza de cero.

    Como por ejemplo, suponga que X y Y siguen la distribucin de probabilidad

    X -2 -1 0 1 2

    Y 4 1 0 1 2

    Se asume que todas las observaciones suceden con una probabilidad igual ( ). En este caso E(X) = 0, E(Y) = 2, y

    5

    Cov (X, Y) = 1/5 Xi(Yi - 2) = 0 i = 1

    Sin embargo, es claro que las variables aleatorias de seguro no son independien-tes. De hecho, las cinco parejas listadas satisfacen la relacin Y = X2, de modo que hay una relacin no lineal exacta entre X y Y.

    2.2 ESTIMACIN 2.2.1 Estimadores de media, varianza y covarianza

    Las medias, varianzas y covarianzas pueden medirse con exactitud slo si cono-cemos casi todos los resultados posibles, es decir, la poblacin. Sin embargo, por lo general, cuando emprendemos un estudio, slo tenemos una muestra de la

    poblacin. Entonces desearemos hacer inferencias acerca de las caractersticas

    1 5

  • 26 PARTE UNO: Los fundamentos del anlisis de regresin

    de la poblacin a partir de la muestra. Mostraremos en este captulo cmo po-demos tomar una muestra de N puntos de datos, obtener estimaciones de las caractersticas de la poblacin y luego sacar conclusiones acerca de la relacin entre las estimaciones de la muestra y los correspondientes parmetros de la poblacin. En vista de que no podemos conocer la verdadera media y varianza de una variable aleatoria, o la verdadera covarianza entre dos variables aleato-rias, usaremos la informacin muestral para obtener las mejores estimaciones posibles.

    El objetivo es determinar una regla que d una estimacin muestral para todas y cada una de las muestras posibles. Para distinguir la estimacin de la regla ms general, llamaremos a esta ltima estimador. Es comn que los estu-diantes confundan "estimaciones" y "estimadores", pero esta confusin puede eliminarse si recordamos que los estimadores son reglas, mientras que las esti-maciones son nmeros.

    Hallar el mejor estimador, para cualquier muestra dada, es un asunto com-plejo que se expone con mayor detalle en la seccin 2.3. Por el momento, supngase que un requisito mnimo es que el estimador de un parmetro (como la media o variacin) produce estimaciones que se aproximan mucho a ese parmetro. De manera ms especfica, nos gustara que el estimador fuera insesgado en el sentido de que el valor esperado del estimador es igual al parmetro mismo. Como un ejemplo, reconsidrese la media muestral de una variable aleatoria X con media x. El estimador X se define por:

    (2.6)

    Es muy importante sealar que X es una variable aleatoria cuyos valores variarn de una muestra a otra, aun cuando el parmetro de poblacin correspondiente permanezca sin cambio. Debido a que las estimaciones mustrales varan de una muestra a otra, podemos representar su distribucin de probabilidad. Esta distribucin muestral se consigue obteniendo, de manera repetida, muestras nuevas y calculando las medias y varianzas mustrales cada vez. La distribucin muestral para la media medir la probabilidad de que la media muestral caiga dentro de una serie de intervalos especficos