Paul Newbold University of Nottingham
William L. Carlson St. Olaf College
Betty M. Thorne Stetson University
Traducción
Prentice Hall, Upper Saddle River, New Jersey 07458 Madrid
Estadística para Administración y Economía
PEARSON EDUCACIÓN, S.A., Madrid, 2008
ISBN: 978-84-8322-403-8 Materia: 519.5 Métodos estadísticos
Formato 195# 250 mm Páginas: 1088
Todos los derechos reservados. Queda prohibida, salvo excepción
prevista en la Ley, cualquier forma de reproducción, distribución,
comunicación pública y transformación de esta obra sin contar con
autorización de los titulares de propiedad intelectual. La
infracción de los derechos mencionados puede ser constitutiva de
delito contra la propiedad intelectual (arts. 270 y sgts.
Código Penal).
Authorized translation from the English language edition, entitled
STATISTICS FOR BUSINESS AND ECONOMICS, 6th Edition by NEWBOLD,
PAUL; CARLSON, WILLIAM; THORNE, BETTY, published by Pearson
Education, Inc, publishing as Prentice Hall, Copyright 5
2007.
All rights reserved. No part of this book may be reproduced or
transmitted in any form or by any means, electronic or mechanical
photocopying, recording or by and information storage retrieval
system, without permission from Pearson Education, Inc.
Spanish language edition published by PEARSON EDUCATION S.A.,
Copyright 5 2008
DERECHOS RESERVADOS 5 2008 por PEARSON EDUCACIÓN, S.A. Ribera del
Loira, 28 28042 Madrid (España)
Paul Newbold, William L. Carlson y Betty M. Thorne Estadística para
Administración y Economía
ISBN: 978-84-8322-403-8 Depósito legal:
PEARSON PRENTICE HALL es un sello editorial autorizado de PEARSON
EDUCACIÓN, S.A.
Equipo editorial: Editor: Alberto Cañizal Técnico
editorial: Elena Bazaco
Equipo de producción: Director: José Antonio Clares
Técnico: José Antonio Hernán
Diseño de cubierta: Equipo de diseño de PEARSON EDUCACIÓN,
S.A.
Composición: COPIBOOK, S.L.
Impreso por:
Dedico este libro a mi mujer Charlotte, a nuestros hijos Andrea,
Douglas y Larry y a nuestros nietos Ezra, Savanah,
Rellana, Anna, Eva Rose y Emily
William L. Carlson
Dedico este libro a mi marido Jim y a nuestra familia Jennie, Ann,
Renee, Jon, Chris, Jon, Marius, Mihaela,
Cezara y Anda
Betty M. Thorne
SOBRE LOS AUTORES
Bill Carlson es profesor emérito de economía en St. Olaf
College,
donde lleva 31 años enseñando, ha sido varias veces director de
de-
partamento y ha desempeñado diversas funciones
administrativas,
entre las que se encuentra la de Director del Centro de
Cálculo.
También ha ocupado diversos cargos en la administración pública
de
Estados Unidos y en la Universidad de Minnesota, además de
pro-
nunciar conferencias en numerosas universidades. Fue elegido
miembro honorario de Phi Beta Kappa. También trabajó 10 años
en
el sector privado y en empresas de consultoría antes de iniciar su
ca-
rrera en St. Olaf. Se licenció en ingeniería en la Michigan
Technolo-
gical University (BS), realizó un Máster (MS) en el Illinois
Institute
of Technology y se doctoró (Ph.D.) en Administración
Cuantitativa
de Empresas en la Rackham Graduate School de la Universidad
de
Michigan. Entre sus investigaciones, se encuentran numerosos
estu-
dios sobre la administración de empresas, la seguridad vial y la
ense-
ñanza de la estadística. Ha publicado anteriormente dos libros
de
texto de estadística. Ha sido profesor encargado de numerosos
gru-
pos de estudiantes que han realizado estancias de estudio en
diversos
países de todo el mundo. Entre los cargos que ocupa actualmente
se
encuentran el de Director Ejecutivo del Cannon Valley Elder
Colle-
gium. Disfruta con sus nietos y con la ebanistería, y le
encanta
viajar, leer y que le encarguen trabajos en la parte septentrional
del
estado de Wisconsin.
Betty M. Thorne, autora, investigadora y profesora galardonada
con
premios a la docencia, es profesora de Ciencias de la Decisión y
Di-
rectora de Estudios de Grado en la School of Business
Administra-
tion de Stetson University en DeLand (Florida). Galardonada con
el
McEniry Award for Excellence in Teaching de la Stetson
University,
el máximo premio que se concede a un profesor de la Stetson
Uni-
versity, también ha recibido el Outstanding Teacher of the
Year
Award y el Professor of the Year Award de la School of
Business
Administration en Stetson. Enseña asimismo en el programa de
vera-
de Stetson University; el programa de MBA Ejecutivo de Stetson
University, y el Executive
Passport Program de Stetson University. En 2004 y 2005, fue
nombrada mejor profesora del
programa JD/ MBA del College of Law de Stetson. Se licenció en
Geneva College e hizo el
Máster y el Doctorado en la Universidad de Indiana. Es miembro del
comité de planificación y
Secretaria/ Tesorera de las jornadas tituladas Making
Statistics More Effective in Schools and
Business, en las que se reúne anualmente con estadísticos
para debatir sobre cuestiones de in-
vestigación y enseñanza. También es miembro del Decision Sciences
Institute, de la American
Society for Quality y de la American Statistical Association.
Participa en un estudio quinquenal
titulado North American Fareston versus Tamoxifen Adjuvant (NAFTA)
Trial sobre el cáncer
de mama (http:// www.naftatrial.com).
Ella y su marido, Jim, tienen cuatro hijos. Viajan mucho, asisten a
clases de teología, parti-
cipan en organizaciones internacionales dedicadas a ayudar a niños
desfavorecidos y hacen tra-
bajo apostólico en Rumanía.
Capítulo 2. Descripción gráfica de los datos
........................................................... 9
Capítulo 3. Descripción numérica de los datos
........................................................ 49
Capítulo 4. Probabilidad
............................................................................................
83
Capítulo 5. Variables aleatorias discretas y distribuciones
de probabilidad ........... 145
Capítulo 6. Variables aleatorias continuas y distribuciones
de probabilidad ......... 201
Capítulo 7. Muestreo y distribuciones en el muestreo
............................................ 249
Capítulo 8. Estimación: una población
.....................................................................
295
Capítulo 9. Estimación: otros temas
.........................................................................
325
Capítulo 10. Contraste de hipótesis
............................................................................
353
Capítulo 11. Contraste de hipótesis II
........................................................................
393
Capítulo 12. Regresión simple
....................................................................................
431
Capítulo 13. Regresión múltiple
.................................................................................
487
Capítulo 14. Otros temas del análisis de regresión
.................................................... 575
Capítulo 15. Estadística no paramétrica
.....................................................................
627
Capítulo 16. Contrastes de la bondad del ajuste y tablas de
contingencia ............... 655
Capítulo 17. Análisis de la varianza
...........................................................................
681
Capítulo 18. Introducción a la calidad
.......................................................................
729
Capítulo 19. Análisis de series temporales y predicción
........................................... 763
Capítulo 20. Otros temas relacionados con el muestreo
............................................ 811
Capítulo 21. Teoría estadística de la decisión
............................................................
855
PRÓLOGO
.......................................................................................................................................
xix
CAPÍTULO 1. ¿Por qué estudiar estadística?
........................................................................
1 1.1. La toma de decisiones en un entorno incierto
........................................ 2 1.2. El muestreo
...............................................................................................
3 1.3. Estadística descriptiva e inferencial
......................................................... 4
Descripción de los datos
..............................................................................
5 Realización de inferencias
............................................................................
6
CAPÍTULO 2. Descripción gráfica de los datos
.....................................................................
9 2.1. Clasificación de las variables
...................................................................
10
Categóricas o numéricas
...............................................................................
10 Niveles de medición
....................................................................................
10
2.2. Gráficos para describir variables categóricas
.......................................... 13 Tablas
.........................................................................................................
13 Gráficos de barras y gráficos de tarta
............................................................
14 Diagramas de Pareto
....................................................................................
16
2.3. Gráficos para describir datos de series temporales
................................. 20 2.4. Gráficos para describir
variables numéricas ...........................................
24
Distribuciones de frecuencias
.......................................................................
24 Histogramas y ojivas
....................................................................................
27 Diagramas de tallo y hojas
...........................................................................
30
2.5. Tablas y gráficos para describir relaciones entre variables
.................... 32 Diagramas de puntos dispersos
.....................................................................
33 Tablas cruzadas
...........................................................................................
34
2.6. Errores en la presentación de datos
......................................................... 39
Histogramas engañosos
................................................................................
40 Gráficos de series temporales engañosos
.......................................................
42
CAPÍTULO 3. Descripción numérica de los datos
.................................................................
49 3.1. Medidas de la tendencia central
..............................................................
50
Media, mediana, moda
.................................................................................
50 Forma de la distribución
..............................................................................
52
Varianza y desviación típica
.........................................................................
57 Teorema de Chebychev y regla empírica
...................................................... 59
Coeficiente de variación
...............................................................................
61
3.3. Media ponderada y medidas de datos agrupados
.................................... 64 3.4. Medidas de las
relaciones entre variables
............................................... 69 3.5. Obtención
de relaciones lineales
.............................................................
75
CAPÍTULO 4. Probabilidad
......................................................................................................
83 4.1. Experimento aleatorio, resultados, sucesos
............................................. 84 4.2. La
probabilidad y sus postulados
............................................................
92
Probabilidad clásica
.....................................................................................
92 Frecuencia relativa
.......................................................................................
95 Probabilidad subjetiva
..................................................................................
96
4.3. Reglas de la probabilidad
.........................................................................
102 Probabilidad condicionada
............................................................................
104 Independencia estadística
.............................................................................
108
4.4. Probabilidades bivariantes
........................................................................
116 Ventaja (odds)
.............................................................................................
120 Cociente de «sobreparticipación»
..................................................................
121
4.5. El teorema de Bayes
................................................................................
128
CAPÍTULO 5. Variables aleatorias discretas y distribuciones de
probabilidad ................ 145 5.1. Variables aleatorias
..................................................................................
146 5.2. Distribuciones de probabilidad de variables aleatorias
discretas ........... 148 5.3. Propiedades de las variables
aleatorias discretas .................................... 151
Valor esperado de una variable aleatoria discreta
.......................................... 151 Varianza de
una variable aleatoria discreta
.................................................... 153
Media y varianza de funciones lineales de una variable aleatoria
................... 156
5.4. Distribución binomial
...............................................................................
161 5.5. Distribución hipergeométrica
...................................................................
170 5.6. La distribución de Poisson
.......................................................................
173
Aproximación de Poisson de la distribución binominal
.................................. 176 Comparación de la
distribución de Poisson y la distribución binomial
............ 177
5.7. Distribución conjunta de variables aleatorias discretas
.......................... 179 Aplicaciones informáticas
.............................................................................
183 Covarianza
..................................................................................................
183
Correlación ..................................................................................................
184 Funciones lineales de variables aleatorias
...................................................... 186
Análisis de carteras
......................................................................................
189
CAPÍTULO 6. Variables aleatorias continuas y distribuciones de
probabilidad ............... 201 6.1. Variables aleatorias
continuas
..................................................................
202
La distribución uniforme
..............................................................................
205 6.2. Esperanzas de variables aleatorias continuas
.......................................... 208 6.3. La distribución
normal
.............................................................................
211
Gráficos de probabilidades normales
............................................................. 220
6.4. La distribución normal como aproximación de la
distribución
binomial
....................................................................................................
225 Variable aleatoria proporcional
.....................................................................
229
xii Contenido
6.5. La distribución exponencial
.....................................................................
231 6.6. Distribución conjunta de variables aleatorias continuas
......................... 234
Combinaciones lineales de variables aleatorias
.............................................. 238
CAPÍTULO 7. Muestreo y distribuciones en el muestreo
..................................................... 249
7.1. Muestreo de una población
......................................................................
250 7.2. Distribuciones de las medias muestrales en el muestreo
........................ 254
Teorema del límite central
...........................................................................
260 Intervalos de aceptación
...............................................................................
265
7.3. Distribuciones de proporciones muestrales en el muestreo
.................... 272 7.4. Distribuciones de las varianzas
muestrales en el muestreo .................... 277
CAPÍTULO 8. Estimación: una población
..............................................................................
295 8.1. Propiedades de los estimadores puntuales
............................................... 296
Estimador insesgado
....................................................................................
297 Estimador
consistente ...................................................................................
298 Estimador eficiente
......................................................................................
298
8.2. Intervalos de confianza de la media: varianza poblacional
conocida .... 302 Intervalos basados en la distribución normal
................................................. 304
Reducción del margen de error
.....................................................................
307
8.3. Intervalos de confianza de la media: varianza poblacional
desconocida .... 309 Distribución t de Student
..............................................................................
310 Intervalos basados en la distribución t de
Student .......................................... 312
8.4. Intervalos de confianza de proporciones de la población
(grandes muestras)
...................................................................................................
315
CAPÍTULO 9. Estimación: otros temas
...................................................................................
325 9.1. Intervalos de confianza de la diferencia entre las medias
de dos
poblaciones normales
...............................................................................
326 Muestras dependientes
.................................................................................
326 Muestras independientes, varianzas poblacionales conocidas
.......................... 328
9.2. Intervalos de confianza de la diferencia entre las medias de
dos poblacionales normales cuando las varianzas poblacionales son
conocidas
...................................................................................................
331 Muestras independientes, varianzas poblacionales que se supone
que son iguales
........................................................................................................
331 Muestras independientes, varianzas poblacionales que no se
supone que sean iguales
........................................................................................................
334
9.3. Intervalos de confianza de la diferencia entre dos
proporciones poblacionales (grandes muestras)
............................................................
337
9.4. Intervalos de confianza de la varianza de una distribución
normal ....... 340 9.5. Elección del tamaño de la muestra
..........................................................
344
Media de una población que sigue una distribución normal, varianza
poblacional conocida
....................................................................................
344 Proporción poblacional
.................................................................................
346
CAPÍTULO 10. Contraste de hipótesis
......................................................................................
353 10.1. Conceptos del contraste de hipótesis
..................................................... 354 10.2.
Contrastes de la media de una distribución normal: varianza
poblacional conocida
..............................................................................
360
p-valor
......................................................................................................
362 Hipótesis alternativa bilateral
......................................................................
369
10.3. Contrastes de la media de una distribución normal: varianza
poblacional desconocida
.........................................................................
372
10.4. Contrastes de la proporción poblacional (grandes muestras)
............... 376 10.5. Valoración de la potencia de un contraste
............................................ 380
Contrastes de la media de una distribución normal: variable
poblacional
conocida ....................................................................................................
380 Potencia de los contrastes de proporciones poblacionales
(grandes muestras) ... 383
CAPÍTULO 11. Contraste de hipótesis II
..................................................................................
393 11.1. Contrastes de la diferencia entre dos medias
poblacionales ................ 394
Dos medias, datos pareados
........................................................................
395 Dos medias, muestras independientes, varianzas poblacionales
conocidas ..... 398 Dos medias, poblaciones independientes,
varianzas desconocidas que se supone que son iguales
..............................................................................
401 Dos medias, muestras independientes, varianzas poblacionales
desconocidas que se supone que no son iguales
...............................................................
404
11.2. Contrastes de la diferencia entre dos proporciones
poblacionales (grandes muestras)
..................................................................................
408
11.3. Contrastes de la varianza de una distribución normal
.......................... 412 11.4. Contrastes de la igualdad de
las varianzas entre dos poblaciones
distribuidas normalmente
.......................................................................
416 11.5. Algunas observaciones sobre el contraste de hipótesis
........................ 420
CAPÍTULO 12. Regresión simple
...............................................................................................
431 12.1. Análisis de correlación
...........................................................................
432
Contraste de hipótesis de la correlación
...................................................... 433
12.2. Modelo de regresión lineal
....................................................................
437 12.3. Estimadores de coeficientes por el método de mínimos
cuadrados ..... 442
Cálculo por ordenador del coeficiente de regresión
...................................... 445 12.4. El poder
explicativo de una ecuación de regresión lineal
.................... 448
El coeficiente de determinación R2
............................................................. 450
12.5. Inferencia estadística: contrastes de hipótesis e intervalos
de
confianza
.................................................................................................
456 Contraste de hipótesis del coeficiente de la pendiente
poblacional utilizando la distribución
F ........................................................................................
463
12.6. Predicción
...............................................................................................
466 12.7. Análisis gráfico
.......................................................................................
472
CAPÍTULO 13. Regresión múltiple
............................................................................................
487 13.1. El modelo de regresión múltiple
...........................................................
488
Especificación del modelo
..........................................................................
488 Desarrollo del modelo
................................................................................
491 Gráficos tridimensionales
...........................................................................
494
13.2. Estimación de coeficientes
.....................................................................
496 Método de mínimos cuadrados
...................................................................
497
13.3. Poder explicativo de una ecuación de regresión múltiple
.................... 504
xiv Contenido
13.4. Intervalos de confianza y contrastes de hipótesis de
coeficientes de regresión individuales
.............................................................................
511 Intervalos de confianza
..............................................................................
513 Contrastes de hipótesis
...............................................................................
515
13.5. Contrastes de los coeficientes de regresión
........................................... 525 Contrastes de todos
los coeficientes
............................................................ 525
Contraste de un conjunto de coeficientes de regresión
................................. 528 Comparación de los
contrastes F y t
...........................................................
529
13.6. Predicción
...............................................................................................
533 13.7. Transformaciones de modelos de regresión no lineales
....................... 535
Transformaciones de modelos cuadráticos
................................................... 536
Transformaciones logarítmicas
....................................................................
539
13.8. Utilización de variables ficticias en modelos de regresión
.................. 545 Diferencias entre las pendientes
..................................................................
548
13.9. Método de aplicación del análisis de regresión múltiple
..................... 553 Especificación del modelo
..........................................................................
553 Regresión múltiple
.....................................................................................
555 Efecto de la eliminación de una variable estadísticamente
significativa ........ 558 Análisis de los
residuos ..............................................................................
559
CAPÍTULO 14. Otros temas del análisis de regresión
............................................................ 575
14.1. Metodología para la construcción de modelos
...................................... 576
Especificación del modelo
..........................................................................
577 Estimación de los coeficientes
....................................................................
577 Verificación del modelo
.............................................................................
578 Interpretación del modelo e inferencia
........................................................ 579
14.2. Variables ficticias y diseño experimental
.............................................. 579 Modelos de
diseño experimental
.................................................................
583
14.3. Valores retardados de las variables dependientes como
regresores ..... 591 14.4. Sesgo de especificación
..........................................................................
596 14.5. Multicolinealidad
....................................................................................
599 14.6. Heterocedasticidad
..................................................................................
602 14.7. Errores autocorrelacionados
...................................................................
608
Estimación de las regresiones con errores autocorrelacionados
..................... 612 Errores autocorrelacionados en los
modelos con variables dependientes retardadas
..................................................................................................
616
CAPÍTULO 15. Estadística no paramétrica
..............................................................................
627 15.1. Contraste de signos e intervalo de confianza
........................................ 628
Contraste de signos de muestras pareadas o enlazadas
................................. 628 Aproximación normal
................................................................................
631 Contraste de signos de una mediana poblacional
......................................... 633 Intervalo de
confianza de la mediana
..........................................................
634
15.2. Contraste de Wilcoxon basado en la ordenación de las
diferencias .... 636 Minitab (contraste de Wilcoxon)
.................................................................
637 Aproximación normal
................................................................................
638
15.3. Contraste U de Mann-Whitney
.............................................................. 641
15.4. Contraste de la suma de puestos de Wilcoxon
..................................... 645 15.5. Correlación de
orden de Spearman
........................................................ 649
Contenido xv
CAPÍTULO 16. Contrastes de la bondad del ajuste y tablas de
contingencia ..................... 655 16.1. Contrastes de la
bondad del ajuste: probabilidades especificadas ....... 656 16.2.
Contrastes de la bondad del ajuste: parámetros poblacionales
desconocidos
...........................................................................................
661 Un contraste de normalidad
........................................................................
663
16.3. Tablas de contingencia
...........................................................................
666 Aplicaciones informáticas
...........................................................................
669
CAPÍTULO 17. Análisis de la varianza
.....................................................................................
681 17.1. Comparación de las medias de varias poblaciones
............................... 682 17.2. Análisis de la varianza
de un factor ......................................................
684
Modelo poblacional en el caso del análisis de la varianza de un
factor ......... 691 17.3. El contraste de Kruskal-Wallis
.............................................................. 695
17.4. Análisis de la varianza bifactorial: una observación por
celda, bloques
aleatorizados
...........................................................................................
698 17.5. Análisis de la varianza bifactorial: más de una
observación por
celda
........................................................................................................
709
CAPÍTULO 18. Introducción a la calidad
.................................................................................
729 18.1. La importancia de la calidad
.................................................................
730
Los líderes de la calidad
............................................................................
730 Variación
..................................................................................................
732
18.2. Gráficos de control de medias y desviaciones típicas
.......................... 735 Una estimación de la desviación
típica del proceso ..................................... 736
Gráficos de control de medias
....................................................................
738 Gráficos de control de desviaciones típicas
................................................. 740
Interpretación de los gráficos de control
......................................................
741
18.3. Capacidad de un proceso
.......................................................................
745 18.4. Gráfico de control de proporciones
....................................................... 749 18.5.
Gráficos de control del número de ocurrencias
.................................... 754
CAPÍTULO 19. Análisis de series temporales y predicción
.................................................... 763
19.1. Números índice
.......................................................................................
764
Índice de precios de un único artículo
......................................................... 766
Índice de precios agregado no ponderado
.................................................... 767
Índice de precios agregado ponderado
......................................................... 768
Índice de cantidades agregado ponderado
.................................................... 769
Cambio del periodo base
............................................................................
770
19.2. Un contraste no paramétrico de aleatoriedad
........................................ 773 19.3. Componentes de
una serie temporal
...................................................... 777 19.4.
Medias móviles
.......................................................................................
780
Extracción del componente estacional por medio de medias móviles
............ 783 19.5. Suavización exponencial
........................................................................
789
Modelo de predicción por medio de la suavización exponencial con el
método Holt-Winters
..................................................................................
792 Predicción de series temporales estacionales
............................................... 796
19.6. Modelos autorregresivos
.........................................................................
801 19.7. Modelos autorregresivos integrados de medias móviles
....................... 807
xvi Contenido
CAPÍTULO 20. Otros temas relacionados con el muestreo
.................................................... 811
20.1. Pasos básicos de un estudio realizado por muestreo
............................ 812 20.2. Errores de muestreo y
errores ajenos al muestreo ................................ 817
20.3. Muestreo aleatorio simple
......................................................................
819
Análisis de los resultados de un muestreo aleatorio simple
.......................... 820 20.4. Muestreo estratificado
............................................................................
825
Análisis de los resultados de un muestreo aleatorio estratificado
.................. 827 Afijación del esfuerzo muestral a los
distintos estratos ................................ 833
20.5. Elección del tamaño de la muestra
........................................................ 837 Tamaño
de la muestra para el muestreo aleatorio simple: estimación de la
media o el total poblacional
.......................................................................
838 Tamaño de la muestra para el muestreo aleatorio simple:
estimación de la proporción poblacional
...............................................................................
839 Tamaño de la muestra para un muestreo aleatorio estratificado
con un grado de precisión especificado
............................................................................
840
20.6. Otros métodos de muestreo
....................................................................
843 Muestreo por conglomerados
......................................................................
843 Muestreo bietápico
.....................................................................................
847 Métodos de muestreo no probabilísticos
......................................................
850
CAPÍTULO 21. Teoría estadística de la decisión
.....................................................................
855 21.1. La toma de decisiones en condiciones de incertidumbre
..................... 856 21.2. Soluciones que no implican la
especificación de probabilidades:
criterio maximin, criterio de la pérdida de oportunidades minimax
.... 859 Criterio maximin
.......................................................................................
860 Criterio de la pérdida de oportunidades minimax
......................................... 862
21.3. Valor monetario esperado; TreePlan
..................................................... 864 Árboles
de decisión
................................................................................
866 La utilización de TreePlan para resolver un árbol de decisión
...................... 868 Análisis de sensibilidad
..............................................................................
872
21.4. Información muestral: análisis y valor bayesianos
............................... 876 Utilización del teorema de
Bayes
................................................................
876 El valor de la información muestral
............................................................ 881 El
valor de la información muestral visto por medio de árboles de
decisión .... 884
21.5. Introducción del riesgo: análisis de la utilidad
..................................... 890 El concepto de utilidad
..............................................................................
891 Criterio de la utilidad esperada para tomar decisiones
.................................. 895
TABLAS DEL APÉNDICE 1. Función de distribución acumulada de la
distribución normal estándar ... 899 2. Función de probabilidad de
la distribución binomial .............................. 901 3.
Probabilidades binomiales acumuladas
.................................................... 906 4. Valores
de e.j
...........................................................................................
910 5. Probabilidades de Poisson individuales
.................................................... 911 6.
Probabilidades de Poisson acumuladas
..................................................... 919 7. Puntos
de corte de la función de distribución ji-cuadrado
...................... 927 8. Puntos de corte de la distribución
t de Student
....................................... 928 9. Puntos de corte de
la distribución F
......................................................... 929
Contenido xvii
10. Puntos de corte de la distribución del estadístico de contraste
de Wilcoxon
....................................................................................................
932
11. Puntos de corte de la distribución del coeficiente de
correlación de orden de Spearman
....................................................................................
933
12. Puntos de corte de la distribución del estadístico de contraste
de Durbin-Watson
...........................................................................................
934
13. Constantes de los gráficos de control
....................................................... 936 14.
Función de distribución acumulada del estadístico del contraste
de
rachas
.........................................................................................................
937
ÍNDICE
ANALÍTICO .......................................................................................................................
1051
AUDIENCIA A LA QUE VA DIRIGIDO
Estadística para los negocios y la economía (6.a edición) se
ha escrito para satisfacer la necesidad de un libro de texto que
ofrezca una buena introducción a la estadística para los negocios
que permita comprender los conceptos y haga hincapié en la
resolución de pro- blemas poniendo ejemplos realistas del mundo de
la empresa y de la economía.
Programas de máster o de licenciatura que enseñen estadística para
los negocios. Programas de doctorado y de licenciatura de economía.
Programas de MBA ejecutivo. Cursos de doctorado de estadística
empresarial.
CONTENIDO
Hemos escrito este libro con el fin de ofrecer una buena
introducción a los métodos esta- dísticos aplicados para que sus
lectores puedan realizar un sólido análisis estadístico en muchas
situaciones empresariales y económicas. Hemos hecho hincapié en la
comprensión de los supuestos que son necesarios para realizar un
análisis profesional. Con los ordenado- res modernos, es fácil
calcular a partir de los datos las salidas necesarias para muchos
mé- todos estadísticos. Es tentador, pues, aplicar meramente
sencillas «reglas» utilizando estas salidas, enfoque que se adopta
en numerosos libros de texto. El nuestro es combinar los
conocimientos con muchos ejemplos y ejercicios y mostrar que la
comprensión de los mé- todos y de sus supuestos es útil para
entender los problemas empresariales y económicos.
NUEVO EN ESTA EDICIÓN
Hemos actualizado y ampliado la sexta edición de este libro para
satisfacer mejor las nece- sidades de los usuarios y ofrecer más
flexibilidad. En esta edición, hemos introducido im- portantes
cambios y novedades. Éstos son:
Hemos dividido el análisis de los intervalos de confianza y del
contraste de hipótesis en un capítulo dedicado a una población y
otro dedicado a dos poblaciones en res- puesta a las sugerencias de
los usuarios y de los revisores. Presentaciones revisadas y más
claras de los métodos de regresión simple y múltiple. Presentamos
el análisis de cartera utilizando valores correlacionados con un
extenso número de ejercicios aplicados. Hemos adoptado nuevos
enfoques para presentar los datos utilizando imágenes grá-
ficas.
A LOS ESTUDIANTES
El CD-ROM que acompaña a este libro contiene todos los ficheros de
datos utilizados en el libro que son necesarios para hacer los
problemas y los ejercicios, así como el programa TreePlan y su
documentación. El PowerPoint y otros ficheros relevantes pueden
encontrar- se en la página web del libro
(www.prenhall.com/ newbold).
A LOS PROFESORES
Los ficheros de las soluciones de los capítulos y las
presentaciones en PowerPoint de este libro se encuentran en formato
digital descargable. Visite el Instructor Resource Center en el
catálogo de Prentice Hall (www.prenhall.com). Para registrarse con
el fin de utilizar los recursos del Instructor Resource Center se
necesita un código de acceso como educador de Pearson.
Cada vez mejor
Una vez que se registre, no tendrá que rellenar más formularios o
recordar múltiples nom- bres de usuario y contraseñas para acceder
a nuevos títulos y / o ediciones. Como profesor registrado,
puede acceder directamente a los ficheros de recursos y recibir
inmediatamente el acceso y las instrucciones para instalar en el
servidor de su universidad el contenido del gestor del curso.
¿Necesita ayuda?
Contamos con un entregado equipo de apoyo técnico para ayudar a los
profesores a re- solver cuestiones relacionadas con el material
auxiliar que acompaña a este libro. Visite
http:// 247.prenhall.com/ para las respuestas a las
preguntas formuladas frecuentemente y los números de teléfono
gratuitos de ayuda.
AGRADECIMIENTOS
Nos gustaría dar las gracias a las siguientes personas que han
revisado el libro y han hecho perspicaces sugerencias para esta
edición:
Mr. C. Patrick Kohrman-Penn State University, Berks Campus James
Thorson-Southern Connecticut State University Mamnoon Jamil-Rutgers
University, Camden Zhimin Huang-Adelphi University
xx Prólogo
Renee Fontenot-University of Texas, Permian Basin Allen
Lynch-Mercer University Bulent Uyar-University of Northern Iowa
David Hudgins-University of Oklahoma Allan Lacayo-Diablo Valley
College J. Morgan Jones-University of North Carolina Eugene
Allevato-Woodbury University Patricia Odell-Bryant University Jay
DeVore-California Polytechnic State University Valerie
Bencivenga-University of Texas Myles J. Callan-University of
Virginia Andrew Narwold-University of San Diego Anthony
Smith-Carnegie Mellon University Peter Baxendale-University of
Southern California Steen Anderson-Aarhus School of Business,
Denmark Eric Bentzen-Copenhagen Business School, Denmark Hans
Geilnkirchen-Erasmus University, Netherlands Peter Reiss-Stanford
University David Hudgins-University of Oklahoma Robert Lemke-Lake
Forest College Michael Gordinier-Washington University Fred
Wenstop-Norwegian School of Management Sheri Aggarwal-University of
Virginia Jorgen Lauridsen-University of Southern Denmark Robert
Gillette-University of Kentucky Peter Boatwright-Carnegie Mellon
Mark Kamstra-Simon Fraser Albert Madansky-University of Chicago
Jeff Russell-University of Chicago Nick Polsen-University of
Chicago Aaron Smith-University of Virginia Yu-Chi Cheng-University
of Notre Dame Professor Mohanty-California State, Los Angeles Ken
Alexander-University of Southern California Mendy
Fygenson-University of Southern California Matthew White-Stanford
University Stefanos Zenios-Stanford University Lawrence
Brown-Pennsylvania State University Abba Krieger-Pennsylvania State
University Harvey Singer-George Mason William Hausman-William and
Mary University of Iowa Jim Swanson-Central Missouri University C.
Barry Pfitzner-Randolf-Macon College
También estamos agradecidos a Annie Puciloski que ha revisado la
precisión de esta edición y especialmente a Sandra Krausman, GGS
Production Services, por su ayuda y pericia.
Por lo que se refiere al St. Olaf College, debemos dar las gracias
a Priscilla Hall, ayu- dante administrativo de St. Olaf, por la
labor realizada en algunas partes del libro y su
Prólogo xxi
dirección del trabajo de varios estudiantes que han colaborado en
el libro, entre los que se encuentran Michael Loop, Holly
Malcomson, Erin McMurtry, Nelly Schwinghammer, Catharina Zuber.
Este libro no habría sido posible sin su colaboración.
Por lo que se refiere a Stetson University, también damos las
gracias a Jim Scheiner, Paul Dascher, Marie Gilotti, Sean A.
Thomas, John Tichenor y Emma Astrom y especial- mente a Jennie
Bishop (Computer Programmer Analyst II , State of
Florida, Volusia Coun-
ty Health Department ). Agradecemos, además, especialmente a
nuestras familias su apoyo durante las numero-
sas horas dedicadas a este libro. Bill Carlson da las gracias
especialmente a su mujer Char- lotte y a sus hijos adultos Andrea,
Douglas y Larry. Betty Thorne da las gracias especial- mente a su
marido Jim y a sus hijos adultos Jennie Bishop, Ann Thorne, Renee
Payne y Jon Thorne; así como a Marius, Mihaela, Cezara y Anda
Sabou.
Los autores agradecen las sólidas bases y tradición creadas por el
autor original, Paul Newsbold. Paul comprendió la importancia del
análisis estadístico riguroso y de sus funda- mentos. Se dio cuenta
de que hay algunas complejas ideas que es necesario desarrollar y
se esforzó en ofrecer explicaciones claras de difíciles ideas.
Además, estas ideas sólo son úti- les cuando se utilizan para
resolver problemas realistas. En ediciones anteriores, se in-
cluyeron, pues, muchos ejemplos y muchos ejercicios aplicados. Nos
hemos esforzado en mantener y ampliar esta tradición para hacer un
libro que satisfaga las necesidades de los futuros líderes
empresariales en la era de la información.
Si el lector tiene alguna sugerencia o corrección, puede ponerse en
contacto con los autores a través del correo electrónico en
[email protected];
[email protected].
xxii Prólogo
Esquema del capítulo
1.1. La toma de decisiones en un entorno incierto 1.2. El muestreo
1.3. Estad stica descriptiva e inferencial
Descripción de los datos Realización de inferencias
Introducción
En nuestra era de la información, el mundo abunda en datos. En los
artículos de los periódicos y en los reportajes de la televisión,
se hacen afirmaciones como «El Dow Jo- nes ha caído 6 puntos hoy» o
«El índice de precios de consumo subió un 0,8 por ciento el mes
pasado» o «la última encuesta indica que la tasa de aprobación del
presidente es hoy de un 63 por ciento» o «El 98 por ciento de los
pacientes de un estudio clínico no experimentó ningún efecto
secundario significativo con un nuevo medicamento contra el cáncer
de mama». Cada vez es más frecuente que para hacer una valoración
inteligente de los acontecimientos actuales, necesitemos asimilar e
interpretar una cantidad consi- derable de datos. La
Administración, las empresas y los investigadores científicos gas-
tan miles de millones de dólares en la recogida de datos. La
Administración ha contribui- do a ello, tanto recogiendo datos ella
misma como obligando a las empresas a dar información. El sector
privado también ha tenido que ver en ello. Las aireadas encuestas
Gallup de las actitudes de los votantes y los índices de audiencia
de Nielsen de los pro- gramas de televisión de la semana no son más
que la punta de un enorme iceberg de estudios de mercado. La
cantidad de datos recogidos ha aumentado a un ritmo extraor-
dinario en los últimos años.
1.1. La toma de decisiones en un entorno incierto
Las decisiones a menudo se basan en información incompleta. Por
ejemplo, se supone que los estudiantes universitarios de primer
año, cuando son admitidos en la universidad, selec- cionan una
carrera. Sin embargo, muchos de estos estudiantes pueden no tener
una meta profesional clara. Por poner otro ejemplo, los enfermos de
cáncer pueden ser invitados a participar en un estudio clínico para
probar un nuevo medicamento experimental (véase re- ferencia
bibliográfica 1) cuando aún no se dispone de información sobre los
efectos secun- darios, las tasas de supervivencia y las tasas de
recurrencia de esta nueva medicación. Asi- mismo, las decisiones
empresariales normalmente se toman en un entorno en el que los
responsables de tomarlas no pueden estar seguros de la futura
conducta de los factores que acabarán afectando al resultado de las
distintas opciones consideradas.
Cuando un fabricante presenta una oferta para hacerse con un
contrato, no está total- mente seguro de cuáles serán los costes
totales ni de qué ofertas presentarán los competi- dores. A pesar
de esta incertidumbre, debe hacer una oferta. Un inversor no sabe
con segu- ridad si los mercados financieros estarán boyantes,
estables o deprimidos. No obstante, debe elegir las acciones, los
bonos y los instrumentos del mercado de dinero de manera que su
cartera esté equilibrada sin saber cómo evolucionará el mercado en
el futuro.
Consideremos las siguientes afirmaciones:
«El precio de las acciones de IBM será más alto dentro de seis
meses que ahora». «Si el déficit presupuestario público es tan
elevado como se prevé, los tipos de interés se mantendrán altos el
resto del año». «La renta anual de un titulado universitario será
mayor que la renta anual de una per- sona que no tenga estudios
universitarios».
Cada una de estas afirmaciones contiene un lenguaje que sugiere la
existencia de una cantidad espuria de certeza. En el momento en el
que se hicieron las afirmaciones, era im- posible estar
seguro de que eran ciertas. Aunque un analista crea que
lo que ocurrirá en los próximos meses será tal que se prevé que el
precio de las acciones de IBM subirá durante ese periodo, no estará
seguro de eso. Por lo tanto, las afirmaciones deben modificarse co-
mo indican los siguientes ejemplos:
«El precio de las acciones de IBM probablemente será
más alto dentro de seis meses que ahora». «Si el déficit
presupuestario público es tan elevado como se prevé, es
probable que los tipos de interés se mantengan altos
durante el resto del año». «La renta anual de un titulado
universitario probablemente será mayor que la renta
anual de una persona sin estudios universitarios».
Es muy importante pensar bien cómo se dicen las cosas. No es
correcto sustituir las afirmaciones injustificadamente precisas por
afirmaciones innecesariamente vagas. Al fin y al cabo, ¿qué
significa «probablemente» o «es probable que»? Debe ponerse
especial cui- dado en expresar las ideas que se pretende expresar,
sobre todo cuando se trata de probabi- lidades o cuando hay
incertidumbre.
EJERCICIOS
Ejercicios básicos
1.1. Modifique las afirmaciones siguientes para que re-
flejen una posible incertidumbre:
a) El mejor instrumento para mejorar la cuota de mercado de
este producto es una campaña pu- blicitaria destinada al grupo de
edad 18-24 años.
2 Estadística para administración y economía
b) Si se presenta una oferta de esta cuantía, será más baja
que las del competidor y el contrato estará asegurado.
c) El coste de la gasolina será más alto en Esta- dos Unidos
dentro de 2 meses.
1.2. Ponga un ejemplo de una decisión de comerciali- zación
que debe tomarse en condiciones de incer- tidumbre.
1.3. Ponga un ejemplo de una decisión financiera que debe
tomarse en condiciones de incertidumbre.
1.2. El muestreo
Antes de introducir un nuevo producto en el mercado, su fabricante
quiere saber cuál será el nivel probable de demanda y es posible
que realice una encuesta de mercado. Lo que le interesa, en
realidad, son todos los compradores potenciales (la
población). Sin embargo, las poblaciones a menudo son tan grandes
que es difícil analizarlas; sería imposible o prohibitivo recoger
toda la información de una población. Incluso en las circunstancias
en las que parece que se dispone de suficientes recursos, las
limitaciones de tiempo obligan a examinar un subconjunto
(muestra).
Población y muestra
Una población es el conjunto completo de todos los
objetos que interesan a un investigador. El tamaño de la población,
N , puede ser muy grande o incluso infinito. Una
muestra es un subconjunto observado de valores poblacionales
que tiene un tamaño muestral que viene dado por n .
Ejemplos de poblaciones son:
Todos los votantes inscritos en un país. Todos los estudiantes de
una universidad. Todas las familias que viven en una ciudad. Todas
las acciones que cotizan en una bolsa de valores. Todas las
reclamaciones que recibe en un año dado una compañía de seguros
médicos. Todas las cuentas pendientes de cobro de una
empresa.
Nuestro objetivo final es hacer afirmaciones basadas en datos
muestrales que tengan al- guna validez sobre la población en
general. Necesitamos, pues, una muestra que sea repre- sentativa de
la población. ¿Cómo podemos lograrlo? Uno de los principios
importantes que debemos seguir en el proceso de selección de la
muestra es la aleatoriedad.
Muestreo aleatorio
El muestro aleatorio simple es un método que se emplea
para seleccionar una muestra de n
objetos de una población en el que cada miembro de la población se
elige estrictamente al azar, cada miembro de la población se elige
con la misma probabilidad y todas las muestras posibles de un
tamaño dado, n , tienen la misma probabilidad de ser
seleccionadas. Este méto- do es tan frecuente que generalmente se
suprime el adjetivo simple y la muestra resultante
se denomina muestra aleatoria.
El muestreo se utiliza mucho en todas las áreas de los negocios,
así como en otras dis- ciplinas. Para averiguar si un proceso de
producción está funcionando correctamente, se se- lecciona una
muestra de bienes producidos. Las auditorías de las cuentas
pendientes de co- bro generalmente se basan en una muestra. Durante
los años de elecciones presidenciales, se hacen estimaciones de las
preferencias de los votantes a partir de muestras de
votantes;
Capítulo 1. ¿Por qué estudiar estadística? 3
también puede hacerse una encuesta a la salida de los colegios
electorales para predecir qué candidato obtendrá más votos. Sin
embargo, tomar una muestra es meramente un me- dio para llegar a un
fin. Necesitamos estudiar estadística, no para hacer
afirmaciones so-
bre la muestra sino, más bien, para extraer
conclusiones sobre la población en general. La estadística es el
estudio de cómo se toman decisiones sobre una población cuando la
infor- mación procede de una muestra. Siempre quedará alguna
incertidumbre.
Supongamos que queremos saber cuál es la edad media de los votantes
de un país. Es evidente que el tamaño de la población es tan grande
que sólo podríamos tomar una mues- tra aleatoria, por ejemplo, 500
votantes, y calcular su edad media. Como esta media se ba- sa en
datos muestrales, se llama estadístico. Si pudiéramos
calcular la edad media de toda la población, la media resultante se
llamaría parámetro. En este libro veremos cómo se to- man
decisiones sobre un parámetro, basándose en un estadístico. Debemos
darnos cuenta de que siempre habrá una cierta incertidumbre, ya que
no se conoce el valor exacto del parámetro.
Parámetro y estadístico
Un parámetro es una característica específica de una
población. Un estadístico es una carac- terística
específica de una muestra.
EJERCICIOS
Ejercicios básicos
1.4. Ponga un ejemplo de un parámetro en cada una de las
siguientes poblaciones:
a) Las rentas de todas las familias que viven en una
ciudad.
b) Los rendimientos anuales de todas las acciones que
cotizan en una bolsa de valores.
c) Los costes de todas las reclamaciones que reci- be en un
año dado una compañía de seguros médicos.
d) Los valores de todas las cuentas pendientes de cobro de
una empresa.
1.5. Su universidad ha encuestado a sus estudiantes pa- ra
averiguar el tiempo semanal medio que dedican a navegar por
Internet.
a) ¿Cuál es la población? b) ¿Cuál es la muestra? c)
¿Cuál es el estadístico? d) ¿Es el valor de 6,1 horas
un parámetro o un es-
tadístico?
1.6. Una compañía aérea sostiene que menos de un 1 por ciento
de los vuelos programados que despe- gan del aeropuerto de Nueva
York sale tarde. Se ha observado que el 1,5 por ciento de una
muestra aleatoria de 200 vuelos salió más tarde de la hora
prevista.
a) ¿Cuál es la población? b) ¿Cuál es la muestra? c)
¿Cuál es el estadístico? d) ¿Es 1,5 por ciento un
parámetro o un estadís-
tico?
1.3. Estadstica descriptiva e inferencial
Para pensar en términos estadísticos hay que seguir una serie de
pasos que van desde la definición del problema hasta la toma de
decisiones. Una vez identificado y definido el problema, se recogen
datos producidos mediante diversos procesos de acuerdo con un dise-
ño y se analizan utilizando uno o más métodos estadísticos. De este
análisis se obtiene in- formación. La información se convierte, a
su vez, en conocimiento, utilizando los resulta- dos de las
experiencias específicas, la teoría y la literatura y aplicando
métodos estadísticos adicionales. Para convertir los datos en un
conocimiento que lleva a tomar mejores decisio- nes se utiliza
tanto la estadística descriptiva como la inferencial.
4 Estadística para administración y economía
Estadística descriptiva e inferencial
La estadística descriptiva está formada por los métodos
gráficos y numéricos que se utilizan para resumir y procesar los
datos y transformarlos en información. La estadística
inferencial constituye la base para hacer predicciones, previsiones
y estimaciones que se utilizan para transformar la información en
conocimiento.
Descripción de los datos
En el ejemplo 1.1 vemos una tabla de la producción diaria de una
fábrica de cereales.
EJEMPLO 1.1. Producción de cereales (estadística
descriptiva)
Un jefe de producción de Cereales de Trigo formó un equipo de
empleados para estu- diar el proceso de producción de cereales.
Durante la primera fase del estudio, se pesó una selección
aleatoria de cajas y se midió la densidad del producto. A
continuación, el
jefe quería estudiar datos relacionados con las pautas de
producción diaria. Se hallaron los niveles de producción (en miles)
de un periodo de 10 días. Represente estos resulta- dos
gráficamente y comente sus observaciones:
Día 1 2 3 4 5 6 7 8 9 10 Cajas (miles) 84 81 85 82 85 84 109 110 60
63
Solución
En la Figura 1.1, el jefe de producción puede identificar los días
de baja producción, así como los días de mayor
producción.
Producción diaria de cereales
Día
C a j a
s ( m
i l e s
)
Figura 1.1. Producción diaria de cereales de trigo.
No parecía que hubiera mucha diferencia en el número de cajas
producidas en los seis primeros días. Había variaciones de un día a
otro, pero los seis puntos tenían valo- res numéricos muy
parecidos. Sin embargo, en los días 7 y 8 el nivel de producción
pa- recía que era más alto. En cambio, en los días 9 y 10 parecía
que era más bajo. Basán- dose en estas observaciones, el equipo
intentó identificar las causas por las que la productividad era más
alta y más baja. Por ejemplo, tal vez en los días 9 y 10 estuvieran
ausentes trabajadores clave o hubiera cambiado el método de
producción o hubieran cambiado las materias primas. También se
podrían identificar las causas por las que aumentó la productividad
en los días 7 y 8.
Capítulo 1. ¿Por qué estudiar estadística? 5
Realización de inferencias
La estadística inferencial es un proceso, no un mero resultado
numérico. Este proceso pue- de consistir en una estimación, un
contraste de hipótesis, un análisis de relaciones o una predicción.
En primer lugar, podemos querer estimar un parámetro.
Supongamos que Flo- rin’s Flower Mart quiere desarrollar una nueva
estrategia de comercialización. Podría ser útil la información
sobre los hábitos de gasto de los clientes de la floristería.
Florin puede querer:
Estimar la edad media de los clientes de la tienda.
Estimar la diferencia entre la cantidad media que los clientes
cargan a una Visa y la cantidad media que cargan a American
Express. Estimar la proporción de clientes que están insatisfechos
con el sistema de reparto de la tienda.
En segundo lugar, podemos querer contrastar una hipótesis
sobre un parámetro. Por ejemplo, Florin puede querer:
Contrastar si los clientes tienen este año una preferencia por el
color de las rosas dis- tinta a la del año pasado. Contrastar si
menos del 25 por ciento de los clientes de la tienda son turistas.
Contrastar si las ventas son mayores los fines de semana que el
resto de los días de la semana. Contrastar si la cantidad
media que gastaron los clientes en su última compra
superó los 40 $.
Las respuestas a estos tipos de preguntas pueden ayudar a Florin a
lanzar una campaña publicitaria que le permita reducir los costes,
incrementar los beneficios y aumentar la sa- tisfacción de los
clientes.
En tercer lugar, podemos querer analizar las relaciones
entre dos o más variables. El director financiero de General
Motors quiere tomar decisiones estratégicas que afectan a toda la
compañía. En esos casos, puede utilizar series de datos
macroeconómicos de los que puede disponerse en fuentes como el
Bureau of Economic Analysis del Departamento de Comercio de Estados
Unidos para analizar las relaciones entre variables como el pro-
ducto interior bruto, el tipo de interés, la renta per cápita, la
inversión total y la oferta mo- netaria, que indican la situación
general de la economía nacional. El director financiero puede
hacerse las siguientes preguntas:
¿Influye la tasa de crecimiento de la oferta monetaria en la tasa
de inflación? Si General Motors sube un 5 por ciento el precio de
los automóviles de tamaño inter- medio, ¿cómo afectará la subida a
las ventas de estos automóviles? ¿Afecta la legislación sobre el
salario mínimo al nivel de desempleo?
¿Cómo se comienza a responder a la pregunta sobre el efecto que
puede producir una subida de los precios en la demanda de
automóviles? La teoría económica básica nos dice que, manteniéndose
todo lo demás constante, una subida del precio va acompañada de una
reducción de la cantidad demandada. Sin embargo, esa teoría es
puramente cualitativa. No nos dice cuánto disminuye la
cantidad demandada. Para avanzar más, hay que recoger in- formación
sobre cómo ha respondido la demanda a las variaciones del precio en
el pasado y evaluarla. Estudiando estadística inferencial,
aprenderemos a recoger información y a analizar relaciones.
En cuarto lugar, podemos necesitar predecir, es decir, hacer
predicciones fiables. Las decisiones de inversión deben hacerse
mucho antes de que pueda llevarse un nuevo
6 Estadística para administración y economía
producto al mercado y, evidentemente, es deseable tener
predicciones de la situación en la que se encontrará probablemente
el mercado dentro de unos años. Cuando los productos están
consolidados, las predicciones sobre las ventas a corto plazo son
importantes para decidir los niveles de existencias y los programas
de producción. Las predicciones de los futuros tipos de interés son
importantes para una empresa que tiene que decidir si emite o no
nueva deuda. Para formular una política económica coherente, el
gobierno necesita pre- dicciones de los resultados probables de
variables como el producto interior bruto. Las pre- dicciones de
los futuros valores dependen de las regularidades descubiertas en
la conducta anterior de estas variables. Por lo tanto, se recogen
datos sobre la conducta anterior de la variable que va a predecirse
y sobre la conducta de otras variables relacionadas con ella.
Utilizaremos la estadística inferencial para analizar esta
información y sugerir entonces las tendencias futuras
probables.
EJERCICIOS
Ejercicios básicos
1.7. Suponga que es dueño de una tienda de alimenta-
ción.
a) Ponga un ejemplo de una pregunta que podría responderse
utilizando la estadística descriptiva.
b) Ponga un ejemplo de una pregunta en la que sería útil
estimar un parámetro.
c) Ponga un ejemplo de una pregunta sobre una posible
relación entre dos variables que tienen interés para su tienda de
alimentación.
d) Ponga un ejemplo de una cuestión en la que hay que hacer
una predicción.
1.8. Averigue si debe utilizarse la estadística descripti- va
o la inferencial para obtener la siguiente infor- mación:
a) Un gráfico que muestra el número de botellas defectuosas
producidas durante el turno de día a lo largo de una semana.
b) Una estimación del porcentaje de empleados que llegan
tarde a trabajar.
c) Una indicación de la relación entre los años de
experiencia de los empleados y la escala sa- larial.
RESUMEN
Las decisiones deben tomarse en condiciones de incer- tidumbre.
Todas las áreas de negocios, así como otras disciplinas, utilizan
la estadística para tomar esas deci- siones. Los contables pueden
necesitar seleccionar muestras para realizar auditorías. Los
inversores finan- cieros utilizan la estadística para comprender
las fluc- tuaciones del mercado y elegir entre varias inversiones
de cartera. Los directivos que quieren saber si los clien- tes
están satisfechos con los productos o los servicios de su compañía
pueden utilizar encuestas para averi- guarlo. Los ejecutivos de
marketing pueden querer in-
formación sobre las preferencias de los clientes, sus há- bitos de
compra o las características demográficas de los compradores por
Internet. En cada una de estas si- tuaciones, debemos definir
meticulosamente el proble- ma, averiguar qué datos se necesitan,
recogerlos, resu- mirlos y hacer inferencias y tomar decisiones
basadas en los datos obtenidos. La teoría estadística es esencial
desde la definición inicial del problema hasta la deci- sión final
y puede llevar a reducir los costes, a obtener más beneficios, a
mejorar los procesos y a aumentar la satisfacción de los
clientes.
TÉRMINOS CLAVE
muestra, 3 muestra aleatoria, 3 muestreo aleatorio simple, 3
parámetro, 4 población, 3
EJERCICIO Y APLICACIÓN DEL CAPÍTULO
1.9. Se hizo a una muestra aleatoria de 100 estu- diantes
universitarios una serie de preguntas para obtener datos
demográficos sobre su nacionalidad, la especialización cursada, el
sexo, la edad, el cur- so en el que están y su nota media hasta ese
mo- mento. También se les hizo otras preguntas sobre su grado de
satisfacción con el aparcamiento del campus universitario, las
residencias del campus y los comedores del campus. Las respuestas a
estas preguntas sobre su satisfacción se midieron en una escala de
1 a 5, donde 5 era el nivel de satisfac- ción más alto. Por último,
se les preguntó si, cuan-
do se graduaran, tenían intención de seguir estu- dios de postgrado
en un plazo de 5 años (0: no; 1: sí). Estos datos se encuentran en
el fichero de da- tos Findstad and Lie Study.
a) Ponga un ejemplo de cómo se aplica la estadís- tica
descriptiva a estos datos.
b) Ponga un ejemplo de una pregunta que conlle- ve una
estimación a la que podría responderse por medio de la estadística
inferencial.
c) Ponga un ejemplo de una relación posible entre dos
variables.
Bibliografa
1. The North American Fareston versus Tamoxifen Adjuvant Trial for
Breast Cancer. www.naftatrial.com.
8 Estadística para administración y economía
Esquema del capítulo
2.1. Clasificación de las variables Categóricas o numéricas Niveles
de medición
2.2. Gráficos para describir variables categóricas Tablas Gráficos
de barras y gráficos de tarta Diagramas de Pareto
2.3. Gráficos para describir datos de series temporales 2.4.
Gráficos para describir variables numéricas
Distribuciones de frecuencias Histogramas y ojivas Diagramas de
tallo y hojas
2.5. Tablas y gráficos para describir relaciones entre variables
Diagramas de puntos dispersos Tablas cruzadas
2.6. Errores en la presentación de datos Histogramas engañosos
Gráficos de series temporales engañosos
Introducción
Una vez que definimos con cuidado un problema, necesitamos recoger
datos. A menudo el número de observaciones recogidas es tan grande
que los resultados efectivos del estudio no están claros. Nuestro
objetivo en este capítulo es resumir los datos de mane- ra que
tengamos una imagen clara y precisa. Queremos reducir lo más
posible una ma- sa de datos, evitando al mismo tiempo la
posibilidad de ocultar características importan- tes por reducirlos
excesivamente. Por desgracia, no existe una única «manera correcta»
de describir los datos. La línea de ataque adecuada normalmente es
específica de cada problema y depende de dos factores: el tipo de
datos y el fin del estudio.
Se ha dicho que una imagen vale más que mil palabras. Asimismo, un
gráfico vale más que mil cifras. En este capítulo, introducimos
tablas y gráficos que nos ayudan a comprender mejor los datos y que
constituyen una ayuda visual para tomar mejores decisiones. Los
informes mejoran con la inclusión de tablas y gráficos adecuados,
como distribuciones de frecuencia, gráficos de barras, gráficos de
tarta, diagramas de Pareto, gráficos de series temporales,
histogramas, diagramas de tallo y hojas u ojivas. La vi-
sualización de los datos es importante. Siempre debemos
preguntarnos qué sugiere el gráfico sobre los datos, qué es lo que
vemos.
2.1. Clasificación de las variables
Las variables pueden clasificarse de varias formas. Uno de los
métodos de clasificación se refiere al tipo y la cantidad de
información que contienen los datos. Los datos son categóri- cos o
numéricos. Otro método consiste en clasificar los datos por niveles
de medición, dan- do variables cualitativas o cuantitativas.
Categóricas o numéricas
Las variables categóricas producen respuestas que
pertenecen a grupos o categorías. Por ejemplo, las respuestas a
preguntas sí / no son categóricas. Las respuestas a
«¿Tiene usted teléfono móvil?» y «¿Ha estado alguna vez en Oslo?»
se limitan a un sí o un no. Una com- pañía de seguros médicos puede
clasificar las reclamaciones incorrectas según el tipo de errores,
como los errores de procedimiento y diagnóstico, los errores de
información al pa- ciente y los errores contractuales. Otros
ejemplos de variables categóricas son las preguntas sobre el sexo,
el estado civil y la carrera universitaria. A veces, las variables
categóricas permiten elegir entre varias opciones, que pueden ir
desde «totalmente en desacuerdo» has- ta «totalmente de acuerdo».
Consideremos, por ejemplo, una evaluación del profesorado en la que
los estudiantes tienen que responder a afirmaciones como «El
profesor de este curso es un buen profesor» (1: totalmente en
desacuerdo; 2: un poco en desacuerdo; 3: ni de acuerdo ni en
desacuerdo; 4: un poco de acuerdo; 5: totalmente de acuerdo).
Las variables numéricas pueden ser variables discretas
o variables continuas. Una va-
riable numérica discreta puede tener (pero no necesariamente)
un número finito de valo- res. Sin embargo, el tipo más frecuente
de variable numérica discreta con el que nos en- contraremos
produce una respuesta que proviene de un proceso de recuento.
Ejemplos de variables numéricas discretas son el número de
estudiantes matriculados en una clase, el número de créditos
universitarios obtenidos por un estudiante al final de un
cuatrimestre, el número de acciones de Microsoft que contiene la
cartera de un inversor y el número de reclamaciones de
indemnizaciones presentado tras un huracán.
Una variable numérica continua puede tomar cualquier
valor de un intervalo dado de números reales y normalmente proviene
de un proceso de medición (no de recuento). Ejemplos de variables
numéricas continuas son la altura, el peso, el tiempo, la distancia
y la temperatura. Una persona puede decir que mide 1,89 metros,
pero en realidad puede te- ner una estatura de 1,81, 1,79 o algún
otro número similar, dependiendo de la precisión del instrumento
utilizado para medir la estatura. Otros ejemplos de variables
numéricas conti- nuas son el peso de las cajas de cereales, el
tiempo que se hace una persona en una carrera y la distancia entre
dos ciudades. En todos los casos, el valor podría desviarse dentro
de un cierto margen, dependiendo de la precisión del instrumento de
medición utilizado. En las conversaciones diarias tendemos a
truncar las variables y a tratarlas como si fueran varia- bles
discretas sin pensarlo ni siquiera dos veces. Sin embargo, la
diferencia es muy impor- tante en estadística, ya que es uno de los
factores de los que depende que un método esta- dístico sea mejor
que otro en un determinado caso.
Niveles de medición
También podemos dividir los datos en cualitativos y
cuantitativos. Con datos cualitativos, la «diferencia» entre
los números no tiene ningún significado mensurable. Por ejemplo, si
a un jugador de baloncesto se le asigna el número «20» y a otro el
número «10», no pode-
10 Estadística para administración y economía
mos extraer la conclusión de que el primero es el doble de bueno
que el segundo. Sin em- bargo, con datos cuantitativos la
diferencia entre los números tiene un significado mensura- ble.
Cuando un estudiante obtiene una puntuación de 90 en un examen y
otro obtiene una puntuación de 45, la diferencia es mensurable y
tiene un significado.
Veremos que los datos cualitativos pueden ser niveles de medición
nominales y ordina- les. Los datos cuantitativos pueden ser niveles
de medición basados en intervalos y en ra- zones.
Los niveles de medición nominales y ordinales se refieren a los
datos que se obtienen con preguntas categóricas. Las respuestas a
preguntas sobre el sexo, el país de origen, la afiliación política
y la propiedad de un teléfono móvil son nominales. Se
considera que los datos nominales son el tipo de datos más bajo o
más débil, ya que la identificación numéri- ca se elige
estrictamente por comodidad.
Los valores de las variables nominales son palabras que describen
las categorías o cla- ses de respuestas. Los valores de la variable
sexo son hombre y mujer; los valores de «¿Ha estado alguna vez en
Oslo?» son «sí» y «no». Asignamos arbitrariamente un código o un
número a cada respuesta. Sin embargo, este número no se emplea más
que para clasificar. Por ejemplo, podríamos codificar las
respuestas sobre el sexo o las respuestas sí / no de la
forma siguiente:
1%Hombres 1%Sí 2%Mujeres 2%No
Los datos ordinales indican el orden que ocupan los
objetos y, al igual que en el caso de los datos nominales, los
valores son palabras que describen las respuestas. He aquí algu-
nos ejemplos de datos ordinales y de códigos posibles:
1. Valoración de la calidad del producto (1: malo; 2: medio;
3: bueno). 2. Valoración de la satisfacción con el servicio
de comedor de la universidad (1: muy
insatisfecho; 2: moderadamente insatisfecho; 3: ninguna opinión; 4:
moderada- mente satisfecho; 5: muy satisfecho).
3. Preferencia de los consumidores entre tres tipos de
bebidas refrescantes (1: el que más se prefiere; 2: segunda opción;
3: tercera opción).
En estos ejemplos, las respuestas son ordinales, es decir, siguen
un orden, pero la «diferen- cia» entre ellas no tiene ningún
significado mensurable. Es decir, la diferencia entre la pri- mera
opción y la segunda puede no ser igual que la diferencia entre la
segunda y la tercera.
Los niveles de medición basados en intervalos y en razones se
refieren a los datos en una escala ordenada, en la que la
diferencia entre las mediciones tiene un significado.
Una escala de intervalos indica el orden y la distancia con
respecto a un cero arbitrario medidos en intervalos unitarios. Es
decir, se ofrecen datos en relación con un nivel de referencia
determinado arbitrariamente. La temperatura es un ejemplo clásico
de este nivel de medi- ción; los niveles de referencia determinados
arbitrariamente se basan, en general, en los grados Fahrenheit o
Celsius. Supongamos que hace 80 grados Fahrenheit en Orlando (Flo-
rida) y sólo 20 en St. Paul (Minnesota). Podemos extraer la
conclusión de que la diferencia de temperatura es de 60 grados,
pero no podemos saber si hace el cuádruple de calor en Orlando que
en St. Paul. Supongamos que cuando se estableció la temperatura
Fahrenheit, el punto de congelación se fijó en 500 grados. En ese
caso, en nuestro ejemplo de la tem- peratura de Orlando y St. Paul,
ésta habría sido de 548 grados en Orlando y de 488 en St. Paul (la
diferencia sigue siendo de 60 grados). El año es otro ejemplo de un
nivel de medi- ción basado en intervalos; en este caso los niveles
de referencia se basan en el calendario gregoriano o en el
islámico.
Capítulo 2. Descripción gráfica de los datos 11
Los datos basados en una escala de razones sí indican tanto el
orden como la distancia con respecto a un cero natural y los
cocientes entre dos medidas tienen un significado. Una persona que
pesa 80 kilos pesa el doble que una que pesa 40; una persona que
tiene 40 años es el doble de vieja que una que ti