124
2016 Universidad Nacional Mayor de Curso: Estadística Industrial Profesor: Víctor Pérez Quispe Alumnos: Laboratorio de Estadística Industrial

Trabajo Estadistica Industrial

Embed Size (px)

DESCRIPTION

a

Citation preview

Page 1: Trabajo Estadistica Industrial

2016

Universidad Nacional Mayor de San Marcos

Curso: Estadística Industrial

Profesor: Víctor Pérez Quispe

Alumnos:

Bautista Salazar Julio Jason 10170040

Ganoza Morales Guillermo 10170116

Laboratorio de Estadística Industrial

Page 2: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

García Alarcón Carlos Alexander 11170020

1

Page 3: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

INDICE

Problemas aplicativos de Distribución Normal......................................................................................2

Problemas aplicativos de Distribución de Muestras Pequeñas.....................................................11

Problemas Aplicativos de Regresión Simple.........................................................................................20

Problemas Aplicativos de Regresión Múltiple......................................................................................30

Problemas Aplicativos de Chi Cuadrada................................................................................................42

Problemas Aplicativos de Prueba de Independencia.........................................................................48

Problemas Aplicativos de la Distribución de Poisson........................................................................52

Problemas Aplicativos de Métodos no Paramétricos.........................................................................60

Prueba de Signos........................................................................................................................................60

Problemas Aplicativos de la Prueba de Wilcoxon...........................................................................69

Problemas Aplicativos de la Prueba de Mann-Whitney-Wilcoxon.............................................77

Prueba de Kruskal-Wallis.........................................................................................................................85

2

Page 4: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas aplicativos de Distribución Normal

Problema n°1:

Le han pedido que evalúe la respuesta de las empresas a una nueva obligación legal de incrementar las prestaciones sanitarias que ofrecen a sus empleados. Tiene una muestra aleatoria de 76 cambios porcentuales de las prestaciones sanitarias prometidas. La media muestral de los cambios porcentuales es 0.078 y la desviación típica muestral es 0.201. Halle e interprete el valor p de un contraste de la hipótesis nula de que la media poblacional de los cambios porcentuales es 0 frente a la hipótesis alternativa bilateral.

Solución:

3

Page 5: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

p=0.1% <1% entonces se rechaza la hipótesis nula H0, es decir si se tiene que incrementar las prestaciones sanitarias que ofrecen a sus empleados.

4

Page 6: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n°2:

El director de producción de Rodamientos Niquelados, S.A., le ha pedido ayuda para evaluar el proceso modificado de producción de rodamientos. Cuando el proceso funciona correctamente, produce rodamientos cuyo peso sigue una distribución normal de media poblacional 5 onzas y desviación típica poblacional 0.1 onzas. Se ha recurrido a un nuevo proveedor de materia prima para un lote reciente de producción y el director quiere saber si, como consecuencia del cambio, el peso medio de los rodamientos es menor. No hay razón alguna para sospechar que el nuevo proveedor plantea problemas y el director continuará recurriendo a él a menos que existan pruebas contundentes de que están produciéndose rodamientos de menor peso que antes. En este problema obtenemos una muestra aleatoria de n = 16 observaciones y la media muestral es 4.962. Tome la decisión realizando una prueba de hipótesis por el método clásico y utilizando el valor p.

Haga la prueba con un nivel de significancia = 0.05.

Solución:

En este caso nos interesa saber si existen pruebas contundentes para concluir que están produciéndose rodamientos de menor peso. Por lo tanto, contrastamos la hipótesis.

5

Page 7: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

6

Page 8: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Al encontrar p=0.064>0.05 no se rechaza la hipótesis nula Ho, por lo tanto no se están produciéndose rodamientos de menor peso.Problema n°3:En un estudio se extrajeron muestras aleatorias de empleados de restaurantes de comida rápida en los que el empresario da formación. En una muestra de 67 empleados que no habían terminado los estudios secundarios, 11 habían participado en un programa de formación de la empresa. En una muestra aleatoria independiente de 113 empleados que habían terminado los estudios secundarios, pero no habían ido a la universidad, habían participado 27. Contraste al nivel del 1 por ciento la hipótesis nula de que las tasas de participación de los dos grupos son iguales frente a la hipótesis alternativa de que la tasa es mucho más baja en el caso de los que no habían terminado los estudios secundarios.

Solución

7

Page 9: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

p=15.9. % >1% entonces se acepta hipótesis nula H0.

8

Page 10: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n° 4:

El precio de venta promedio nacional para casas unifamiliares es de 181900 dólares. Para una muestra de ventas de 40 casa unifamiliares nuevas en el sur se observó una media muestral de 166400 dólares y una desviación estándar de 33500 dólares.

a) Formule las hipótesis nula y alternativa que servirán para determinar si los datos de la muestra sustentan la conclusión de que el precio de ventas promedio poblacional para las casas unifamiliares nuevas en el sur es menor que la media nacional de 181900 dólares.

b) ¿Cuál es el valor del estadístico de prueba?c) ¿Cuál es el valor de p?d) Con α = 0.01, ¿Cuál es su conclusión?

Solución:

a)

b)

9

Page 11: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

p=0.2% <1% entonces se rechaza hipótesis nula H0.

Problema n°5:El expendio de pollos a la brasa de RikoPollo S.A asegura que 90% de sus órdenes se entregan en menos de 10 minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. ¿Puede concluirse, en el nivel de significancia 0.1, que menos de 90% de las órdenes se entregan en menos de 10 minutos?

Solución:

H0:

H1:

10

Page 12: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

11

Page 13: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

p=0.4% <1% entonces se rechaza hipótesis nula H0, se acepta que menos de 90% de las órdenes se entregan en menos de 10 minutos

Problema n° 6:El consejo de seguridad nacional de un país encuentra que 52% de los conductores en las autopistas son hombres. Ayer se encontró en una muestra de 300 autos que viajaban por una determinada autopista, que 170 de los conductores eran hombres. ¿Puede concluirse, en el nivel de significancia 0.01, que en esta autopista conducían más hombres que los que indican las estadísticas nacionales?

Solución:

H0:

H1:

12

Page 14: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

p=5.3% >1% entonces NO se rechaza hipótesis nula H0, en esta autopista no conducían más hombres

13

Page 15: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas aplicativos de Distribución de Muestras PequeñasProbleman°1:

Los registros de la empresa Yellows indican que la duración media de un juego de bujías es 22 100 millas. La distribución de los tiempos de vida útil de las bujías es aproximadamente normal.

Un fabricante de bujías afirma que sus bujías tienen una duración media superior a 22 100 millas. El dueño de los camiones compra muchos de estos juegos. En una muestra de 18 juegos el tiempo medio de vida útil fue 23400 millas y la desviación estándar 1 500 millas ¿hay suficientes evidencias, con el nivel de significancia 0.05, que apoyen la afirmación?

Solución:

Ho: µ ≤ 22100

H1: µ > 22100

14

Page 16: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

15

Page 17: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Al encontrar un p de 0.1% <5% se rechaza Ho Con lo que la vida media de las bujías es mayor a 22 100 millas.

Problema n°2:

Un criador de pollos sabe por experiencia que el peso de los pollos de cinco meses es 4.35 libras. Los pesos siguen una distribución normal .para tratar de aumentar el peso de dichas aves se le agrega un aditivo al alimento .en una muestra de pollos de cinco meses se obtuvieron los siguientes pesos (en libras).

Pesos 4.41 4.37 4.33 4.35 4.30 4.39 4.36 4.38 4.40 4.39

En el nivel 0.01 ¿el aditivo ha aumentado el peso de los pollos?

Ho: µ ≤ 4.35

H1: µ > 4.35

16

Page 18: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

17

Page 19: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Como p=6.4%>1% se acepta la hipótesis nula Ho. El aditivo no ha aumentado el peso de los pollos.

Problema n°3:

Una muestra de las calificaciones en un examen presentado en un curso de estadística es:

Hombres

72 69 98 66 85 76 79 80 77

Mujeres

81 67 90 78 81 80 76

A nivel de significancia de 0.01. ¿La calificación media de las mujeres es más alta que la calificación media de los hombres?

Solución:

Ho: µ2 ≤µ1

H1: µ2 > µ1

18

Page 20: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Como p=40.9%>1% se acepta Ho. La calificación media de las mujeres no es más alta que la de los varones.

19

Page 21: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n°4:

Recuerde que la empresa Nikel Saving desea comprara las dos agencias que utiliza para realizar avalúos de casas. Para esto selecciono una muestra de 10 propiedades residenciales y programó un avaluó por cada agencia .los resultados, reportados en miles de dólares, son:

Casa Schadek Bowyer

1 135 128

2 110 105

3 131 119

4 142 140

5 105 98

6 130 123

7 131 127

8 110 115

9 125 122

10 149 145

Al nivel de significancia de 0.05. ¿Puede concluirse que hay una diferencia en los avalúos medios de las casas?

Ho: µ =0

H1: µ ≠0

20

Page 22: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

21

Page 23: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n°5:

Lammers Limo ofrece servicio de limusinas desde el edificio del ayuntamiento de la ciudad de Toledo, Ohio, hasta el aeropuerto Metro, en Detroit. El presidente de la compañía, San Lammers, está considerando dos rutas, una vía es la ruta US25 y la otra es vía la autopista I75 .Desea estudiar el tiempo necesario para llegar al aeropuerto por cada uno de estos caminos y después comparar (en minutos). Utilizando el nivel de significancia de 0.10. ¿Existe alguna diferencia en la variación de los tiempos de recorrido por ambas rutas?

Ho: σ1 = σ 2

H1: σ1 ≠ σ2

22

RUTA US25 INTERESTATAL 75

52

67

56

45

70

54

64

59

60

61

51

56

63

57

65

Page 24: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

23

Page 25: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Regresión SimpleProblema n°1:

Se llevó a cabo un estudio en el Instituto Politécnico y Universidad Estatal de Virginia para determinar si ciertas medidas de resistencia estática del brazo (Kg.) tienen alguna influencia en las características de "elevación dinámica (milímetros)" de un individuo. Se sometieron a pruebas de resistencia a 10 individuos y después se les pidió realizar una prueba de levantamiento de pesas en la que el peso se debía levantar en forma dinámica por arriba de la cabeza.

Los datos son los siguientes:

INDIVIDUO RESISTENCIA DEL BRAZO

LEVANTAMIENTO DINÁMICO

1

2

3

4

5

6

7

8

9

10

17.3

19.3

29.6

29.6

19.5

29.9

19.7

30.3

22.9

31.3

71.7

48.3

78.3

60.0

88.3

71.7

75.0

85.0

91.7

85.0

24

Page 26: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Gráficas de puntos:

25

Page 27: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

26

Page 28: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Al encontrar un r2 de 2.9% no se ajusta a una regresión lineal

27

Page 29: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

28

Page 30: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n°2:

El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de Inglaterra y Gales en el período de 1970-72. Cada grupo está formado por trabajadores de la misma profesión (médicos, trabajadores textiles, decoradores,...etc.,) y en cada uno de los veinticinco grupos muestreados se han observado dos variables: el índice estandarizado de consumo de cigarrillos y el índice de muertes por cáncer de pulmón.

29

Page 31: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Estudiar la regresión lineal del índice de mortalidad frente al índice de fumadores.

30

Page 32: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

31

Page 33: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

No es conveniente un ajuste lineal al encontrar un R2 de 51.3%

32

Page 34: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

33

Page 35: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n°3:

En 34 lotes de 120 libras de cacahuetes se observó el nivel medio de anatoxina (partes por billón) (X) y el porcentaje de cacahuetes no contaminados (Y):

Analizar estos datos e investigar la relación entre estas dos variables para predecir

Y en función de X. ¿Es adecuado el ajuste lineal?

34

Page 36: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

35

Page 37: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Al encontrar un R-cuad=82.9% resulta conveniente trazar un ajuste lineal

36

Análisis de regresión: Y vs. X

La ecuación de regresión es

Y = 100 - 0,00290 X

Predictor Coef SE Coef T P

Constante 100,002 0,011 9184,91 0,000

X -0,0029035 0,0002335 -12,43 0,000

S = 0,0393282 R-cuad. = 82,9% R-cuad.(ajustado) = 82,3%

Análisis de varianza

Fuente GL SC CM F P

Regresión 1 0,23915 0,23915 154,62 0,000

Error residual 32 0,04949 0,00155

Total 33 0,28864

Ajuste a un x=100

Observaciones poco comunes

EE de Residuo

Obs X Y Ajuste ajuste Residuo estándar

28 111 99,6580 99,6792 0,0187 -0,0212 -0,61 X

X denota una observación cuyo valor X le concede gran apalancamiento.

Valores pronosticados para nuevas observaciones

EE de

Nueva obs Ajuste ajuste IC de 95% IP de 95%

1 99,7117 0,0163 (99,6786. 99,7449) (99,6251. 99,7984)

Valores de predictores para nuevas observaciones

Nueva obs X

1 100

Page 38: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Regresión MúltipleProblema n°1:

En la Facultad de Ingeniería de Sistemas y Computo de la Universidad "Inca Garcilaso de la Vega" se quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de PHP, para lo cual se escoge al azar una muestra de 15 alumnos y ellos registran notas promedios en las asignaturas de Algoritmos, Base de Datos y Programación como se muestran en el siguiente cuadro.

ALUMNO

PHP ALGORITMOS BASE DE DATOS

PROGRAMACIÓN

1 13 15 15 132 13 14 13 123 13 16 13 144 15 20 14 165 16 18 18 176 15 16 17 157 12 13 15 118 13 16 14 159 13 15 14 1310 13 14 13 1011 11 12 12 1012 14 16 11 1413 15 17 16 1514 15 19 14 1615 15 13 15 10

Lo que buscamos es construir un modelo para determinar la dependencia que exista de aprendizaje reflejada en las notas de la asignatura de PHP, conociendo las notas de las asignaturas Algoritmos, Programación.

Determine la ecuación de regresión.37

Page 39: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Calcule e interprete.

Estimar la nota del curso de PHP si se sabe que en Algoritmos tiene 15, Base de Datos 16 y Programación 17.

38

Page 40: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Solución:

39

Page 41: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Coeficiente de determinación: es 0.697, entonces el 69.70% del aprendizaje del Curso de PHP puede ser explicado mediante las notas obtenidas por las asignaturas de Algoritmos, Base de Datos y Programación.

Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.003 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0.

Podemos observar que hay una buena relación de linealidad entre las variables dependientes con la dependiente.

40

Page 42: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

41

Page 43: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

42

Page 44: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

43

Page 45: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problema n°2:

Montgomery y Peck (1982) describen el empleo de un modelo de regresión para relacionar la cantidad de tiempo requerido por un vendedor de ruta (chofer) para abastecer una maquina vendedora de refrescos con el número de latas que incluye la misma, y la distancia del vehículo de servicio a la ubicación de la máquina. Este modelo se empleó para el diseño de la ruta, el programa y el despacho de vehículos. La tabla presenta 25 observaciones respecto al tiempo de entrega tomadas del mismo estudio descrito por Montgomery y Peck.

44

Page 46: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

NUMERO DE OBSERVACIONES

TIEMPO DE ENTREGA (MIN.)

NUMERO DE LATAS

DISTANCIAS(PIES)

1 9.95 2 502 24.45 8 110

3 31.75 11 120

4 35.00 10 550

5 25.02 8 295

6 16.8 4 200

7 14.38 2 375

8 9.60 2 52

9 24.35 9 100

10 27.50 8 300

11 17.08 4 412

12 37.00 11 400

13 41.95 12 500

14 11.66 2 360

15 21.65 4 205

16 17.89 4 400

17 69.00 20 600

18 10.30 1 585

19 34.93 10 540

20 46.59 15 250

21 44.88 15 290

22 54.12 16 510

23 56.63 17 590

24 22.13 6 100

45

Page 47: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

25 21.15 5 400

Determine la ecuación de regresión. Calcule e interprete.

Estimar el tiempo de entrega si se sabe que el número de latas es 20 y la distancia del vehículo es 110.

Solución:

46

Page 48: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

47

Page 49: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Coeficiente de determinación: es 0.981, entonces el 98.1% del tiempo de un vendedor para abastecer una maquina vendedora puede ser explicado mediante el número de latas y la distancia del camión.

Si se selecciona un nivel de significancia de 0.05, podemos observar que, el valor de P=0.000 es menor a 0.05 por lo tanto rechazamos la hipótesis nula y concluimos que al menos un coeficiente de regresión no es 0.

Observamos un relación lineal entre la variable dependiente Nro. De latas con respecto al T.de entrega (Variable independiente), y en menor grado de linealidad Distancia Vs Tiempo de entrega.

48

Page 50: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

49

Page 51: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Contribución de la variable X1 sabiendo que X2 está incluida

SSR(X1 / X2) = SSR(X1 y X2) – SSR(X2)

=5992.4-5887.3=105.1

Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,20.23>4.3

Entonces la variable X1(nro. de latas), si contribuye significativamente a la ecuación de regresión

Contribución de la variable X2 sabiendo que X1 está incluida

SSR(X2 / X1) =SSR(X1 y X2) – SSR(X1)

=5992.4-1483.9=4508.5

50

Page 52: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Para un nivel de significancia de 0.05 con 1 y 22 gl F=4.3 ,867.019>4.3

Entonces la variable X2(distancia), si contribuye significativamente a la ecuación de regresión, y podríamos concluir que es más importante que la varia X1.

51

Page 53: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

52

Page 54: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Chi Cuadrada

Distribución de Bondad de Ajuste: Chi CuadradaProblema n°1:

Probar la hipótesis siguiente usando la prueba de bondad de ajuste X2.

H0: pA=0.40, pB=0.40 y pc=0.20

H1: pA≠0.40, pB≠0.40 y pc≠0.20

En una muestra de 200 elementos se tiene que 60 pertenecen a la categoría A, 120 a la categoría B y 20 a la categoría C.

Use α=0.01 y pruebe si las proporciones son las afirmadas en H0.

Solución:

Calculamos las frecuencias esperadas con n=200:

Categoría A = 0.40 (200) = 80

Categoría B = 0.40 (200) = 80

Categoría C = 0.20 (200) = 40

Calculamos el estadístico de prueba chi-cuadrada (X2):

CATEGORÍAS

NÚMERO OBSERVADOS(FI)

NÚMERO ESPERADOS(EI)

FI - EI (FI - EI)2

(FI - EI)2/ EI

A 60 80 -20 400 5

B 120 80 40 1600 20

C 20 40 -20 400 10

53

Page 55: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

TOTAL X2=35

Para k-1=3-1=2 grados de libertad, con X2=35. Mediante tabla el valor-p es menor a 0.005. Entonces el valor-p≤ α=0.01, por tanto, se rechaza H0.

54

Page 56: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =35, se calcula el valor-p que se aproxima a 0. Por tanto el valor-p≤0.01. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no tienen la misma proporción en las poblaciones.

Problema n°2:

Durante las primeras 13 semanas, se registraron las proporciones siguientes de televidentes los sábados de 8 a 9 de la noche: ABC 29%, CBS 28%, NBC 25% e independientes 18%. Dos semanas después en una muestra de 300 hogares se obtuvieron las audiencias siguientes en sábados por la noche: ABC 95 hogares, CBS 70 hogares, NBC 89 hogares e independientes 46 hogares. Use α=0.05 para determinar si han variado las proporciones en la audiencia de televidentes.

Solución:

H0: pA=0.29, pB=0.28, pc=0.25 y pD=0.18

H1: pA≠0.29, pB≠0.28 y pc≠0.25 y pD≠0.18

Nivel de significancia α=0.05.

Calculamos las frecuencias esperadas con n=300:

ABC = 0.29 (300) = 87

CBS = 0.28 (300) = 84

NBC = 0.25 (300) = 75

55

Page 57: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Independiente = 0.18 (300) = 54

Calculamos el estadístico de prueba chi-cuadrada (X2):

TELEVISORASNÚMERO

OBSERVADOS(FI)

NÚMERO ESPERADOS(E

I)FI - EI (FI -

EI)2(FI -

EI)2/ EI

ABC 95 87 8 64 0.7356

CBC 70 84 14 16 2.3333

NBC 89 75 14 196 2.6133

INDEPENDIENTE 46 54 -8 64 1.1852

TOTAL X2=6.8674

Para k-1=4-1=3 grados de libertad, con X2=6.8674. Mediante tabla el valor-p esta entre 0.10 y 0.05. Entonces el valor-p≥ α=0.05, por tanto, no se rechaza H0.

56

Page 58: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =6.86748, se calcula el valor-p =0.0762436. Por tanto el valor-p≥ α=0.05. Entonces se comprueba el no rechazo de la hipótesis nula, concluyendo que tienen la misma proporción en las poblaciones.

M&M/Mars, fabricantes de los chocolates M&M, realizaron un sondeo nacional en el que más de 10 millones de personas dieron su preferencia para un nuevo color. El resultado de este sondeo fue el reemplazo de un color café claro por uno azul. En el prospecto “Colors” de M&M/Mars, la distribución de los colores de estos chocolates es el siguiente:

CAFÉ AMARILLO

ROJO ANARANJADO

VERDE AZUL

30% 20% 20% 10% 10% 10%

En un estudio anterior se emplearon como muestra bolsas de 1 libra para determinar si los porcentajes dados eran reales. En la muestra de 506 dulces los resultados encontrados fueron los siguientes:

CAFÉ AMARILLO

ROJO ANARANJADO

VERDE AZUL

177

135 79 41 36 38

Use α=0.05 para determinar si estos datos coinciden con los datos por la empresa.

Solución:

H0: pA=0.30, pB=0.20, pc=0.20, pD=0.10, pE=0.10 y pf=0.10

H1: pA≠0.30, pB≠0.20, pc≠0.20, pD≠0.10, pE≠0.10 y pf≠0.10

Nivel de significancia α=0.05.

57

Page 59: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Calculamos las frecuencias esperadas con n=506:

Café = 0.30 (506) = 151.8

Amarillo = 0.20 (506) = 101.2

Rojo = 0.20 (506) = 101.2

Anaranjado = 0.10 (506) = 50.6

Verde = 0.10 (506) = 50.6

Azul = 0.10 (506) = 50.6

Calculamos el estadístico de prueba chi-cuadrada (X2):

COLORES DE CHOCOLATES

NÚMERO OBSERVADOS(FI)

NÚMERO ESPERADOS(EI)

FI - EI (FI - EI)2

(FI - EI)2/ EI

CAFÉ 177 151.8 25.20 635.04 4.1834

AMARILLO 135 101.2 33.80 1142.44 11.2889

ROJO 79 101.2 -22.20 492.84 4.8700

ANARANJADO

41 50.6 -9.6 92.16 1.8213

VERDE 36 50.6 -14.6 213.16 4.2126

AZUL 38 50.6 -12.6 158.76 3.1375

TOTAL X2=29.51

Para k-1=5-1=4 grados de libertad, con X2=29.51. Mediante tabla el valor-p es menor que 0.005. Entonces el valor-p≤ α=0.05, por tanto, se rechaza H0.

58

Page 60: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =29.5138, se calcula el valor-p =0.0000061. Por tanto el valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no tienen la misma proporción en las poblaciones.

59

Page 61: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Prueba de IndependenciaLa siguiente tabla de contingencia 2x3 contiene las frecuencias observadas de una muestra de tamaño de 200. Pruebe la independencia de las variables de renglón y de la columna usando la prueba X2 con α=0.05.

VARIABLE DE RENGLONES

VARIABLE DE COLUMNA

A B C

P 20 44 50

Q 30 26 30

Solución:

H0: Las variables de renglón son independientes a las variables columna.

H1: Las variables de renglón no son independientes a las variables columna.

Tabla de contingencia:

VARIABLE DE RENGLONES

VARIABLE DE COLUMNA

A B C TOTAL

P 20 44 50 114

Q 30 26 30 86

TOTAL 50 70 80 200

Hallando las frecuencias esperadas de cada celda:

eij=

60

Page 62: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

e11= =28.5 e12= =39.9 e13= =45.6

e21= =21.5 e22= =30.1 e23= =34.4

Tabla de números observados y esperados:

RENGLÓN

COLUMNA

NÚMERO OBSERVADOS(FI)

NÚMERO ESPERADOS(EI)

FI - EI

(FI -EI)2

(FI - EI)2/EI

P A 20 28.5 -8.5 72.25 2.5351

P B 44 39.9 4.1 16.81 0.4213

P C 50 45.6 4.4 19.36 0.4246

Q A 30 21.5 8.5 72.25 3.3605

Q B 26 30.1 -4.1 16.81 0.5585

Q A 30 34.4 -4.4 19.36 0.5628

TOTAL X2=7.8628

Para (2-1) x (3-1) = 2 grados de libertad y mediante tabla para X2=7.8628, se calcula el valor-p que esta entre 0.025 y 0.01. Por tanto el valor-p≤ α=0.05. Entonces se rechaza la hipótesis nula.

61

Page 63: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =7.863, se calcula el valor-p = 0.020. Por tanto el valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no hay independencia entre variable renglón y variable columna.

Una de las preguntas a los suscriptores de Bussiness Week fue, “En sus viajes de negocios de los último 12 meses, ¿Qué tipo de boleto ha comprado?” Los datos obtenidos se presentan en la tabla de contingencia siguiente.

TIPO DE BOLETO

TIPO DE VUELO

Vuelo Nacional

Vuelo Internacional

PRIMERA CLASE

29 22

CLASE NEGOCIO/EJECUTIVA

95 121

VUELO TRADICIONAL/ CLASE ECONÓMICA

518 135

Solución:

H0: Los tipo de boleto son independientes con los tipos de vuelo.

62

Page 64: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

H1: Los tipo de boleto son no independientes con los tipos de vuelo.

Tabla de contingencia:

TIPO DE BOLETO

TIPO DE VUELO

V. Nacional V. Internacional

TOTAL

PRIMERA CLASE

20 44 64

CLASE NEGOCIO

30 26 56

VUELO TRADICIONAL

518 135 653

TOTAL 568 205 773

Hallando las frecuencias esperadas de cada celda:

eij=

e11= =28.5 e12= =39.9 e21= =45.6

e22= =21.5 e31= =30.1 e32= =34.4

Tabla de números observados y esperados:

TIPO DE BOLETO

TIPO DE VUELO

NÚMERO OBSERVADOS(

FI)

NÚMERO ESPERADOS(

EI)

FI - EI

(FI EI)2

(FI - EI)2/EI

PRIMERA Nacional 20 47.03 27.0 730.6 15.535

63

Page 65: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

3 2

PRIMERA Internacional 44 16.97 27.0

3730.6

2 43.054

NEGOCIO Nacional 30 41.15-

11.15

124.32 3.0212

NEGOCIO Internacional 26 14.85 11.1

5124.3

2 8.3719

TRADICIONAL Nacional 518 479.82 38.1

81457.

7 3.0380

TRADICIONAL

Internacional 135 173.18 38.1

81457.

7 8.4173

TOTAL X2=81.437

Para (3-1) x (2-1) = 2 grados de libertad y mediante tabla para X2=81.437, se calcula el valor-p que es menor a 0.005. Por tanto el valor-p≤ α=0.05. Entonces se rechaza la hipótesis nula.

64

Page 66: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante el Minitab con X2 =81.413, se calcula el valor-p = 0.000. Por tanto el valor-p≤ α=0.05. Entonces se comprueba el rechazo de la hipótesis nula, concluyendo que no hay independencia entre los tipos de boleto y los tipos de vuelo.

Problemas Aplicativos de la Distribución de PoissonA continuación se presenta el número de ocurrencia por lapso de tiempo y su frecuencia observada. Use α=0.05 y la prueba de bondad de ajuste para verificar su estos datos se ajustan a un distribución de Poisson.

NÚMERO DE OCURRENCIA

F. OBSERVADA

0 39

1 30

2 30

3 18

4 3

Solución:

H0: La población tiene una distribución Poisson.

H1: La población no tiene una distribución Poisson.

Total de frecuencias observadas: 120.

Media de ocurrencias: μ = = 1.31

Entonces la probabilidad de Poisson es: f(x)= =

Frecuencia esperada que siga un distribución de Poisson con μ=1.31

NÚMERO DE PROBABILIDA NÚMERO

65

Page 67: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

OCURRENCIAS

D DE POISSON F(X)

ESPERADO 120.F(X)

0 0.2698 32.376

1 0.3535 42.420

2 0.2315 27.780

3 0.1011 12.132

4 0.0331 3.972

5 O MÁS 0.0110 1.320

Cálculo del estadístico de prueba Chi-Cuadrado X2:

NÚMERO DE OCURRENCIA

S

NÚMERO OBSERVADOS(F

I)

NÚMERO ESPERADOS(E

I)FI - EI (FI

EI)2(FI -

EI)2/EI

0 39 32.376 6.624 43.877 1.355

1 30 42.420 -12.42 154.256 3.636

2 30 27.780 2.22 4.928 0.177

3 18 12.132 5.868 34.433 2.838

4 O MÁS 3 5.292 -2.292 5.253 0.993

TOTAL X2=8.999

66

Page 68: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Para k-p-1=5-2=3 grados de libertad, con X2=8.999 mediante tabla el valor-p esta entre 0.05 y 0.025. Entonces el valor-p≤ α=0.05, por tanto, se rechaza H0.

67

Page 69: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante Minitab con X2=8.99683, se calcula el valor-p=0.0293330. Por tanto el valor-p ≤ α=0.05. Entonces se rechaza la hipótesis nula y se concluye que la población no tiene una distribución Poisson.

68

Page 70: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Al parecer el número de accidentes automovilísticos por día en una determinada ciudad tiene una distribución de Poisson. A continuación se presentan los datos de una muestra de 80 días del año anterior. ¿Estos datos apoyan la creencia de que el número de accidentes por día tiene una distribución de Poisson? Use α=0.05.

Número de Accidentes

F. Observada(días)

0 34

1 25

2 11

3 7

4 3

Solución:

H0: La población tiene una distribución Poisson.

H1: La población no tiene una distribución Poisson.

Total de frecuencias observadas: 80.

Media de ocurrencias: μ = = 1

Entonces la probabilidad de Poisson es: f(x)= =

Frecuencia esperada que siga un distribución de Poisson con μ=1

NÚMERO DE OCURRENCIAS

PROBABILIDAD DE POISSON F(X)

NÚMERO ESPERADO 80.F(X)

0 0.3679 29.432

69

Page 71: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

1 0.3679 29.432

2 0.1839 14.712

3 0.0613 4.904

4 0.0153 1.224

5 O MÁS 0.0037 0.296

Cálculo del estadístico de prueba Chi-Cuadrado X2:

NÚMERO DE OCURRENCIAS

NÚMERO OBSERVADOS(FI)

NÚMERO ESPERADOS(EI)

FI - EI (FI - EI)2

(FI - EI)2/ EI

0 34 29.432 4.568 20.867 0.7095

1 25 29.432 -4.568 19.643 0.6669

2 11 14.712 -3.712 13.779 0.9381

3 O MÁS 10 6.424 3.712 12.788 1.9905

TOTAL X2=4.30

Para k-p-1=4-2=2 grados de libertad, con X2=4.3 mediante tabla el valor-p esta entre 0.90 y 0.10. Entonces el valor-p> α=0.05, por tanto, no se rechaza H0.

70

Page 72: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Mediante Minitab con X2=4.30491, se calcula el valor-p=0.116199. Por tanto el valor-p >α=0.05. Entonces no se rechaza la hipótesis nula y se concluye que la población tiene una distribución Poisson.

El número de llamadas telefónicas que llegan por minuto al conmutador de una empresa tiene una distribución de Poisson. Use α=0.05 y los datos siguientes para probar esta suposición.

NÚMERO DE LLAMADAS TELEFÓNICAS QUE LLEGAN POR MINUTO

FRECUENCIA OBSERVADA

0 15

1 31

2 20

3 15

4 13

5 4

6 2

Solución:

71

Page 73: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

H0: La población tiene una distribución Poisson.

H1: La población no tiene una distribución Poisson.

Total de frecuencias observadas: 100.

Media de ocurrencias: μ = = 2

Entonces la probabilidad de Poisson es: f(x)= =

Frecuencia esperada que siga un distribución de Poisson con μ=2

NÚMERO DE OCURRENCIAS

PROBABILIDAD DE POISSON F(X)

NÚMERO ESPERADO 100.F(X)

0 0.1353 13.53

1 0.2707 27.07

2 0.2707 27.07

3 0.1804 18.04

4 0.0902 9.02

5 0.0361 3.61

6 0.0120 1.20

7 O MÁS 0.0047 0.47

Cálculo del estadístico de prueba Chi-Cuadrado X2:

72

Page 74: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

NÚMERO DE OCURRENCIA

S

NÚMERO OBSERVADOS(F

I)

NÚMERO ESPERADOS(E

I)FI - EI (FI -

EI)2(FI -

EI)2/ EI

0 15 13.53 1.47 2.1609

0.1597

1 31 27.07 3.93 15.4449 0.5706

2 20 27.07 -7.07 49.9849 1.8465

3 15 18.04 -3.04 9.2416 0.5123

4 13 9.02 3.98 15.8404 1.7561

5 O MÁS 6 5.28 0.72 0.5184 0.0982

TOTAL 100 X2=4.9434

Para k-p-1=6-2=4 grados de libertad, con X2=4.9434 mediante tabla el valor-p esta entre 0.90 y 0.10. Entonces el valor-p≥ α=0.05, por tanto, no se rechaza H0.

Mediante Minitab con X2=4.945411, se calcula el valor-p=0.292945. Por tanto el valor-p >α=0.05. Entonces no se rechaza la hipótesis nula y se concluye que la población tiene una distribución Poisson.

73

Page 75: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

74

Page 76: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de Métodos no Paramétricos

Prueba de Signos¿Las divisiones de acciones son benéficas para los accionistas? La empresa SNL Securities estudió, a lo largo de 18 meses, las divisiones de las acciones de la industria de la banca y encontró que las divisiones de las acciones de un individuo. Admita que en una muestra de 20 recientes divisiones de acciones, 14 hayan llevado a un aumento de su valor, cuatro hayan llevado a una disminución de su valor y dos no hayan ocasionado ningún cambio. Suponga que realiza un estudio para determinar si las divisiones de acciones aún benefician a los poseedores de acciones bancarias.

¿Cuáles son las hipótesis nula y alternativa?

¿A qué conclusión se llega con α=0.05?

Solución:

p = es la proporción de poseedores bancarios beneficiarios (aumente su valor).

H0: p≤0.5

H1: p>0.5

Nivel de significancia α=0.05.

Tabla de probabilidades binomiales para n=18 y p=0.5.

NÚMERO DE SIGNOS MÁS

PROBABILIDADES

0 0.0000

1 0.0001

2 0.0006

3 0.0031

4 0.0117

75

Page 77: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

5 0.0327

6 0.0708

7 0.1214

8 0.1669

9 0.1855

10 0.1669

11 0.1214

12 0.0708

13 0.0327

14 0.0117

15 0.0031

16 0.0006

17 0.0001

18 0.0000

El número de signos más para el valor de poseedores bancarios beneficiarios es x=14, entonces su probabilidad está en la cola superior:

P(x≥ 14) = P(14)+P(15)+P(16)+P(17)+P(18)=0.0117+0.0031+0.0006+0.0001+0.0000=0.0154

Como es para una cola el valor-p = 0.0154. Además el valor-p≤ α=0.05, entonces se rechaza H0.

76

Page 78: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

La empresa Nielson Media Research identificó que American Idol y a Dancing whit the Stars como los 2 programas de televisión de mayor rating en febrero de 2006. En un estudio local acerca del programa de televisión preferido, de 750 encuestados 330 votaron por American Idol, 270 por Dancing whit the Stars, y 150 por otros programas de televisión. Con 0.05 como nivel de significancia prueba la hipótesis de que American Idol y Dancing whit the Stars tiene el mismo nivel de preferencia. ¿A qué conclusión llega?

Solución:

p = es la proporción que ven American Idol.

H0: p=0.5

H1: p≠0.5

Nivel de significancia α=0.05.

La muestra es n=600, entonces es una distribución normal donde:

μ = 0.50 (600) = 300

= =12.25

El número de signo más es x=330, se halla el estadístico de prueba Z:

Z = = 2.45

Mediante tabla para Z=2.45, se calcula para 2 colas el valor-p= 2(1-0.9929)= 0.0142. Como el valor-p≤ α=0.05, entonces se rechaza H0.

77

Page 79: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

En el mercado de computadoras personales la competencia es intensa. En una muestra de 500 compras, se encontró que 202 eran compras de la marca A, 158 de la marca B y 140 de otras marcas. Con un nivel de significancia de 0.05 pruebe la hipótesis de que las marcas A y B tienen la misma participación en el mercado de las computadoras personales ¿Cuál es su conclusión?

Solución:

p = es la proporción de los que compran computadoras de la marca A.

H0: p=0.5

H1: p≠0.5

Nivel de significancia α=0.05.

La muestra es n=360, entonces es una distribución normal donde:

μ = 0.50 (360) = 180

= =9.49

El número de signo más es x=202, se halla el estadístico de prueba Z:

Z = = 2.32

Mediante tabla para Z=2.32, se calcula para 2 colas el valor-p= 2(1-0.9898)= 0.0204. Como el valor-p≤ α=0.05, entonces se rechaza H0.

78

Page 80: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

En una muestra de 150 partidos de basquetbol universitario, el equipo de casa ganó 98 partidos. Realice una prueba para determinar su los datos sustentan la hipótesis de que en el basquetbol universitario el equipo de casa tiene ventaja. ¿A qué conclusión llega con α=0.05?

Solución:

p = es la proporción de partidos que gana un equipo en casa.

H0: p≤0.5

H1: p>0.5

Nivel de significancia α=0.05.

La muestra es n=150, entonces es una distribución normal donde:

μ = 0.50 (150) = 75

= =6.12

El número de signo más es x=98, se halla el estadístico de prueba Z:

Z = = 3.76

Mediante tabla para Z=3.76, se calcula para una cola el valor-p= 1- 0.9999 ≈ 0.00. Como el valor-p≤ α=0.05, entonces se rechaza H0.

PROBLEMA

En la tabla se presentan las preferencias de 10 personas respecto a dos marcas de un producto.

PERSONA MARCA A FRENTEA MARCA B

1 +

2 +

3 +79

Page 81: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

4 -

5 +

6 +

7 -

8 +

9 -

10 +

Emplee α=0.05 y pruebe si existe alguna diferencia significativa de preferencia por estas dos marcas. Un signo más indica preferencia por la marca A sobre la marca B.

Solución:

p = es la proporción de preferencia por la marca A.

H0: p=0.5

H1: p≠0.5

Nivel de significancia α=0.05.

Tabla de probabilidades binomiales para n=10 y p=0.5.

NÚMERO DE SIGNOS MÁS

PROBABILIDADES

0 0.0010

1 0.0098

2 0.0439

3 0.1172

4 0.205180

Page 82: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

5 0.2461

6 0.2051

7 0.1172

8 0.0439

9 0.0098

10 0.0010

El número de signos más para la marca A es x=7, entonces su probabilidad está en la cola superior:

P(x≥ 7) = P(7)+P(8)+P(9)+P(10)=0.1172+0.0439+0.0098+0.0010=0.1719.

Como es para dos cola el valor-p = 2(0.0154)=0.8438. Además el valor-p≥ α=0.05

Entonces no se rechaza H0.

PROBLEMA

Realice la prueba de hipótesis siguiente:

H0: Mediana ≤150

H1: Mediana >150

En una muestra de tamaño 30 se obtuvieron 22 casos cuyo valor fue mayor que 150, tres cuyo valor fue exactamente 150 y cinco cuyo valor fue menor que 150. Con α=0.01 realice una prueba de hipótesis.

Solución:

Con nivel de significancia α=0.01.

El número de la muestra es n = 27, asume una distribución normal.

μ = 0.50 (27) = 13.5

= =2.60

81

Page 83: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

El número de signo más es x=22, se halla el estadístico de prueba Z:

Z = = 3.27

Mediante tabla para Z=3.27, se calcula para una cola el valor-p= 1- 0.990 = 0.001.

Como el valor-p≤ α=0.01.

Entonces se rechaza H0.

82

Page 84: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

PROBLEMA

El ingreso mediano anual de los suscriptores de la Barron es $131 000. Suponga que en una muestra de 300 suscriptores a The Wall Street Journal, 165 suscriptores posean un ingreso mayor que $131 000 y 135 poseen un ingreso menor que $131 000. ¿Puede concluir que hay diferencia entre los ingresos medianos de los dos grupos de suscriptores? Emplee como nivel de significancia α=0.05, ¿a qué conclusión llega?

Solución:

H0: Mediana = $131 000

H1: Mediana ≠ $131 000

Con nivel de significancia α=0.01.

El número de la muestra es n = 300, asume una distribución normal.

μ = 0.50 (300) = 150

= = 8.66

El número de signo más es x=165, se halla el estadístico de prueba Z:

Z = = 1.73

Mediante tabla para Z=1.73, se calcula para dos colas el valor-p=2(1- 0.9582) = 0.0836. Como el valor-p≥ α=0.01, entonces no se rechaza H0.

83

Page 85: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

PROBLEMA

De acuerdo con un estudio nacional, el ingreso anual mediano que los adultos dicen harían realidad sus sueños es $152 000. Suponga que en Ohio, de 225 personas tomadas en una muestra, 122 indican que el ingreso necesario para hacer realidad sus sueños sea menor que $152 000, y 103 informan que esta cantidad sea mayor que $152 000. Pruebe la hipótesis nula de que en Ohio, el ingreso medio anual para que una persona haga realidad sus sueños es $152 000. Use α=0.05, ¿a qué conclusión llega?

Solución:

H0: Mediana = $152 000

H1: Mediana ≠ $152 000

Con nivel de significancia α=0.01.

El número de la muestra es n = 225, asume una distribución normal.

μ = 0.50 (225) = 112.5

= = 7.5

El número de signo más es x=122, se halla el estadístico de prueba Z:

Z = = 1.27

Mediante tabla para Z=1.27, se calcula para dos colas el valor-p=2(1- 0.8980) = 0.204. Como el valor-p≥ α=0.01, entonces no se rechaza H0.

84

Page 86: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de la Prueba de WilcoxonPROBLEMA

Con efecto de determinar el rendimiento de la gasolina en millas por galón en los automóviles de pasajeros, se prueban dos aditivos para gasolina. A continuación aparecen los resultados de esta prueba en 12 automóviles; en cada automóvil se probaron los dos aditivos. Use nivel de significancia α=0.05 y la prueba de los rangos con signo de Wilcoxon para determinar su existe una diferencia significativa.

AUTÓMOVIL

ADITIVOS

1(millas/galón)

2(millas/galón)

1 20.12 18.05

2 23.56 21.77

3 22.03 22.57

4 19.15 17.06

5 21.23 21.22

6 24.77 23.80

7 16.16 17.20

8 18.55 14.98

9 21.87 20.03

10 24.23 21.15

11 23.21 22.78

12 25.02 23.70

Solución:

H0: Las poblaciones son idénticas en relación a los aditivos.

85

Page 87: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

H1: Las poblaciones no son idénticas en relación a los aditivos.

AUTÓMOVIL

ADITIVOS DIFERENCIA

VALORABS.DE DIFERENCIA

RANGO

RANGO CON SIGNO

1(millas/galón)

2(millas/galón)

1 20.12 18.05 2.07 2.07 9 9

2 23.56 21.77 1.79 1.79 7 7

3 22.03 22.57 -0.54 0.54 3 -3

4 19.15 17.06 2.09 2.09 10 10

5 21.23 21.22 0.01 0.01 1 1

6 24.77 23.80 0.97 0.97 4 4

7 16.16 17.20 -1.04 1.04 5 -5

8 18.55 14.98 3.57 3.57 12 12

9 21.87 20.03 1.84 1.84 8 8

10 24.23 21.15 3.08 3.08 11 11

11 23.21 22.78 0.43 0.43 2 2

12 25.02 23.70 1.32 1.32 6 6

Suma de signos: 62

Media: µt=0

Desviación: t= = = 25.50

86

Page 88: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el valor de T=62. Se obtiene el valor para el estadístico de prueba:

Z= = = 2

De la tabla para Z=2.43 se halla para dos colas el valor-p=2(1-0.9925)=0.015. Como el valor-p ≤ α=0.05, se rechaza H0.

Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el valor-p (P)=0.017, el cual es menor a α = 0.05, por lo tanto se comprueba el rechazo de H0. Entonces las dos poblaciones son distintas.

PROBLEMA

En 10 de los principales aeropuertos se muestran los precios de la gasolina para automóviles rentados. A continuación se presentan los datos correspondientes a las empresas Avis y Budget. Use α = 0.05 para probar la hipótesis de que hay diferencia entre las 2 poblaciones. ¿Cuál es su conclusión?

AEROPUERTOS

EMPRESAS

Avis Budget

87

Page 89: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

BOSTON LOGAN

1.58 1.39

CHICAGO OHARE

1.60 1.55

CHICAGO MIDWAY

1.53 1.55

DENVER 1.55 1.51

FORT LAUDERDALE

1.57 1.58

LOS ÁNGELES 1.80 1.74

MIAMI 1.62 1.60

NUEVO YORK 1.69 1.60

ORANGE COUNTRY

1.75 1.59

WASHINGTON W.

1.55 1.54

Solución:

H0: Las poblaciones son idénticas en relación a los aditivos.

H1: Las poblaciones no son idénticas en relación a los aditivos.

AEROPUERTOS

EMPRESAS

DIFERENCIA

VALOR ABS. DE DIFERENCIA

RANGO

RANGO CON SIGNO

Avis

Budget

BOSTON LOGAN

1.58

1.39 0.19 0.19 10 10

88

Page 90: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

CHICAGO OHARE

1.60

1.55 0.05 0.05 6 6

CHICAGO MIDWAY

1.53

1.55 -0.02 0.02 3.5 -3.5

DENVER 1.55

1.51 0.04 0.04 5 5

FORT LAUDERDALE

1.57

1.58 -0.01 0.01 1.5 -1.5

LOS ÁNGELES 1.80

1.74 0.06 0.06 7 7

MIAMI 1.62

1.60 0.02 0.02 3.5 3.5

NUEVO YORK 1.69

1.60 0.09 0.09 8 8

ORANGE COUNTRY

1.75

1.59 0.16 0.16 9 9

WASHINGTON W.

1.55

1.54 0.01 0.01 1.5 1.5

Suma de signos=45

Media: µt=0

Desviación: t= = = 19.62

Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el valor de T=45. Se obtiene el valor para el estadístico de prueba:

Z= = = 2.29

89

Page 91: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

De la tabla para Z= 2.29, se halla para dos colas el valor-p=2(1-0.9890)=0.0220 como el valor-p ≤ 0.05, Se rechaza H0.

Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el valor-p (P)=0.025, el cual es menor a α = 0.05, por lo tanto se comprueba el rechazo de H0. Entonces las dos poblaciones son distintas.

90

Page 92: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

PROBLEMA

El campeonato de los jugadores de la PGA tuvo lugar, del 23 al 26 de marzo del 2006, en el campeonato de golf TPC Sangras en Ponte Vendra Beach, Florida. A continuación se presentan puntuaciones obtenidas, en la primera y segunda ronda, por 11 golfistas de la muestra. Use α = 0.05 y determinar si existe una diferencia significativa entre las puntuaciones obtenidas por los golfistas en la primera y segunda ronda. ¿Cuál es su conclusión?

ENTREGAS RONDAS

1

2

FRED COUPLES

69 73

JOHN DAB 70 73

ERNIE ELS 72 70

JIM FURYK 65 71

PHIL MICKELSON

70 73

ROCCO MEDIATE

69 74

NICK PRICE

72 71

VIJAY SINGH

68 70

SERGIO GARCÍA

70 68

MIKE WEIR

71 71

91

Page 93: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

TIGER WOODS

72 69

Solución:

H0: Las poblaciones son idénticas en relación a los aditivos.

H1: Las poblaciones no son idénticas en relación a los aditivos.

ENTREGAS

SERVICIOS DIFERENCI

A

VALOR ABS.DE

DIFERENCIA

RANGO

RANGO CON SIGNO1 2

FRED COUPLES 69 73 -4 4 8 -8

JOHN DAB 70 73 -3 3 6 -6

ERNIE ELS 72 70 2 2 3 3

JIM FURYK 65 71 -6 6 10 -10

PHIL MICKELSO

N70 73 -3 3 6 -6

ROCCO MEDIATE 69 74 -5 5 9 -9

NICK PRICE 72 71 1 1 1 1

VIJAY SINGH 68 70 -2 2 3 -3

SERGIO GARCÍA 70 68 2 2 3 3

92

Page 94: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

MIKE WEIR 71 71 0 0 -- --

TIGER WOODS 72 69 3 3 6 6

Suma de signos = -29

Media: µt=0

Desviación: t= = = 19.62

Se realiza la prueba de rangos de signos de Wilcoxon con α=0.05, además de tener el valor de T=-29. Se obtiene el valor para el estadístico de prueba:

Z= = = -1.48

De la tabla para Z= 1.48, se halla para dos colas el valor-p = 2(1-0.99306)=0.1388, como el valor-p ≥ 0.05, No se rechaza H0.

Se toma la diferencia de las poblaciones y se analiza en el paquete de datos, se observa el valor-p (P)=0.154, el cual es mayor a α = 0.05, por lo tanto se comprueba el no rechazo de H0. Entonces las dos poblaciones son idénticas.

93

Page 95: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Problemas Aplicativos de la Prueba de Mann-Whitney-WilcoxonPROBLEMA

Para poder comprobar el efecto de dos aditivos sobre el rendimiento de gasolina, siete automóviles usan aditivo 1 y nueve automóviles el aditivo 2. En los datos siguientes se presenta el rendimiento en millas por galón obtenido con cada uno de los dos aditivos. Use α = 0.05 y la prueba de MWW para determinar si existe una diferencia significativa en el efecto que tiene los dos aditivos sobre el rendimiento.

ADITIVO 1 ADITIVO 2

17.3 18.7

18.4 17.8

19.1 21.3

16.7 21.0

18.2 22.1

18.6 18.7

17.5 19.8

20.7

20.2

Solución:

H0: las dos poblaciones son idénticas en término de rendimiento.

H1: las dos poblaciones no son idénticas en términos de rendimiento.

Nivel de significancia que se toma α=0.05.

ADITIVO 1 RANGO ADITIVO 2 RANGO

16.7 1 17.8 4

17.3 2 18.7 8.594

Page 96: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

17.5 3 18.7 8.5

18.2 5 19.8 11

18.4 6 20.2 12

18.6 7 20.7 13

19.1 10 21.0 14

21.3 15

22.1 16

Suma de rangos: 34 102

Se toma la suma de rangos de la primera muestra para el valor de T=34.

95

Page 97: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

PROBLEMA

Para un nivel de significancia α=0.05, de la tabla se encuentra el valor crítico Tl en la cola inferior para el estadístico de prueba MWW con n1=7 y n2=9 es Tl=41. El valor crítico en la cola superior para el estadístico de prueba MWW es:

Tu=n1 (n1 +n2 +1)- Tl=7(7+9+1) – 41=78

La decisión que se tomara es:

Rechazar H0 si T<41 v T> 78.

Se concluye, como: T=34, además 34 < 41, entonces se rechaza H0.

Minitab:

Se concluye que la diferencia entre ambas poblaciones es significativa, entonces ambas poblaciones no son idénticas en términos de rendimiento según el aditivo usado.

96

Page 98: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

PROBLEMA

A continuación se muestra los datos muestrales de los salarios iniciales de contadores públicos y planificadores financieros. Los salarios anuales están dados en millones de dólares.

Use 0.05 como nivel de significancia y prueba la hipótesis de que no hay diferencia entre los salarios anuales iniciales de los contadores públicos y los planificadores financieros.

CONTADOR PÚBLICO

PLANIFICADOR FINANCIERO

45.2 44.0

45.9 44.2

46.9 48.1

49.2 50.9

50.0 46.9

51.3 48.6

52.0 44.7

53.2 48.9

53.8 46.8

54.5 43.9

Solución:

H0: las dos poblaciones son idénticas en término de salarios iniciales.

H1: las dos poblaciones no son idénticas en términos de salarios iniciales.

Nivel de significancia que se toma α=0.05.

CONTADOR PÚBLICO

PLANIFICADOR FINANCIERO

SALARIO Rango Salari Rang

97

Page 99: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

o o

45.2 5 43.9 1

45.9 6 44.0 2

46.9 8.5 44.2 3

49.2 13 44.7 4

50.0 14 46.8 7

51.3 16 46.9 8.5

52.0 17 48.1 10

53.2 18 48.6 11

53.8 19 48.9 12

54.5 20 50.9 15

Suma de Rangos 136.573.5

98

Page 100: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

La suma de los rangos que se toma es de la primera muestra: T=136.5.

Como n1=10 y n2=10 se usa la aproximación normal de la distribución muestral de la suma de rangos T:

µt= n1 (n1+n2+1) = 10(10+10+1) =105

t= = = 13.23

Para T= 136.5 y nivel de significancia 0.05 se halla el estadístico de prueba:

Z= = = 2.38

Mediante tabla para Z=2.38, se halla para 2 colas el valor-p=2(1-0.9913)=0.0174. Como valor-p≤α=0.05, entonces se rechaza H0.

Minitab:

Se concluye que la diferencia entre ambas poblaciones es significativa, entonces ambas poblaciones no son idénticas en términos de salarios entre la población de contadores públicos y de planificadores financieros.

99

Page 101: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

La brecha entre los salarios de hombres y mujeres con la misma preparación disminuye cada vez más, pero aún no se ha cerrado totalmente. A continuación se presenta datos de muestras de 7 hombres y 7 mujeres con licenciatura. Los datos se dan en miles dólares.

Hombre 30.6

75.5

45.2

62.2

38.2

49.9

55.3

Mujeres 44.5

35.4

27.9

40.5

25.8

47.5

24.8

Solución:

H0: las dos poblaciones son idénticas en término de salarios iniciales.

H1: las dos poblaciones no son idénticas en términos de salarios iniciales.

Nivel de significancia que se toma α=0.05.

Hombres Mujeres

Salario Rango

Salario Rango

30.6 4 24.8 1

38.2 6 25.8 2

45.2 9 27.9 3

49.9 11 35.4 5

55.3 12 40.5 7

62.2 13 44.5 8

75.5 14 47.5 10

Suma de Rangos 69 36

La suma de rangos que se toma es de la primera muestra: T=69.

Para un nivel de significancia de 0.05. La cota inferior para un estadístico de prueba MWW mediante tabla es Tl= 37. La cota superior para un estadístico de prueba MWW se calcula:

100

Page 102: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Tu=n1 (n1 +n2 +1)- Tl=7(7+7+1) – 37 = 68

La decisión que se tomara es:

Rechazar H0 si T<37 v T> 68.

Se concluye, como: T=69, además 69 > 68, entonces se rechaza H0.

Minitab:

Se concluye que la diferencia entre ambas poblaciones es significativa, entonces ambas poblaciones no son idénticas en términos de salarios entre mujeres y hombres.

101

Page 103: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Prueba de Kruskal-WallisPROBLEMA

Las calificaciones dadas a productos por un panel de 15 consumidores son las siguientes:

PRODUCTO

A B C

50 80 60

62 95 45

75 98 30

48 87 58

65 90 57

Use la prueba de Kruskal-Wallis y α=0.05 para determinar si existe una diferencia significativa entre las clasificaciones dadas de los tres productos.

Solución:

PRODUCTO

A RANGO B RANGO C RANG

O

48 3 80 11 30 1

50 4 87 12 45 2

62 8 90 13 57 5

65 9 95 14 58 6

75 10 98 15 60 7

TOTAL 34 65 21

H0: Todas poblaciones son idénticas.102

Page 104: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

H1: No todas las poblaciones son idénticas.

Nivel de significancia y α=0.05.

Los tamaños de las muestras son:

n1=5, n2=5, n3=5 y nT=15

Calculamos el estadístico de prueba W:

W =

W = 10.22

Para k-1=3-1=2 grados de libertad.

X2= 9.210 su área de cola superior = 0.01

X2= 10.597 su área de cola superior = 0.005

Entonces el valor-p esta entre 0.01 y 0.005, por tanto valor-p ≤ α=0.05, se rechaza H0.

Minitab:

El valor-p que se calcula es 0.006, por tanto, valor-p=0.006 ≤ α=0.05, se rechaza H0.

103

Page 105: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre la clasificación entre los 3 productos.

104

Page 106: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

PROBLEMA

Para un examen de admisión se evalúan tres programas de preparación. Las calificaciones obtenidas por las 20 personas de una muestra empleada para probar los programas de preparación son las siguientes. Use la prueba de Kruskal-Wallis para determinar su hay diferencia significativa entre los tres programas de preparación. Use α=0.01.

PROGRAMAS

A B C

540 450 600

400 540 630

490 400 580

530 410 490

490 480 590

610 370 620

550 570

Solución:

PROGRAMAS

A RANGO

B RANGO C RANGO

400 2.5 370 1 490 8

490 8 400 2.5 570 14

490 8 410 4 580 15

530 10 450 5 590 16

540 11.5 480 6 600 17

105

Page 107: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

610 18 540 11.5 620 19

550 13 630 20

TOTAL

58 43 109

H0: Todas poblaciones son idénticas.

H1: No todas las poblaciones son idénticas.

Nivel de significancia y α=0.01.

Los tamaños de las muestras son:

n1=6, n2=7, n3=7 y nT=20

Calculamos el estadístico de prueba W:

W =

W = 9.06

Para k-1=3-1=2 grados de libertad.

X2= 7.378 su área de cola superior = 0.025

X2= 9.210 su área de cola superior = 0.01

Entonces el valor-p esta entre 0.025 y 0.01, por tanto valor-p ≤ α=0.01, se rechaza H0.

Minitab:

106

Page 108: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

El valor-p que se calcula es 0.011, por tanto, valor-p=0.011 ≤ α=0.05, se rechaza H0.

Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre los tres programas de calificación.

PROBLEMA

Para bajar de peso basta con practicar una de las siguientes disciplinas tres veces por semana durante 40 minutos. En la tabla siguiente se muestra la cantidad de calorías que se quema en 40 minutos de cada una de estas disciplinas. ¿Estos datos indican que exista diferencia en la cantidad de calorías quemadas con cada una de estas disciplinas? De su conclusión.

DISCIPLINAS

NATACIÓN TENIS ANDAR EN BICICLETA

408 415 385

380 485 250

425 450 295

400 420 402

427 530 268

Solución:

DISCIPLINAS

NATACIÓN

RANGO

TENIS

RANGO

ANDAR EN

RANGO

107

Page 109: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

BICICLETA

380 4 415 9 250 1

400 6 420 10 268 2

408 8 450 13 295 3

425 11 485 14 385 4

427 12 530 15 402 7

TOTAL 41 61 17

H0: Todas poblaciones son idénticas.

H1: No todas las poblaciones son idénticas.

Nivel de significancia y α=0.05.

Los tamaños de las muestras son:

n1=5, n2=5, n3=5 y nT=15

Calculamos el estadístico de prueba W:

W =

W = 9.26

Para k-1=3-1=2 grados de libertad.

X2= 7.378 su área de cola superior = 0.025

X2= 9.210 su área de cola superior = 0.01

Entonces el valor-p esta entre 0.025 y 0.01, por tanto valor-p ≤ α=0.01, se rechaza H0.

108

Page 110: Trabajo Estadistica Industrial

Laboratorio de Estadística Industrial 2016

El valor-p que se calcula es 0.010, por tanto, valor-p=0.010 ≤ α=0.05, se rechaza H0.

Se concluye que las poblaciones no son idénticas, es decir, que hay diferencia entre los la cantidad de calorías quemadas con cada una de las disciplinas.

109