78
VIII. FASE DE ANÁLISI S Resumen Dr. Primitivo Reyes Aguilar / enero 2009

VIII. FASE DE ANÁLISIS · Web viewEl estadístico calculado Tc se compara con el valor crítico t /2, df = n-1 para una prueba de dos colas o con t, df = n-1 para pruebas de una

Embed Size (px)

Citation preview

VIII. FASE DE ANÁLISIS

Resumen

Dr. Primitivo Reyes Aguilar / enero 2009

FASE DE ANÁLISIS P. Reyes enero 2009

ContenidoVIII. FASE DE ANÁLISIS........................................................................................................4

VIII.I INTRODUCCIÓN.........................................................................................................4

VIII.2 LOS 7 DESPERDICIOS.................................................................................................8

Sobreproducción............................................................................................................8

Inventario.......................................................................................................................9

Reparaciones / Rechazos................................................................................................9

Movimientos...................................................................................................................9

Reproceso.....................................................................................................................10

Transporte....................................................................................................................10

Esperas......................................................................................................................... 11

Otros desperdicios........................................................................................................11

VIII.3 ANÁLISIS MULTI-VARI.............................................................................................12

Procedimiento de muestreo.........................................................................................12

Ejemplo.........................................................................................................................14

VIII.4 MODELO LINEAL SIMPLE.........................................................................................16

Método de mínimos cuadrados....................................................................................18

Inferencias respecto a la pendiente e intervalo de confianza para 1........................21

Coeficiente de correlación............................................................................................22

Coeficiente de determinación......................................................................................23

VIII.5 REGRESIÓN LINEAL MÚLTIPLE................................................................................24

Valor p (p – value)........................................................................................................25

VIII.6 PRUEBAS DE HIPÓTESIS..........................................................................................26

1. Conceptos básicos....................................................................................................26

Hipótesis nula............................................................................................................26

Estadístico de prueba................................................................................................27

Tipos de errores........................................................................................................ 27

2. Pruebas de una y dos colas.......................................................................................28

Prueba de una cola....................................................................................................28

Prueba de dos colas...................................................................................................29

Significancia práctica vs significancia estadística.......................................................29

Potencia de la prueba (I - ).......................................................................................29

Página 2 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Tamaño de muestra..................................................................................................34

3. Estimación puntual y por intervalo...........................................................................35

Estimación puntual para la media poblacional..........................................................35

Estimación puntual para la varianza poblacional......................................................35

Intervalo de confianza para la media (CI) – sigma conocida......................................36

Intervalo de confianza para la media (CI) – sigma desconocida................................36

Intervalo de confianza para una proporción.............................................................37

Intervalo de confianza para la varianza 2..................................................................37

4. Pruebas de hipótesis.................................................................................................38

Prueba de hipótesis para la media (sigma conocida)................................................39

Prueba de hipótesis para la media (sigma desconocida, muestras pequeñas)..........41

Pruebas de hipótesis de dos medias – varianzas iguales...........................................44

Pruebas de hipótesis de dos medias – varianzas diferentes......................................45

Prueba t pareada.......................................................................................................46

Prueba de una proporción – prueba p......................................................................46

Prueba Chi cuadrada (2) para un varianza................................................................47

Tabla de contingencia................................................................................................48

Prueba de igualdad de dos varianzas F......................................................................50

Resumen de pruebas de inferencia estadística.........................................................52

VIII.7 ANÁLISIS DE VARIANZA...........................................................................................53

ANOVA – UNA VÍA........................................................................................................53

ANOVA – DOS VÍAS.......................................................................................................57

VIII.8 OTRAS HERRAMIENTAS...........................................................................................58

ANÁLISIS DE CAUSA RAÍZ..............................................................................................58

LOS CINCO POR QUÉS...................................................................................................59

5Ws – 1H (o 2H)............................................................................................................60

Análisis del modo y efecto de falla (AMEF)...................................................................60

Página 3 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

VIII. FASE DE ANÁLISIS

VIII.I INTRODUCCIÓN

En esta fase se efectuará el análisis de los datos obtenidos en la etapa de Medición, con el propósito de conocer las relaciones causales. La información de este análisis proporcionará evidencias de las fuentes de variación y desempeño insatisfactorio, el cual es de gran utilidad para la mejora del proceso.

Los objetivos de esta fase son:

Aprender el uso de las herramientas de la fase de análisis. Determinar en qué nivel de desempeño del proceso nos encontramos actualmente. Identificar cuáles son las fuentes de variación. Por ejemplo mediante el análisis

Multi-Vari podemos determinar las fuentes que presentan mayor variación, a través de la descomposición de los componentes de variabilidad del proceso. las cuáles pueden ser, por ejemplo: de lote a lote, dentro del lote, de turno a turno, entre turnos, dentro del turno, de máquina a máquina, dentro de la máquina, de operador a operador, dentro del operador, entre operadores, etc.

Las herramientas que se incluyen en esta fase son:

No. Herramienta ¿Para qué es utilizada?

1 Los 7 desperdiciosIdentificar las diferentes formas de desperdicio para minimizarlos

2 Análisis Multivari El objetivo general de las cartas Multi-Vari es, descubrir los componentes de variación en el proceso y cuantificar las diferentes fuentes

Página 4 de 64

MedirMedir AnalizarAnalizar MejorarMejorar ControlarControlarDefinirDefinir

FASE DE ANÁLISIS P. Reyes enero 2009

de variabilidad.

3 -4Análisis de Regresión y Correlación – simple y múltiple

Sirve para predecir el valor de una variable a partir de una o más variables. Es usada para conocer las relaciones que existen entre las variables dependientes e independientes.

5 Valor pSirve para interpretar la significancia de variables y factores en diversos métodos estadísticos

6 Pruebas de hipótesis

Pruebas estadísticas para probar afirmaciones y teorías sobre causas potenciales y para verificar las mejoras:

Conceptos básicos- Estimación puntual y por intervalo

Media Proporción Varianza

- Pruebas de hipótesis Una media Dos medias Medias pareadas Una proporción Una varianza Tabla de contingencia Igualdad de varianzas

7 ANOVA de una vía

Para probarla significancia del efecto de diversos niveles o tratamientos de un factor. Sirve para analizar la variación entre muestras y al interior de las mismas con sus varianzas

8 ANOVA de dos víasPara probar la significancia del efecto de los tratamientos de un factor con una variable de bloqueo para reducir el error experimental.

9 Análisis de causas raízPermite identificar la causa raíz para tomar la acción correctiva necesaria

10 5 PorquésPermite identificar la causa raíz a través de una serie de preguntas sucesivas porqué

Página 5 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

11 5W – 1H

Permite identificar la causa raíz a través de una serie de preguntas combinadas para colectar la mayor parte de la información sobre el problema

12 AMEF (FMEA)

Identificar las maneras en las cuales un proceso puede fallar para alcanzar los requerimientos críticos del cliente. Estimar el riesgo de la causas específicas en relación con estas fallas.

La fase de análisis consta de las siguientes etapas:

Identificar las fuentes de variación.-

Cuando un proceso se encuentra fuera de las especificaciones permitidas, se tiene evidencia de que existe variación. Para comprobarlo utilizamos alguna de las herramientas de análisis, según sea el el caso por ejemplo, el análisis Multi-Vari es una herramienta estadística que nos permite determinar las fuentes que presentan mayor variación, a través de la descomposición de los componentes de variabilidad del proceso. Una vez determinadas las causas de variación, nos enfocaremos en los “pocos vitales X” que están afectando la variable de respuesta “y”. Una opción para priorizar estas causas es el uso del “diagrama de Pareto”.

Página 6 de 64

Variación delProceso

Variación del Proceso de MediciónVariación Actual del Proceso

Variación debida alEquipo de Medición

Otras fuentes deVariación

Variación debida aloperador

Variación a CortoPlazo

Variación a LargoPlazo

Exactitud(Sesgo)

Precisión (Error de Medición)

Discriminación(Resolución)

FASE DE ANÁLISIS P. Reyes enero 2009

Figura 1 Posibles fuentes de variación del proceso.

Página 7 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

FASE DE ANÁLISIS RESUMENEl proceso de análisis que se recomienda es el siguiente:

Salidas de la Fase de Análisiso Causas raíz validadas

o Guía de oportunidades de mejora

Causa Raíz

ResultadosCausas# de Causa

SI ES CAUSA RAIZ

SI ES CAUSA RAIZ

NO ES CAUSA RAIZ

NO ES CAUSA RAIZ

SI ES CAUSA RAIZ

SI ES CAUSA RAIZ

NO ES CAUSA RAIZ

Ensamble de ojillos, bloques y contrapesos no adecuados en aspas.Amortiguadores dañados.Desgaste de bujes en los carretes.Fabricación y reemplazo deejes y poleas no adecuados en ensamble de aspas.Desalineamiento de poleas y bandas de transmisión de aspas.Método de Balanceo no adecuado.Desalineación de pinolas en cuna.

1

23

4

5

67

Resumen de la validación de las causas

X

X

X

X

Página 8 de 64

Diagrama deIshikawa

Diagrama derelaciones

Diagramade Árbol

Análisis del Modo y Efecto deFalla (AMEF)

QFD

DiagramaCausa Efecto

CTQs = YsOperatividad

X's vitales

Diagramade Flujo

delproceso

Pruebasde

hipótesis

Causas raízvalidadas

¿CausaRaíz?

DefiniciónY=X1 + X2+. .Xn

X'sCausas

potenciales

Medición Y,X1, X2, Xn

FASE DE ANÁLISIS

SiNo

FASE DE ANÁLISIS P. Reyes enero 2009

VIII.2 LOS 7 DESPERDICIOS

Las actividades que no agregan valor se clasifican como Muda: Las actividades por las que paga el cliente se considera que agregan valor. Imai proporciona 7 categorías comunes en la industria:

Sobreproducción Inventarios Reparaciones / Rechazos Movimientos Proceso adicional Transporte Espera

Sobreproducción

Se refiere a producir de más en un momento dado, se caracteriza por:

Producir más de lo que necesita el siguiente proceso o cliente Producir antes de lo que necesita el siguiente proceso o cliente Producir más rápido de lo que necesita el siguiente proceso o cliente

En JIT producir mucho antes es tan malo como producir después de cuando se requiere el producto. Las partes necesitan estar disponibles en cierto lugar, a cierto tiempo, en la cantidad requerida de acuerdo al programa del cliente.

Si no se produce JIT se incurre en gastos adicionales como son:

Espacio extra utilizado en la planta del cliente Espacio extra en la planta de la organización Materias primas extras en uso Energéticos extras Transporte extra para el cliente y organización Costos extra de programación

Página 9 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Inventario

Son formas de inventario que no agrega valor o Muda: las partes, WIP, inventarios de materia prima, materiales indirectos y productos terminados, estos:

Requieren espacio en la planta Requieren transporte Requieren montacargas Requieren transportadores Requieren personal adicional para su manejo Requieren el pago de un interés financiero por el costo de los materiales

Además el inventario almacenado en varias etapas puede ser afectado de estas formas:

Se empolva Se deteriora Se hace obsoleto Se humedece Se daña en el manejo

Reparaciones / Rechazos

La reparación o retrabajo de partes defectivas son una segunda oportunidad de producir partes buenas, las partes que ya no se pueden recuperar se convierten en desperdicio de recursos. Si hay defectos en una línea continua elimina el flujo continuo. Se utilizan operadores y personal de apoyo para corregir problemas, excediendo el takt time. También intervienen los proveedores en los retarbajos generando muda.

Varios cambios de diseño pueden ser muda también si generan retrabajos y desperdicios.

Movimientos

El uso eficiente del cuerpo humano es crítico para el bienestar del operador, los movimientos extra innecesarios causan desperdicio de energías. Los operadores no deben caminar demasiado, cargar pesado, doblarse periódicamente, tener cosas lejos, repetir movimientos, etc. Se deben desarrollar nuevas herramientas para hacer el

Página 10 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

trabajo más fácil, incluyendo el rediseño del layout con un enfoque ergonómico. Cada estación debe ser analizada de acuerdo a los requisitos de ergonomía y movimientos.

La ergonomía puede eliminar factores en el lugar de trabajo que causen dañios y pérdidas de producción. Algunas guías son las siguientes:

Énfasis en seguridad todo el tiempo Adecuar el empleado a la tarea Cambiar el lugar de trabajo al empleado (no viceversa) Diseñar el lugar de trabajo de modo se mantengan posiciones del cuerpo

neutrales Rediseñar las herramientas de mano para reducir esfuerzo y daños Variar las tareas con rotación de tareas cada 2 a 4 horas Hacer que la máquina sirva al humano

ReprocesoConsiste de pasos adicionales o actividades en el proceso de manufactura, puede describirse como:

Remover rebabas del proceso de manufactura Retrabajar piezas causadas por dados dañados Agregar un proceso extra de manejo por falta de esapcios Realizar un paso de inspección (no agregan valor) Repetir cambios al producto que sean innecesarios Mantener copias adicionales de información

Transporte

Todas las formas de transporte son Muda (excepto el llevarle el producto al cliente), ya que implica el uso de montacargas, transportadores, movedores de pallets y camiones. La causa puede ser una distribución de planta inadecuada, celdas mal diseñadas, uso de proceso en lotes, tiempos de proceso largos, áreas grandes de almacenamiento, o problemas de programación. El transporte en general se debe minimizar.

Esperas

Página 11 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

El muda de espera ocurre cuando un operador está listo para la siguiente operación, pero debe permanecer ocioso en espera, ya sea por falla en máquinas, falta de partes, actividades de seguimiento descuidadas o paros de línea. Un técnico de mantenimiento es espera de una refacción es parte de muda. El muda de espera se caracteriza por:

Operadores ociosos Fallas de maquinaria Tiempos de preparación y ajuste muy largos Programación de tareas no balanceado Flujo de materiales en lotes Reuniones largas e innecesarias

(Imai, 1997)

Otros desperdicios

Además de los siete desperdicios clásicos listados previamente, otras fuentes son; Recursos mal utilizados Recursos subutilizados Conteos Búsqueda de herramientas o partes Sistemas múltiples Intervenciones manuales múltiples Aprobaciones innecesarias Fallas mayores de máquinas Muda causado por enviar productos malos a los clientes Muda causado por proporcionar un mal servicio a los clientes

(Metcalf, 1997)

Página 12 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

VIII.3 ANÁLISIS MULTI-VARI El CEP permite el monitoreo de variables como las quejas del cliente, la presión, la temperatura al tomar mediciones en ciertos intervalos. Pero en el caso de temperatura de hornos o el espesor de una placa varían dependiendo del lugar donde se tomen.

La variación puede ser de pieza a piezas, tiempo a tiempo o dentro de la pieza, para analizar estos tres tipos de variación se utiliza la carta Multi-vari. También sirven para investigar la consistencia de un proceso.

Procedimiento de muestreo

Seleccionar el proceso y la característica a ser investigada Seleccionare el tamaño de muestra y frecuencia de tiempo Usar una hoja tabular para registrar el tiempo y los valores para cada muestra Graficar la carta con el tiempo o secuencia en el eje horizontal Graficar los valores medidos en el eje vertical Unir los valores observados con líneas apropiadas Analizar la carta identificando la variación dentro de la muestra, entre muestras

y en el tiempo Realizar estudios adicionales para concentrarse en las áreas problema Después de la mejora, repetir el estudio para confirmar los resultados

A continuación se muestran las mediciones tomadas en cinco puntos de las partes, diferentes partes secuenciales y su comportamiento en el tiempo.

Se presentan otros tres ejemplos:

Página 13 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Se presenta una variabilidad excesiva dentro de la pieza (cónica)

Menor variabilidad dentro de la pieza (el centro es más grueso)

La variación se incrementa con el tiempo (la parte se hace más grande)

Página 14 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

La interpretación de la carta es aparente una vez que se grafican los valores. Las ventajas de las cartas Multi-vari son:

Puede resaltar la variación dentro la pieza (posicional) Puede resaltar la variación de pieza a pieza (cíclica) Sigue cualquier cambio relacionado con el tiempo (temporal) Ayuda a minimizar la variación al identificar áreas donde buscar la mayor

variación También identifica áreas donde no buscar la variación

Por ejemplo:

Producto / Proceso bajo consideraciónÁreas de variación Pieza Lote

Posicional Dentro de la pieza Dentro del loteCíclica Pieza a pieza Lote a loteTemporal En el tiempo En el tiempo

La variación posicional se puede dividir en componentes:

Cilindro Extremo a extremo, no redondez en cada extremoLote Parte superior a inferior, lado a ladoPieza plana A todo lo ancho, de frente hacia atrás

Ejemplo

Un fabricante de láminas planas de aluminio lleva control del espesor después del rolado en caliente. La especificación es de 0.245” ± 0.005”. El proceso ha producido desperdicio ya que su Cp es de 0.8, el costo del desperdicio es de $20,000 por mes. Se ha pensado en adquirir otra máquina con un costo de $800,000 y 6 meses de instalación.

Se hace un estudio Multi-vari para analizar el problema. Se hacen 4 mediciones dentro de la pieza y se toman tres piezas cada hora, con el correspondiente resultado.

Página 15 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

.0.2510”

0.2500”

0.2490”

Máximo

Mínimo

Izquierda

Derecha

8 AM 9 AM 10 AM 11 AM 12 AM

Parece que la variación en el tiempo es la mayor, las contramedidas se muestran a continuación.

Tipo de variación % de variación Variación y causa Corrección de la variación

% de reducción de la variación

Tiempo a tiempo 50% Bajo nivel de refrigerante

Alimentadorautomático

Cerca del 50%

Dentro de la pieza 30% Ajustes no paralelas

Respaldo del rollo renivelado

Cerca del 30%

Dentro de la pieza 10 – 15% Enfriamiento inadecuado del rollo

Se agregan más espreas de rociado

10%

Pieza a pieza 5 – 10% Desconocido Ninguna Ninguna

El costo total de las mejoras fue de $8,000 tomando dos semanas para el proyecto y el Cp >1 cumpliendo con las especificaciones establecidas.

VIII.4 MODELO LINEAL SIMPLEConsidere el problema de predecir los resultados de una prueba (Y) para los estudiantes con base las horas de estudio (X) siguiente:

Página 16 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Estudiante Tiempo de estudio (horas) Resultados de prueba (%)1 60 672 40 613 50 734 65 805 35 606 40 557 50 628 30 509 45 61

10 55 70

En una gráfica de dispersión indicando la línea de mejor ajuste se tiene con Minitab:

La ecuación matemática de la línea recta es:

y=β0+β1 x+ϵ

7060504030

85

80

75

70

65

60

55

50

45

Tiempo de estudio (horas)

Resu

ltado

s de

pru

eba

(%) S 4.47182

R-Sq 77.0%R-Sq(adj) 74.2%

Regression95% CI

Fitted Line PlotResultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas)

Página 17 de 64

Error

FASE DE ANÁLISIS P. Reyes enero 2009

El error aleatorio es la diferencia entre el valor observado de Y y el valor promedio de Y para una Xo dada, este error se distribuye normalmente.

En la ecuación, 0 es la intersección con el eje Y, 1 es la pendiente de la línea. Se asume que para cualquier valor dado de X, los valores observados de Y varían de manera aleatoria con una distribución normal.

El modelo probabilístico de cualquier valor observado Y es:

Y = (Media de Y para una X dada) + (error aleatorio)

y=β0+β1 x+ϵ

Página 18 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Método de mínimos cuadrados

Es el procedimiento para encontrar la línea recta que mejor “ajuste” a los datos, esto se puede intentar hacer visualmente, tratando de minimizar la diferencia entre los puntos y la línea, la ecuación de la recta de predicción es:

y= β0+ β1 x+ϵ

La respuesta Y y los coeficientes con gorro son los coeficientes estimados de la recta de regresión con datos de la muestra.

7060504030

80

75

70

65

60

55

50

Tiempo de estudio (horas)

Resu

ltado

s de

pru

eba

(%)

S 4.47182R-Sq 77.0%R-Sq(adj) 74.2%

Fitted Line PlotResultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas)

Matemáticamente se trata de minimizar:

sustituyendo el valor estimado de Yi

Página 19 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Los estimadores Beta cero y Beta 1 son:

Una vez calculados Beta 0 y Beta 1, se sustituyen sus valores en la ecuación de la recta de regresión para obtener la ecuación de predicción de mínimos cuadrados o “línea de regresión”.

El método manual es el siguiente:

Página 20 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Tips en el análisis de regresión:

Tener cuidado en redondear errores, usar un mínimo de seis cifras significativas. Siempre graficar la línea de regresión, para observar que si no ajusta haya errores

de cálculo

Página 21 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Extrapolar la recta de regresión puede ser riesgoso, por ejemplo para Xo = 100 se puede estimar una Y de 100% de calificación, lo cual no es creible.

De la tabla de ANOVA obtenida con Minitab:

Regression Analysis: Resultados de pr versus Tiempo de estudi

The regression equation isResultados de prueba (%) = 31.2 + 0.695 Tiempo de estudio (horas)

Predictor Coef SE Coef T PConstant 31.212 6.465 4.83 0.001Tiempo de estudio (horas) 0.6955 0.1342 5.18 0.001

S = 4.47182 R-Sq = 77.0% R-Sq(adj) = 74.2%

Analysis of Variance

Source DF SS MS F PRegression 1 536.92 536.92 26.85 0.001Residual Error 8 159.98 20.00Total 9 696.90

SSE=∑i=1

n

( y¿¿ i− y i)2¿

Aquí el cuadrado medio del error MSE = 20 es la desviación estándar del error :

Una estimación de la varianza de los errores o residuales es la siguiente:

En este caso

SSE=S y2− β1Sxy=Sy2−(S2

xy )Sx2

Sy2=∑i=1

n

¿¿

Página 22 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Con los datos del ejemplo:

SSE = 696.9 – (0.6955)*(772) = 159.97

S^2 = SSE / n – 2 = 159.97 / 8 = 19.99625

S = 4.47

En la figura se cumple que al menos el 95% de los puntos se encuentren en el intervalo ±1.96S (de 8.76) de la línea. Todos los valores se encuentran en este intervalo de ±8.76 respecto a la línea.

Inferencias respecto a la pendiente e intervalo de confianza para 1

La hipótesis nula es:

Se usa el estadístico de prueba:

El denominador de esta ecuación es la desviación estándar de la pendiente.

De los datos del ejemplo se tienen:

t= 0.6955−04.47 /√1110

=5.18

La región crítica se obtiene para una alfa de 0.05 y n – 2 = 8 grados de libertad t0.025,8 =- 2.306 y t0.975,8 =2.306

Como el estadístico de prueba se encuentra en la zona de rechazo, se rechaza Ho indicando que la regresión es válida.

El intervalo de confianza (1−α ) para 1 es:

Página 23 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

β1= β1± t α2 , n−2

σ e√Sx2

Por ejemplo con los datos del ejemplo anterior se tiene:

β1=0.6955±2.306 4.47√1110

=0.6955±0.3094=(0.386 ,0.1005)

Es decir por cada 10 horas de incremento en estudio, el incremento esperado en la calificación está en el intervalo de 3.86 a 10.05%

Coeficiente de correlación

Es un indicador de la fuerza de la relación lineal entre dos variables Y y X denominado el coeficiente de correlación de Pearson de producto – momento.

r se encuentra entre -1 y 1 El numerador de r es el mismo que para β1 por tanto tienen el mismo signo y será

cero cuando β1=0 Un valor positivo de r implica que la recta va hacia arriba a la derecha. Un valor

negativo de r indica que la recta va hacia abajo a la derecha Cuando r = 0 no hay correlación, los puntos están muy dispersos alrededor de la

recta, puede ser que haya un patrón curvilíneo Cuando r = 1 o -1, todos los puntos se encuentran en la recta y SSE es igual a cero Cualquier otro valor de r sugiere el grado en el cual los puntos tienden a estar

relacionados linealmente

Con los datos del ejemplo anterior:

Sxy = 772, Sx = 1,110, Sy^2 = 696.9

Página 24 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

r= 772√ (1110 )(696.9)

=0.878

Coeficiente de determinación

Es el cuadrado del coeficiente de correlación lineal, o sea:

Con los datos del ejemplo anterior:

r2=(0.878)2=0.771

Por tanto se decir que el 77% de la variación en calificaciones puede ser explicada por la variación en horas de estudio.

r2 se encuentra en el intervalo entre 0 y 1.

Página 25 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

SST es la suma de cuadrados total (de la media experiemntal) y SSE es la suma de cuadrado del error (del mejor ajuste). Cuando SSE es cero, r^2 es igual a 1 y cuando SSE es igual a SST, r^2 es igual a cero.

VIII.5 REGRESIÓN LINEAL MÚLTIPLE

Es una extensión de la regresión lineal simple a más variables independientes, por tanto se podría explicar una mayor proporción de la variación de y.

El modelo de primer orden es:

EL modelo de segundo orden es:

La tabla ANOVA es (con k número de variables predictoras):

Página 26 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Valor p (p – value)

El método tradicional de prueba de hipótesis compara un estadístico de prueba a un valor crítico de probabilidad pre – determinado conocido como alfa (). El valor más común es 5%, aunque también se utiliza 1% para situaciones más críticas.

Un valor – p es la probabilidad de obtener un valor del estadístico muestral de la prueba que es al menos tan extremo como el encontrado con los datos de la muestra (asumiendo que el valor hipotetizado es correcto) (Triola, 1994)

O sea que un valor pequeño de p es indicador de que la hipótesis nula es falsa, los paquetes estadísticos proporcionan el valor exacto de p.

Alfa o valor p Comentarios P > 5% No hay evidencia de

diferencia significativa1 < p < 5% Hay diferencia

estadísticamente significativa

P <= 1% Hay una alta diferencia estadística significativa

(Langley, 1971)

Ejemplo: tomando los resultados de Minitab del ejemplo anterior se tiene:

Regression Analysis: Resultados de pr versus Tiempo de estudi

Se proporciona la ecuación de regresión, el coeficiente de determinación y los valor P en regresión y ANOVA.

El valor de p – value del coeficiente Beta 1 de 0.001 indica una ecuación válida y el estudiante debe dedicar varias horas al estudio. El coeficiente de determianción fue de

Página 27 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

0.77 por lo que el coeficiente de correlación es de 0.8775. El valor p – value de la regresión es de 0.001 indicando que el coeficiente de correlación es significativo.

VIII.6 PRUEBAS DE HIPÓTESIS

1. Conceptos básicos

Se revisan algunos conceptos básicos:

Hipótesis nulaEs la hipótesis que sea probar, se establece a partir del problema y de indica como Ho. Por ejemplo:

Al investigar si una semilla mejora el rendimiento. Ho: R1 = R2 Se trata de probar si el promedio del proceso A es mayor que el promedio del

proceso B. Ho: A <= B

La hipótesis nula solo puede rechazarse o no rechazarse (no se puede aceptar), cuando se rechaza la Ho, se acepta la hipótesis alterna (su complemento) Ha.

Estadístico de prueba

Para probar la hipótesis nula, se calcula un estadístico de prueba a partir de los datos de la muestra, para que después se compre con un valor crítico apropiado, para tomar una decisión sobre la hipótesis nula.

Tipos de errores

Cuando se formulan conclusiones en relación a una población con base en datos de una muestra, se pueden cometer dos tipos de errores:

Error tipo I: se comete cuando la Ho es rechazada, siendo en realidad verdadera. Se denomina error Alfa. Por ejemplo, se rechaza un producto comprado cuando en realidad es bueno (riesgo del productor).

Página 28 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Error tipo II: se comete cuando no se rechaza la Ho, cuando en realidad debe ser rechazada. Por ejemplo se acepta un producto comprado cuando en realidad es malo (riesgo del consumidor).

El grado de riesgo alfa, normalmente se acuerda entre las partes (siendo el más común 5%) . Es deseable un bajo sin embargo se incrementa el error . Para un mismo tamaño de muestra y están relacionados inversamente. Al incrementar el tamaño de muestra se reducen ambos y .

2. Pruebas de una y dos colas

Cualquier prueba de hipótesis tiene asociado un riesgo (error tipo I – rechazar Ho verdadera). Este factor se utiliza para determinar el valor crítico del estadístico de prueba que se compara con el valor del estadístico muestral calculado.

Prueba de una colaSi se establece la hipótesis alterna si un valor es más grande o más pequeño que un valor poblacional, el riesgo alfa se coloca en un lado de la curva de la distribución. Esto se llama prueba de una cola. Por ejemplo para Ha: Media > 45 horas:

Página 29 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

En caso de ser Ha: Media < 20%

Determinar si la media verdadera se encuentra dentro de la región crítica o de rechazo Alfa.

Página 30 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Prueba de dos colas

Si la hipótesis alterna se establece para probar si ha ocurrido un corrimiento de la población en cualquier dirección, el error se distribuye en los dos extremos de la curva normal. Por ejemplo: Ha: Los niveles de salario de la empresa A difieren de los de la B o Ha: los niveles son y Ho: los niveles son iguales:

Significancia práctica vs significancia estadística

Las hipótesis se prueban para determinar si la afirmación tiene mérito de significancia estadística. Tradicionalmente se utilizan valores de 5% y 1% como valores de significancia crítica. Si el estadístico calculado tiene un valor p por debajo del nivel crítico, se considera estadísticamente significativo, Cuando se trata de posibles daños al hombre o pérdidas catastróficas, se requieren valores más estrictos en caso contrario conviene utilizar valores menos críticos si las ganancias económicas son altas.

Algunas hipótesis se demuestran como significativas estadísticamente, pero es necesario valorar el esfuerzo o los costos de su implementación. Por ejemplo se demuestra que una dieta reduce el peso en 0.5 libras para 10,000 personas, estadísticamente es significativa pero no es de valor práctico reducir 0.5 libras.

Los problemas de significancia estadística ocurren frecuentemente si el tamaño de muestra no es adecuado, se requiere hacer un análisis de potencia para apoyar el proceso de decisión.(Huck, 1996)

Página 31 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Potencia de la prueba (I - )Considerar una hipótesis nula donde se considera que la media poblacional tiene una media 0 = 70 y una σ X=0.8. El intervalo de confianza para un nivel del 95% de confianza es 70 ± (1.96)*(0.8) = 68.43 y 71.57. Se acepta la hipótesis de que 0 = 70 si la X media de la muestra se encuentra en esos límites. El riesgo alfa es el que la media de la muestra exceda esos límites. ¿Qué pasa si se recorre ’0 = 71, se puede detectar este corrimiento? El riesgo de que la hipótesis sea aceptada aún con el corrimiento de la media poblacional se denomina riesgo .

El valor de es grande cuando es cercano a 0 y pequeño si esta diferencia es grande, de modo que las diferencias pequeñas serán difíciles detectar y las diferencias grandes fáciles de detectar, por ejemplo si se corre de 70 a 71, hay un 76% de probabilidad de que no sea detectado.

0.5

0.4

0.3

0.2

0.1

0.0X

Dens

ity

68.4

0.025

71.6

0.025

70

Distribution PlotNormal, Mean=70, StDev=0.8

Página 32 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

0.5

0.4

0.3

0.2

0.1

0.0X

Dens

ity

71.57

0.762

71

Distribution PlotNormal, Mean=71, StDev=0.8

C = criterio de rechazoEn este caso:

α=P ¿)

¿ P ¿)

C=μo+Zα σ√n

Para construir una curva de potencia de la prueba (1 – beta) contra valores alternativos de . En general si se incrementa alfa, beta se reduce y la potencia (1 – beta) se incrementa. En este caso si se toma el caso de dos colas donde se reparte el valor alfa se tiene:

Página 33 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

0.5

0.4

0.3

0.2

0.1

0.0X

Dens

ity

68.4

0.025

71.6

0.025

70

Distribution PlotNormal, Mean=70, StDev=0.8

C1 = 68.43

C2 = 71.57

α=P (X>C 2|H o )+P (X<C 1|H o )

¿ P ¿)

C 1=μo−Zα /2σ√n

C 2=μo+Zα / 2σ√n

¿ Fz( μo−μ1σ /√n

+Zα /2)−Fz ( μo−μ1σ /√n

−Zα /2)La gráfica de (1-beta) como función de 1 se conoce como curva de potencia. Que es la probabilidad de rechazar la hipótesis nula Ho: = o cuando realmente = 1, de modo que es la decisión correcta.

Página 34 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Tomado como referencia a C1 en 68.43 y a C2 en 71.57 para determinar las áreas sombreadas cuando se cambia la media desde 67 hasta 73 se tiene:

=1-NORMSDIST((71.57-B44)/0.8) + NORMSDIST((68.43-B44)/0.8)

Mu 1 - Beta67.0 0.963071667.2 0.937914667.4 0.901040167.6 0.850248967.8 0.784506668.0 0.704542968.2 0.613147968.4 0.514993968.6 0.415961168.8 0.322129069.0 0.238735569.2 0.169425069.4 0.115999469.6 0.078700769.8 0.056868470.0 0.049704370.2 0.056868470.4 0.078700770.6 0.115999470.8 0.169425071.0 0.238735571.2 0.322129071.4 0.415961171.6 0.514993971.8 0.613147972.0 0.704542972.2 0.784506672.4 0.850248972.6 0.901040172.8 0.937914673.0 0.9630716

Página 35 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Mu67.2

67.668.0

68.468.8

69.269.6

70.070.4

70.871.2

71.672.0

72.472.8

0.0000000

0.2000000

0.4000000

0.6000000

0.8000000

1.0000000

1.2000000

1 - Beta

1 - Beta

Se puede decir que se gana en potencia al aceptar un valor menor de error alfa. AL aumentar el tamaño de muestra se reducen tanto los errores alfa como los beta.

El concepto de potencia también se aplica al diseño de experimentos y al análisis de varianza (ANOVA), donde:

1 – beta = P(rechazar Ho, si realmente es falsa)

Tamaño de muestra

En los ejemplos anteriores se asume que se da alfa y el tamaño de muestra, sin embargo el procedimiento ideal es primero determinar los errores y deseados y con ello determinar el tamaño de muestra necesario para obtener el nivel de confianza planeado.El tamaño de muestra depende de:

El valor deseado de riesgo para los errores tipo I y tipo 2. El valor mínimo a ser detectado entre las medias de la población ( - 0)

Página 36 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

La variación de la característica medida (S o en datos variables)

Ejemplo:

Se desea conocer en un proceso piloto si un ajuste altera el rendimiento en a lo más 4 toneladas por hora, ¿cuál es el tamaño mínimo de muestra, que a un 95% de nivel de confianza – Z = 1.96, confirme la significancia de un corrimiento en la media mayor a 4 toneladas por hora. La información histórica sugiere una desviación histórica de 20 toneladas.

Obtener 96 valores de rendimiento por hora y determinar el promedio. Si este promedio se desvía en más de 4 toneladas por hora del promedio previo, ha ocurrido un cambio significativo, de otra forma la variación ha sido normal.

Para el caso de proporciones usar:

Z = Valor de Z en función alfa / 2p = proporción promedio∆ p= intervalo deseado de la proporción (error máximo)N = tamaño de muestra

Si además del error alfa se especifica el error beta para el caso de una prueba de una cola se tiene:

n≥σ2(Zα+Zβ)

2

(μo−μ1)2

Por ejemplo se quiere probar que el tiempo de respuesta de un servidor es de 2 s contra la hipótesis alterna de 3 s. Las probabilidades de alfa = 0.05 y beta = 0.1 (Zalfa = 1.645 y Zbeta = 1.28). Si la varianza es de 5.8. El tamaño de muestra es:

Página 37 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

n≥ 5.8(1.645+1.28)2

(3−2)2 = 50

La línea del criterio es:

C=2+ 1.645√5.8√n = 2.556 s

3. Estimación puntual y por intervalo

Estimación puntual para la media poblacional Corresponde a la media aritmética:

Ejemplo: Dados los siguientes valores de tiempos de espera de cuatro clientes: 28.7, 27.9, 29.2 y 26.5

Estimación puntual para la varianza poblacional

La varianza muestral S2 es la mejor estimación puntual de la varianza poblacional 2:

Página 38 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Intervalo de confianza para la media (CI) – sigma conocida

Se usa la media de la muestra, tamaño de muestra y la sigma de la población

Ejemplo: La media de 100 muestras es 18 y la desviación estándar de la población es 6. Calcular el intervalo de confianza al 95% (Z 0.025 = 1.96)

Intervalo de confianza para la media (CI) – sigma desconocida

Para una muestra pequeña (n < 30) con desviación estándar S, se usa la distribución t de Student:

Ejemplo: El promedio de 25 muestras es 18 con una desviación estándar de 6, calcular el intervalo de confianza para la media a un nivel de confianza del 95% (t 0.025, 17 = 2.064).

Intervalo de confianza para una proporción

Para muestras grandes con np y n(1-p) mayores o iguales a 5, la distribución binomial puede ser aproximada por la distribución normal para calcular el intervalo de confianza para la proporción poblacional (Z0.05 = 1.645):

Página 39 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Ejemplo: Si 16 defectivos se encuentran en una muestra de 200, calcular el intervalo de confianza del 90% para la proporción.

Intervalo de confianza para la varianza 2

Dado que se utiliza una distribución Chi cuadrada, este intervalo no es simétrico respecto al varianza muestral

Ejemplo: La varianza de un grupo de 25 muestras fue de 36. Calcular el intervalo de confianza del 90% para la varianza (2

0.05,24 = 36.42, 21-0.05, 24 = 13.85)

Para las desviaciones estándar se tiene:

4. Pruebas de hipótesis

A continuación se muestran las pruebas de hipótesis normales y las de proporciones:

Página 40 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Página 41 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Prueba de hipótesis para la media (sigma conocida)

La hipótesis nula es Ho y la hipótesis nula es H1, el valor fijo de comparación es 0.

Dependiendo del signo de la hipótesis alterna H1, si es > se trata de una prueba de cola derecha, si es < es una prueba de cola derecha y si es una prueba de dos colas.

Página 42 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

El estadístico de prueba es:

Ejemplo: el tiempo promedio que una persona ahorra en un banco es de 5 años con una desviación estándar de 0.12 años. Se verificaron 5 cuentas nuevas resultando en 5.10, 4.90, 4.92. 4.87, 5.09, 4.89, 4.95 y 4.88 ¿Se puede afirmar con un 95% de confianza que las nuevas cuentas se guardan por un periodo más corto que el original?

es una prueba de cola izquierda

Después de sacar el promedio y la desviación estándar muestral se determina el estadístico de prueba:

El valor crítico de - Z 0.05 = -1.645 Como el estadístico calculado Zc es mayor al valor crítico y no se encuentra en la región de rechazo, no puede rechazarse Ho

-1.645 -1.18 0

Página 43 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Prueba de hipótesis para la media (sigma desconocida, muestras pequeñas)

Para este caso se utiliza la distribución t de Student (usada cuando n < 30), su estadístico de prueba es:

Se sigue el mismo procedimiento que en el caso anterior. El estadístico calculado Tc se compara con el valor crítico t/2, df = n-1 para una prueba de dos colas o con t, df = n-1 para pruebas de una cola.

Ejemplo: La media de ingresos de un hospital es de 880. Se está evaluando un nuevo programa de mercadotecnia durante 25 días (n = 25) con un rendimiento de 900 y desviación estándar de 20. ¿Se puede decir a un 95% de confianza que el ingreso ha cambiado?

Se trata de una prueba de dos colas

El estadístico calculado es:

El valor crítico t0.025, 24 = -2.064 y t0.975,24 = 2.064 que definen las zonas de rechazo

Como el valor de tc es mayor al valor t crítico de 2.064, se rechaza la Ho y se concluye al 95% de nivel de confianza que el ingreso ha cambiado.

-2.064 0 2.064 tc = 5

Página 44 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Página 45 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Ejercicio: Una nueva bujía se prueba para desgaste. Una muestra de seis bujías dieron los resultados siguientes: 58, 49, 44, 50 y 47 milésimas de pulgada de desgaste. El diseño clásico tiene un desgaste promedio de 55, a un 95% de nivel de confianza ¿es mejor el nuevo diseño?

Ejemplo: Un experimento muy caro se evalúa para producir diamantes sintéticos por una nueva técnica, se han generado cinco de ellos con pesos: 0.46, 0.61, 0.52, 0.57 y 0.54 quilates. Si el peso promedio se encuentra por encima de los 0.50 quilates el proyecto es rentable, probar esto a un 95% de nivel de confianza ¿cuál es la recomendación?

Pasos de la prueba de hipótesis:

En los ejemplos anteriores, los pasos seguidos fueron:

Paso 1. Establecer las hipótesis Ho y H1 (la Ho siempre lleva el signo =, <=, >=)

Paso 2. Determinar el valor crítico del estadístico con el que se va a comparar (con base en alfa y n), este define las zonas o zona de rechazo

Paso 3. Calcular el estadístico de prueba con los datos de la muestra

Paso 4. Si el estadístico calculado cae en la zona de rechazo, rechazar Ho de otra forma no habrá evidencia suficiente para rechazarla

Página 46 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Pruebas de hipótesis de dos medias – varianzas iguales

Prueba la diferencia entre 2 medias muestrales cuando se conocen las varianzas de las poblaciones y se consideran iguales.

Las hipótesis son las siguientes:

Con Sp = desviación estándar conjunta

Ejemplo: Comparar el peso de productos en dos máquinas

Máquina 1 Máquina 23.125 3.11

3.12 3.0953.135 3.115

3.13 3.123.125 3.125

X1=3.127S1=0.0057

X2=3.113S2=0.0115

Sp=√ 4 (0.0057 )2+4 (0.0115)2

8=0.0091 df. = 5 + 5 = 8

t= 3.127−3.113

0.0091√ 15+ 1

5

=2.43

El valor crítico para t0.025,8 = 2.3096 (prueba de dos colas), se rechaza la Ho

Página 47 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Pruebas de hipótesis de dos medias – varianzas diferentes

Prueba la diferencia entre 2 medias muestrales cuando se conocen las varianzas de las poblaciones y se consideran iguales.

Las hipótesis y fórmulas son las siguientes:

Ejemplo: Comparar el peso de productos en dos máquinas

Máquina 1 Máquina 23.125 3.11

3.12 3.0953.135 3.115

3.13 3.123.125 3.125

X1=3.127S1=0.0057

X2=3.113S2=0.0115

DF = 5.83, si se redondea hacia abajo, tiende a incrementarse el nivel de confianza

t= 3.127−3.113

√(0.0057)2

5+(0.0115)2

5

=2.44

Página 48 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

El valor crítico para t0.025,5 = 2.571 (prueba de dos colas), no se rechaza la Ho (a pesar de estar muy cerca)

Página 49 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Prueba t pareada

Se utiliza para probar la diferencia entre dos medias muestrales de tratamientos a los mismos sujetos. Los datos se toman en pareas y se calcula la diferencia de cada par.

Ejemplo: Calcular si hay diferencia a un 95% de nivel de confianza con dos operadores que miden el mismo grupo de muestras:

En este caso se rechaza la Ho

Prueba de una proporción – prueba p

Se aplica cuando el número de intentos es fijo e independiente y la probabilidad de éxito se mantiene constante. Cuando np < 5 o n(1-p) < 5 se usa la distribución binomial para hacer las pruebas en relación a la proporción.

Si np >= 5 o n(1-p) >= 5 se usa la distribución normal como aproximación a la binomial, las hipótesis son:

El estadístico de prueba es:

Página 50 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Donde el número de éxitos es X y el número de muestras es n. El estadístico de prueba es Zc y el valor crítico a comparar es Z/2 o Z

Prueba Chi cuadrada (2) para un varianza

Cuando la población es normal, las pruebas de hipótesis para comparar una varianza poblacional 2

x con un valor 2o fijo son:

El estadístico de prueba es:

Este estadístico de prueba se compara con el valor crítico 2 o 2

/2 dependiendo si la prueba es de una o dos colas, los grados de libertad son d.f. = n – 1.

Dependiendo del signo de la hipótesis alterna H1, si es > se trata de una prueba de cola derecha, si es < es una prueba de cola derecha y si es una prueba de dos colas.

Caso I. Prueba de una varianzaEjemplo: La variación a la tensión de un nuevo material de acero ¿es menor o igual a 60 psi a un 95% de confianza (sigma = 15). Ocho muestras tuvieron una desviación estándar de 8 psi.

Página 51 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

prueba de cola izquierda

Con n=1 = 7 grados de libertad y un nivel de significancia de 5% el valor crítico es menor a 2.17.

El estadístico calculado es:

Como X2c en mayor al valor crítico, la variación es menor en el nuevo acero.

Tabla de contingencia

Caso II. Prueba de igualdad de proporciones

Es frecuente comparar proporciones que representan las condiciones de varios procesos (habilidad de inspectores, calidad de máquinas para producir productos aceptables, etc.), el método se denomina Tabla de contingencia.

Se sigue el procedimiento siguiente:1. Tomar un subgrupo de cada proceso y determinar las frecuencias observadas (O)2. Calcular para una de las condiciones las frecuencias esperadas (E )

Ei = Total de renglón i *Total de columna i / Gran total

3. Comparar las frecuencias observadas y las esperadas para obtener “realidad”.

(Oi – Ei) / Ei

4. Sumar todas las condiciones de proceso

5. Se determina el valor crítico usando la tabal de Chi cuadrada. El estadístico Chi cuadrado de frecuencias observadas (O) y esperadas (E ) con grados de libertad (R-1)(C-

Página 52 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

1) – R filas, C – columnas, con todo el nivel de significancia en el lado derecho de la distribución.

6. Se hace una comparación entre el estadístico de prueba y el valor crítico para confirmar si existe una diferencia significativa (a un nivel de confianza seleccionado).

Ejemplo: en un aeropuerto se quiere evaluar la habilidad de 3 inspectores para detectar por rayos X radios de transistores en las maletas:

¿hay diferencia significativa en las habilidades de los inspectores a un 95% de nivel de confianza?

Las hipótesis en relación con las proporciones son:

Ho: No hay diferencia entre inspectores, H1: Si hay diferencia entre inspectores

Los grados de libertad DF = (filas – 1) (columnas -1) = (2-1)(3-1) = 2

El valor crítico de 20.05,2

=5.99

El valor esperado del estadístico calculado es:

Página 53 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Como el estadístico calculado de Chi cuadrada es menor que su valor crítico de 5.99, la hipótesis nula no puede ser rechazada indicando que no evidencia suficiente para decir que las habilidades de los inspectores son diferentes.

Prueba de igualdad de dos varianzas F

Si se extraen dos muestras independientes de dos poblaciones normales con varianzas iguales, la relación S1

2/ S22 crea una distribución muestral conocida como la distribución

F. Las pruebas de hipótesis para comparar las varianzas de dos poblaciones se da a continuación:

Los grados de libertad asociados a las varianzas de las dos muestras se representan por 1 y 2 respectivamente.

El estadístico F es la relación de las dos varianzas muestrales (dos distribuciones Chi cuadrada) como sigue:

Por costumbre se toma la varianza S12 como la mayor respecto a S2

2 . Para esta prueba se utilizan las tablas F, abajo se muestra la de =0.05.

Página 54 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Los valores críticos para F pueden se usados con una cola (=0.05, 95% de confianza) o con dos colas (/2=0.05, 90% de confianza).

La gráfica de la distribución F se muestra a continuación:

Ejemplo: Si S1 = 900 psi, n1 = 9, S2 = 300 psi, n2 = 7. A un 95% de nivel de confianza, ¿se puede concluir que ahora hay menor variación?

Grados de libertad 1 = 8, Grados de libertad 2 = 6.

Usando todo el riesgo alfa del lado derecho, el valor crítico de F es F0.05, 8, 6 = 4.15, este valor define donde inicia la zona de rechazo.

Página 55 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

El estadístico F calculado es:

Fc = 900^2/300^2 = 9

Por tanto se rechaza Ho y hay evidencia suficiente para decir que la variación se ha reducido.

Resumen de pruebas de inferencia estadística

Página 56 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

VIII.7 ANÁLISIS DE VARIANZA

ANOVA – UNA VÍA

En muchas investigaciones es necesario comparar tres o más medias poblacionales simultáneamente, los supuestos antes de realizar la prueba son:

La varianza es la misma para todos los tratamientos o niveles del factor Las mediciones individuales dentro de cada tratamiento están normalmente

distribuidas El término de error o residuales se considera que tienen un efecto aleatorio

normal e independientemente distribuido.

http://www.uncp.edu/home/frederick/DSC510/m510ANOVA.htm

Con el ANOVA, las variaciones en las mediciones de la respuesta se particionan en componentes que reflejan el efecto de una o más variables independientes. La variabilidad de un conjunto de mediciones es proporcional a la suma de cuadrados de las desviaciones usadas para calcular la varianza.

Página 57 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

El ANOVA particiona la suma de cuadrados de las desviaciones de las mediciones individuales de la gran media (suma de cuadrados totales) en partes: la suma de cuadrados de las medias de los tratamientos más un residuo denominado error aleatorio o experimental.

Donde:

Suma de cuadrados cruda

Factor de corrección de la media (CF)

Suma de cuadrados total o suma de cuadrados corregida

Varianza (N = datos toales)

Fórmulas

Página 58 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Página 59 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Ejemplo: Se comparan las salidas de tres máquinas, determinar is hay una diferencia significativa en los resultados con =0.05.

La Tabla ANOVA es la siguiente:

Fuente de variación SS DF MS F

Máquinas 137.2 2 68.6 33.2

Error 24.8 12 2.067Total 162 14

Como el valor calculado de F(33.2) excede el valor crítico de F, se rechaza la Hipótesis nula, hay evidencia de que existe una diferencia real entre las medias de las máquinas.

e es la desviación estándar conjunta de la variación dentro de los tratamientos. Se puede considerar también la sigma de capacidad del proceso de las mediciones individuales, es la variación que permanecería aun si se eliminara la diferencia entre tratamientos.

Página 60 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

ANOVA – DOS VÍAS

El ANOVA de dos vías es una continuación del ANOVA de una vía. En el ANOVA de dos vías hay tres componentes de varianza: Tratamientos del factor A, Tratamientos del factor B y error experimental (se refiere como columnas, renglones y error).

Materiales de estudioInstructor 1 2 3 Suma n Promedio Cuadrado

1

888492

686272

767078 690 9 76.667 52900

2

606858

445052

605256 500 9 55.556 27778

Suma 450 348 392 1190 80678n 6 6 6 18Promedio 75 58 65.33Cuadrado 33750 20184 25610.7 79544.7Suma X^2 34852 20792 26200 81844 Las hipótesis nulas son: El instructor y los materiales de estudio no difieren

Suma X = 1190 N = 18 DF = 17 Gran media (GM) = 1190 / 18 = 66.11

CM = (Suma X)^2 / N = (1190^2) / 18 = 78672.22 Suma (X^2) = 81844

SS total = Suma (X^2) – CM = 81844 – 78672.22 = 3171.78

SSCol = Suma Cuadrados Columnas – CM = 79544,67 – 78672.22 = 872.44

SSReng = Suma Cuadrados Renglones – CM = 80677.78 – 78672.22 = 2005.56

SSE = SS total – SS Col – SS Reng = 3171.78 – 872.44 -2005.56 = 293.78

La Tabla ANOVA de dos vías es la siguiente:

Fuente SS DF MS F F0.05, 1, 2

Columnas (materiales) 872.44 2 436.22 20.8 F0.05, 2,14= 3.74

Filas (instructor) 2005.56 1 2005.56 95.6 F0.05, 1,14= 4.6

Error 293.78 14 20.98Total 17

Página 61 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Como la F del instructor 95.6 excede a la F crítica de 4.6, se rechaza la Ho y hay diferencias en instructores.

Como la F de los materiales de 20.8 excede a la F crítica de 3.74, se rechaza la Ho y hay diferencias en instructores.

La sigma del error es la raíz de 20.98 = 4.58

La sigma total es la raíz de SS Total / (N – 1) = 13.66

La diferencia entre sigmas total y del error se debe a la diferencia significativa de los instructores y loa materiales de estudio. Si no hubiera habido diferencias significativas, las sigmas hubieran sido similares.

VIII.8 OTRAS HERRAMIENTAS

ANÁLISIS DE CAUSA RAÍZ

L a solución a un problema puede tomar varios pasos:

Situación Acción inmediata Acción intermedia Acción de causa raízLa presa tiene fuga Taparle Poner un parche Buscar la causa de la

fuga y reconstruir la presa

Partes fuera de especificaciones

Inspección 100% Poner un dispositivo de prueba en la línea

Analizar el proceso y tomar acción para eliminar la producción de partes defectuosas

Para ayudar a localizar el problema verdadero del sistema, se pueden utilizar diversas herramientas como son:

Herramientas subjetivas Herramientas analíticasPreguntar porqué, porqué, porqué,….Tormenta de ideasAnálisis de flujo de procesoPlanear –hacer – verificar – actuarSolución sistemática de problemasTécnica de grupo nominalObservación de operadorDiagramas de causa efectoEjercicios de consensoSeis sombreros de pensamiento

Colección y análisis de datosAnálisis de ParetoAnálisis de regresiónHojas de verificaciónMatriz de análisis de datosAnálisis de capacidad de procesosPartición de variaciónSubgrupos de datosExperimentos simplesDiseño estadístico de experimentos

Página 62 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

Uso de equiposFMEA / Árbol de fallas

Pruebas analíticas (Chi cuadrada, F, Z, t)Cartas de control

Cuando se proponen acciones correctivas permanentes, la administración debe determinar si:

El análisis de causa raíz ha identificado la extensión completa del problema La acción correctiva es satisfactoria para eliminar o prevenir la recurrencia La acción correctiva es realista y mantenible

LOS CINCO POR QUÉS

El método de los 5 porqués para el análisis de causa raíz se describe como hacer cinco veces la pregunta ¿Porqué?, por ejemplo:

Síntoma: Los embarques al cliente no llegan a tiempo:

1. ¿Por qué? Nos atrasamos porque falló la troqueladora2. ¿Por qué? No se le ha dado mantenimiento durante tres meses3. ¿Por qué? Se redujo el personal de mantenimiento de ocho a seis personas4. ¿Por qué? El departamento de mantenimiento excedió su presupuesto por los costos de tiempo extra, el director eliminó el tiempo extra y pidió una reducción del 25%5. La empresa no logró los resultados planeados de modo que el director ordenó evitar todos los gastos innecesarios

Las cinco preguntas no son mandatorias, si no hay necesidad de preguntar más pararle y si hay necesidad hacer más preguntas.

Página 63 de 64

FASE DE ANÁLISIS P. Reyes enero 2009

5Ws – 1H (o 2H)

Es una técnica ya común, se originó con periodistas que preguntaban para conseguir la historia completa, se trata de preguntar ¿Quién?, ¿Qué?, ¿Cuándo?, ¿Dónde?, ¿Por qué? Y ¿Cómo?. En el área de calidad se aplica en cada rama del diagrama de Ishikawa para llegar a la causa raíz.

El orden de las Ws varia dependiendo la fuente de referencia. La técnica busca en un problema o síntoma desde varios puntos de vista de modo de incluir tanta información como sea requerida para ayudar a determinar la causa raíz.

Análisis del modo y efecto de falla (AMEF)

Herramienta para anticipar acciones preventivas a problemas potenciales

Página 64 de 64

Componente ______________________ Responsable del Diseño ____________AMEF Número _________________Ensamble ________________ Preparó _______________ Pagina _______de _______Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______

Funcióndel Producto/

Paso del proceso

Modos de FallaPotenciales

Efecto (s)Potencial (es)

de falla

Sev.

Causa(s)Potencial(es)

o Mecanismosde falla

Occur

Controles de Diseño o Proceso Actuales

Detec

RPN

AcciónSugerida

Responsabley fecha límite

de Terminación

AcciónAdoptada

Sev

Occ

Det

RPN

Resultados de Acción

ANALISIS DEL MODO Y EFECTO DE FALLA AMEF de Diseño / Proceso