20
1 02 Determ i nar las variables si gn i f i c a tivas 6  Teorema del límite central TLC) Suponer que se to man mue s t r a sde ta m o s u fic i e n te me nt e g ra n d e y q u e s e c a l c ul an las med i a s de d i chas m u es t r a s . Sin imp o r t ar c u á l s e a l a d ist r i b ució n orig i nal (unidades in d i vid u ale s ) , la d i st ri buc i ón de las medias de d ic ha s mues - tras será normal . Lasf i g ur as 4 . 2 y4 . 3 muestran una rep r esen t a ció n gráf i ca d el T L e D i s t r i buc i ones o ri g i na l es (Xs) D i s t r i buc i ón de sus med i as ( X ) No r ma l ? - 1 F i gura 4.2. Represen t a c i ón grc1f i cadel TLC L a v a r i ac i ó n de l ad i st r ib ució n de l os dat os o r i g i nale s e s mayor que la v aria - ció n d e la d i str i b ució n de s u s m edia s mues t ra l e s (figura 4 . 3) . I L - 1 F i g u r a 4.3 . C o m p a ración d e l a d i s tri b u c i ón orig i n al y l a d i strib u c i ón de m e d ia s

Muestreo y Doe Escalante2

Embed Size (px)

Citation preview

Page 1: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 1/19

102 Determinar las variables significativas

6

 T e o r e m a d el l ím i t e c e n tr a l T L C )

Suponer que se toman muestras de tamaño suficientemente grande y que se

calculan las medias de dichas muestras. Sin importar cuál sea la distribución

original (unidades individuales), la distribución de las medias de dichas mues-

tras será normal.

Lasfiguras 4.2 y 4.3 muestran una representación gráfica del TLe

Distribuciones originales (Xs) Distribución de sus medias ( X )

Normal

?

- 1

Fig ura 4 .2 . Rep re se ntación grc1fic ade l TLC

La variación de la distribución de los datos originales es mayor que la varia-

ción de la distribución de sus medias muestrales (figura 4.3).

I L

- 1 F igura 4.3. Comparac ió n de la distr ibución orig inal y la distribución de medias

·,,-1---'------------

Page 2: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 2/19

Pruebas de hipótesis e intervalos de confianza 103

1

Las hipótesis. La que se desea probar (Hol y su complemento (Hal.

2. lcís]

rnuesfrols]. La información que se obtiene de la población o

poblaciones.

3.

El estadístico de prueba (EPl. Es una variable aleatorio que resume

la información de la muestra. .

4.

La región de rechazo de Ho (RRHol. Es una parte de la distribución

de referencia en la cual si el EPse encuentra ahí, se rechaza Ho.

5. La decisión. Decidir si se rechaza o no a Ho. ~

6.

El nivel de confianza de la prueba (1 - al.

V

P r u eb as d e h ip ó tes i s e i n t er v a l o s

d e c o n f i an za

Esta sección introduce el uso de las pruebas de hipótesis y los intervalos de

confianza como herramientas de análisis de un proceso.

La prueba de hipótesis (PHl es un procedimiento estadístico usado para

tomar una decisión, con base en una muestra, en cuanto al valor que puede

tener algún parámetro (media, varianza, proporción, diferencia entre medias

o proporciones, o cociente entre varianzasl, o sobre la distribución que pue-

de tener la población de donde provienen los datos.

Loselementos de una PH son:

Los tipos de errores y sus probabilidades son:

e x = p(error tipo 1 1

e x = p(rechazar Ho IHo verdod]

~. = p(error tipo 1 1 1

~ = p(aceptar Ho IHo

Iolsc]

Para realizar una prueba gráfica de normalidad el procedimiento es el si-

guiente:

1. Obtener los datos.

2.

Elaborar la tabla correspondiente.

3.

Graficar en papel probabilístico normal.

  Si los datos siguen una trayectoria aproximadamente lineal, se acep-

ta su normalidad.

La figura 4.4 ilustra dos casos posibles al probar la normalidad y la decisión

por tomar.

Page 3: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 3/19

104

Determinar las variables significativas

6

F

F

• •

• •

Normal No-Normal

Datosordenados Datosordenados

- 1 Figura 4.4. Ejemplos de gráficas en papel probabillstico normal

La figura 4.5 muestra el papel probabilístico normal. La aplicación de esta

prueba se verá con más'detalle en el tema de Diseño de experimentos.

99. 5--.--.--,---..,---.---.----.-----r--.---,-.--.--...--...----r ---.-----.--.---,

99r   ~r _  ~ _  _ ~ ~ _  ~ _r   ~ ~ ~_r~

98

95r   ~r_  ~ _  _ ~ ~ _  ~ _r   ~ ~ ~_r~

90r   r _r   ~_  _ ~ r _  _  r ~   ~ r _  ~~~

80r   r _r   ~_  _ ~ r _  _  r ~   ~ r _  ~~~

70r   ~r_  ~ _  _ ~ ~ _  ~ _r   ~ ~ ~_r~

60r   r _r _  ~ _  _ ~ r _  _  _~_r   ~ r_  _~_r~

~ 50r   r _r   _ ~_  _ ~ r _  _  _~_r   ~ r_  _~_r~

~ 40r   ~r_  ~ _  _ ~ ~ _  ~ _r   ~ ~ ~_r~

30r   r   r   ~~ r   _  ~ r   r   _   ~   r _  _ ~

20r   ~r_  ~ _  _ ~ ~ _  ~~   ~ ~ ~_r~

10r   ~r _  ~ _  _ ~ ~ _  ~ _r   ~ ~ ~_r~

5r   ~r_  ~ _  _ ~ ~ _  ~ _r   ~ ~ ~_r~

2r   r _r   ~_  _ ~ r _  _  r~   ~ r _  ~~~

l r   r _r   ~_  _ ~ r _  _  _~_r   ~ r_  ~ _r~

0. 05  r _r   ~_  _ ~ r _  _  _~_r   ~ r_  ~ _r~

- 1

Figura 4.5. Papel probabilístico normal

P r u e b a d e h i p ó t es i s P H ) e i n t e r v a l o

d e c o n f i an za  le p a r a u n a m ed i a

Re gió n d e re ch az a de Ha (R RH o)

Ha: Il = Jlo Ha: Il > Jlo

Il < Jlo

Il ~ Jlo

Z > Z¿ t > ta,n- 1

Z <  Za t < -ta,n-l

IZI > Za/2Itl>ta/2,n-l

Page 4: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 4/19

Pruebas de hipótesis e intervalos de confianza

l

al n

30 EP:l ~

X~I';¡

s~

b n< 30, población normal

b 1) Varianza conocida

- s/

IC

=

X ± la/2 / ~

EP:l ~ X § 5 ; le ~ X

±

lo  *  

b2 

Varianza desconocida

EP:I ~

XXI';¡

~

- s/

IC

=

X ± ta/2,n-l / ~

Eiemplo 4.1

De una muestra de n=50 focos de 100 W de un proceso estable se obtuvo X=890h

y S=220 h. ¿Presentan estos datos suficiente evidencia que sugiera que la vida

media de los focos producidos por este proceso es menor a 1000 h? Usar un ni-

vel de confianza de 95 por ciento.

Ho: j.I. = 1000 Ha: j.I.

<

1000

J:

X -

EP: Z = S

. . r n

Z = 890-1000 = -3.535 vs Z

7.

1 6 5

2 2 y . J 5 0  

e x

=

-~.05

= - . ~

Como -3.535<-1.645, existe suficienteevidencia para rechazar Ha, es

decir, para rechozor que la vida media de los focos es 1000 h. •

P r u e b a d e h i p ó t es i s P H ) e i n t er v al o d e

c o n f i a n z a

 le

p ar a l a d i f er e n c i a d e m ed i a s

He: ~l

>

~2

~l

<

~2

~l   ~2

Región de rechazo de Ho (RRHol

Ha: ~l = ~2

Z.> la.

.t>

t

a

,nl+nT

2

Z <  la . t< -t

a

,nl+nT

2

III

? -

la/2I

t

l> ta/2,nl +nT2

Page 5: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 5/19

106 Determinar las variables significativas

6

a) (n1,n2) ~

30

EP:

Z =

le = x, - X

2

± Za/2 ~ * + ~

b

(n 1,n2) <

30,

población normal y vorionzos

desconocidos

Sp

=

(n 1- ~ S f+(~- ~ S 2

n1+~-2

x - x

EPt ~

J iJ l .

n¡ ~

~'2 S2

le = X l - X

2

± t

/2 I

.::L + .::2.

a

,g

n¡ ~

( ~ + ~ ) 2

I

n1 ~

9 =

r n   f i I

n¡-l ~-l

El tamaño de muestra para el le es

n1

=

n2

=

  Z 1

2

}S12

+

S~)

Considerar estos grados de

libertad Igll paro determinar

lo RRHo.

Eiemplo 4.2

Se desea comparar la vida media de los focos de 75 W y los de 100 W. Se tomó

uno muestra de 10 focos de 75 W y 12 focos de 100 W de donde se obtuvo:

X(75)= 1050, S(75)=100, X(100)=990, S(100)=170. Probar la hipótesis de

igualdad de vida promedio. Usar alfa=5 

y

calcular ellC correspondiente .

.:-1f-----'--------------

Page 6: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 6/19

Pruebas de hipótesis e intervalos de confianza

107

Ho: J . L l

=

J .L 2 Ha: J . L l   J .L 2

~

x - x

EP:

t

=

Sp

~+~

Il]

 

Sp = 9(100)2+

1

 170)2 = 142 81 1

10+12-2. .

t ~ 1050-~90 1 ~~

142.81~TO+T2 ~

como

0.9812

no es mayor que

2.086,

no se rechaza la igualdad de las medias

de las dos poblaciones.

IC

=

1050 - 990

±

(2.086)(142.811) ~16 + 1~

= (-67.55, 187.55)

Como el valor cero estó incluido en el intervalo, no se rechaza la igualdad de las

medias de las dos poblaciones. •

Eiercicio 4 1

Resolver el mismo problema considerando el caso de varianzas diferentes y com-

porar los resultados. •

C as o d e o b s er v ac io n es n o in d ep en d i en tes

  o b s er v ac io n es en p ar ej as )

Poblaciones normales, muestras pequeñas

, , - . ( ~ J

C: . d

 ±

t

a

/2,n- 1 . . . J n

d representa las diferencias y n es el número de las mismas.

Ho: Ild = O Ha: Ild   O

d   B

*

Rechazar Ho si Itl >-t,,/2 n-l

. . ,

P : t =

Page 7: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 7/19

108 Determinar las variables sigoificativas

P r u eb a d e h ip ó t es i s P H ) e i n t er v al o

d e c o n fi an za

 le

p ar a p r o p o rc io n es

a) n : : : = 30, 0.1

 

P

 

0.9 (una proporción)

. .

Región de rechaza de Ho (RRHol

Z

>

Z Za

IZ I

>

Za/2 .

Ho:

P

=

PO

Ha: p>

Po .

np

< Po

np ~

Po

Ep : Z =

le

. - + 7 ~ª1-

¡ 5 )

. p - La/2

n

~

L3

I

X=número de éxitos en la muestra

I

b

(n

1,

n2)

: : : =

30 (diferencia entre proporciones)

R eg ión dé recha~o de t- to (RRHo l

Z > t;

Z Za

IZ I

>

Za/2

Ho: P: =

P2

Ha:

Pl

>

P2

npj < P2

np¡ ~ P2

Ep : Z

=

Eiemplo 4.3

Se desea saber si existe diferencia entre la fracción defectuosa producida por dos

diferentes prensas en la fabricación de lámparas de tungsteno-halógeno. Se obser-

vó que el número de lámparas defectuosas de la prensa 1 fue 702 de un total de

727..2, y en la prensa 2 fue 1056 de un total de 13,393. Usar alfa 5  y calcular

el correspondiente

le.

Ho: p¡ = P2

- ~

¡

=

Ha: p¡ ~ P2

P 2

= ~ EP:

Z

=

 2

r-·-I-----------------

Page 8: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 8/19

Pruebas de hipótesis e intervalos de confianza

109

702

1056

s

Pl =

7272

= 0.0965

f32=

13,393

= 0.0788

P=

X

1

+X

2

'702+ 1056

= 0.0851

n¡+ 2

7272 + 13,393

 

Z = 0.0965-0.0788 = 4.35

·VO.0851 1 0.085~ 72j.2 + 1'3,193}'

Como 4.35> 1.96=Z(a/2), se rechaza la igualdad de la fracción defectuosa en

las dos prensas.

0.0965(1- 0.0965) + 0.0788(1- 0.0788)

= 0.0965 - 0.0788

±

1.96 7272 ... 13,393

= (0.0095 , 0.0259)

Como el valor cero no estó incluido en el intervalo, se· rechaza la igualdad de las

proporciones defectuosas en las dos prensas. •

P r u eb a d e h i p ó t es i s p ar a m ás

d e d o s

proporciones

Ha: P l = P 2 = p3 = .. . = P k

Ha: al menos una proporción es diferente

fo

=

frecuencia

observada

fe

=

frecuencia

esperada

k

=

número de

proporciones

por comporar

Rechazar Ha si

X

2

>

X~,k-

1

(Tot, columna)(Tot. renglón)

fe = Gran total

Page 9: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 9/19

  E;emplo 4.4

Se desea saber si existe diferencia en el número de unidades defectuosas en la fabri-

cación de calentadores de agua. Se tomó la información mostrada en la tabla 4.1

Tumo 1

f~ 2

3 Total

, , 6

U. defectuosas(x) 30(16.89) 10(14.36) 8(16.75) 48

U. producidas (n-x) 3221 (3234.11) 2753(2748.64) 3215(3206.25) 9189

Total n 3251 2763 3223 9237

- 1

Tabla 4.1. Información

y

cálculos parciales para el ejemplo 4.4

. .

3206 25

=

3223(9189)

.... 9237

(3215-3206.25)2 _ 16 15

+ ... + 3206.25 -.

1689- 325 48)

. - 9237

2 (30-16.89)2

X = 16.89

X6.05 2 = 5.99

Por tanto se concluye que por lo menos el número de unidades defectuosas en uno

de los tres turnos es diferente. •

P r u eb as d e h ip ó tes is e i n ter v al o s

d e c o n fi an za p ar a v ar i an zas

o) Una varianza, población normal (n < 30)

Región de rechazo de Ho (RRHo)

Ho:

(12

=

(13

x

2

> X~,n-l

X

2

<

X2

1-a,n-l

X

2 > X2 O X2

<

X2

a/2,n- 1 1-a/2,n-l

Ha:

(12 > (13

(12 < (13

(12  (13

(n- ~S2

E P : X2

=

0 5

le

· [ ( n - ~S2. ( n - ~S21

. 2 '2

Xa/2,n- 1 Xl -a/2,n- 1

b

n :2: 30

Ho:

(1

=

(10

EP,Z~

~Q

00

ffn

Región de rechazo de Ho (RRHo)

Ha: 1

(1 > (10 Z.>

Z¿

1 (1 < (10

IZI > Za/2

IC : [ S . S 1

1+Za/2 1- J f . ;

  F n

2n

..1----~---

Page 10: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 10/19

Pruebas de hipótesis e intervalos de confianza

111

e l Cociente de varianzas de poblaciones normales (n 1, n2) < 30

,  if

Ho:

 .21

=

 '22 • 'v Regiónde rechazade He¡(RRHo)

Ha: <Tf

> < T i

F

>

Fa n - 1 n - 1

 1  2

l < T f

<

< T i

F < F1-a,n1-1,n2-1

l < T f ? = < T i F < F1-a/2 ,n1-1,n2-1 O F > Fa/2,n1-1,nr1

E P : F = ~

2

le [

S¡2 . S¡2Fa/2,n'r 1,n¡-1]

, Sra /2 ,n¡- 1, :2-1  S~

e l )

(n1,n2) ;::: 30

Regiónde rechazode Ho (RRHo)

Ho: <T1

=

<T2

Ha: <T1

>

<T2

Z

> r;

E P :

Z

=

Sl-

<T1

<

<T2 Z

<

-Za

Sp

_1 +_1_

2n1 2n2

<T1

? = <T2

IZ I > Za/2

Transform ación de F

I

F

1-a/2,n,-I,n2-1 =

F a/2,n2-1 ,n,-1

Eiemplo 4.5

Probar Ho: '(1=200

vs

(1)200 para datos de vida promedio de n=20 focos de

100 W, donde S=220. Usar alfa 5 . Suponer población normal y proceso estable.

Ep

.

2

= (n

-1) 2

= 19(220)2 = 22 99

. X  

2002 .

Como 22.99 es menor que 30.1, no se rechaza Ho, es decir, no se rechaza que

la desviación estándar sea 200 horas. . •

Eiercicio 4.2

Se quiere probar si dos diferentes procesos de manufactura (A

y

BI de focos tipo

A19 de 60 W tienen la misma dispersión de vida. Se tomaron 61 muestras del pro-

ceso A

y

31 muestras del proceso Bobteniéndose S(AI=236 h

y

S(BI= 172 h. Apli-

car una

 

usando alfa 5 por ciento. •

Page 11: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 11/19

112 Determinar las variables significativas

D i s e ñ o y an á l i s is d e

ex p er i m en t o s D G E )

El DOE se puede definir como un conjunto de técnícos estadísticas usadas

para planear experimentos y analizar sus resultados, de manera ordenada y

eficiente. 1

Existentres principios básicos a ser considerados en todo diseño y análi-

sis de un experimento: .

1.

El

orden

de los experimentos debe ser

aleatorio.

Aleotorizor el or-

den de las pruebas neutraliza fuentes de variación que pueden estar

presentes durante el experimento. En general dichas fuentes de va-

riación son desconocidas, y pueden ser muchas, por, ejemplo, can-

sancio del trabajador durante la realización de los pruebas o

durante la medición de las mismas, cambios de voltaje, cambios de

humedad, etcétera.

2. Esrecomendable replicar cada experimento. la razón es obtener un

estimado del error, tanto para ver qué tan bien el diseño representa

al proceso, como para poder comparar los factores y determinar si'

son activos o no. Se define como réplica genuina la obtenida en

una sola prueba o medición para cada combinación de los fac-

tores/ y volver a repetir dichas condiciones para cada réplica adi-

cional/ en lugar de tomar varias muestras o mediciones de una vez

en cada combinación. lo opuesto a las réplicas genuinas son las

repeticiones. Por supuesto las réplicas genuinas implican un mayor

tiempo al realizar las pruebas y un costo también mayor, pero es la

mejor manera de obtener un estimado más preciso del error.

3. Ocasionalmente pueden existir variables presentes en un· experi-

mento/ cuyo efecto no se desea probar y que incluso pueden ofec-

tar o encubrir la influencia de las variables con las que se desea

experimentar. En este caso es necesario neutralizar o bloquear el

efecto de tales varicibles nocivas. Posteriormente se verán los dise-

ños con bloques.

los pasos pata la experimentación son:

e,

r

1. Definir .el problema.

2. Seleccionar la variable de respuesta.

3. Verificar el estado de las máquinas en donde se va q.experimentor

(Esc:alOnte,19.92), . ' \

4. Verificar la capacidad y estabilidad de los instrumentosde fnedícíón.

5. Seleccionar las variables a experírnentor 'Ysus niveles.

Page 12: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 12/19

Diseño y análisis de experimentos 113

Una de las maneras de comparar procesos o grupos, a través de la compa-

ración de sus medias, es usar una técnica llamada

análisis de varian za

(Anova) desarrollada pór R.A. Fisher a principios de los años' 20. Esta técni-

ca consiste en descomponer

  1 0

variación total' de los datos en a) la variación

interna o

natural

(referencia) de los grupos, y

b

la variación entre grupos de ~

medias, para, al comparar esos dos tipos de variación, decidir si existe dile- V

rencia o no entre los medias que se están analizando.

6.

Determinar el tipo de diseño-o usar y el número de réplicas.

7. Realizar. las pruebas aleatoriamente.

8.

Analizar los resultados.

é

9.

Conclusiones' (fóctores que afectan a la media, factores que pfec-

tan a la dispersión, y en qué nivel deben' estar para céntrar el proce-

so en él objetivo y redúci'r s U ' variación).

r ,1' 

• l~ l 

Losfactores o variables son dimensiones rnedibles en una escala continua.

Porejemplo volta¡e  presión   temperatura   diámetro  peso   etc. Losnivelesde una

variable son los valores en los cuales se experimentará con ésta. Por ejemplo

experimentar con 110 volts como volto]e de entrada de un circuito eléctrico,

poner la temperatura del horno en 150 grados, etc .. Sin embargo también

pueden existir variables cualitativas como turno, proveedor, operador, etcétera.

A n á l i s is d e v ar i an za

(Anova)

A n o v a d e u n f ac t o r f i j o

-

En el Anovo de un factor fijo, se desea investigar el efecto que los diferentes

niveles de ese factor tienen can respecto a la media de la respuesta (variable

de respuesta o variable de salida).

Eiemplo 4.6

Se desea' comparar tres procesos desde el punto de vista de la longitud de clavos

de 2 que producen. Se decide tomar una muestra aleatoria de tres clavos por pro-

ceso cuyas longitudes se muestran en la tabla 4.2.

,

 n.

Jió

' I ' , ' + ; : ¡ ¡

 Í

e

  P r o c e s O

: ,,'.1 ' ~

L

.J

2

~

 ,

,

l sf,

A

2.05 2.03 2.02

2.033333 0.0002333

B'

1.98 1.99

2.00 ••~

00סס99.'1 0.0001000

,

'C

2.07 2.05 2.05 '2.056667

0.0001333

y = 2.0267

- 1

TablaA.2. D ato s d e tre s p ro ce so s p ara fa brica r cla vo s d e 2 p ulg ad as

Page 13: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 13/19

114 Determinar las variables significativas

6

la figura 4.6 muestra una representación gráfica de las medias de los diferentes

procesos para fabricar clavos, además de incluir la media general. También ilustra

gráficamente por qué si se desean comparar medias, el Anova lo hace a través de

comparar variaciones: mientras más variación exista entre las medias; éstas no se-

rán muy semejantes; mientras más parecidas sean. éstas, su variación será menor .

.Es decir, se puede hablar de la semejanza o diferencia de un grupo de datos, en

función de su variación. De aquí por qué analizar la variación equivale a comparar

valores o comparar medias si dichos valores lo son. •

o

I

v

*

O

I I

O

I

1.99

2.033

2.057

Mayor variación  menor semejanza

O * O O

I I I

Menor variación mayor semejanza

- - 1

Figura 4.6. Representación gráfica de las medias de los tres procesos

La

varianza

de un grupo de datos se define como una desviación promedio de

los valores con respecto a su media, con base en unidades cuadradas. Esdecir,

qué tanto se alejan o se acercan los datos a su media (en promedio]:

I,(x¡ - xl

2

(12

=

n - 1

SS Suma de cuadrados

= 91 = Grados de libertad

Lasunidades originales quedan al cuadrado por el factor SS=I,(x¡ - x1

2

: que

es una medida de variación. Al dividir entre n-1 se'obtiene una medida de

variación promedio. Es n yno n-1 para obtener un estimador

insesgado

de la varianza de la población. Esdecir,

(

r,(X-XP I (n-1)

E 'n) = -n-

(12

mientras que

El numerador (SSItiene n-1

grados de libertad

porque la suma de las desvia-

ciones de los datos con respecto a su media es cero. Esto significa que co-

nociendo cualesquiera n-1 desviaciones, se puede conocer la restante. Es

decir, se tiene la libertad  de tener n- 1 desviaciones independientes. Una de-

finición formal de grados de libertad es el número de observaciones toma-

das en exceso para estimar un porámetro (lipson y Sheth, 19731, o  el número

de variables menos el número de relaciones lineales [reslricciones] entre ellas 

(Bowker y lieberman, 19721.

La variación se descompone en los siguientes elementos:

~~ ~ 

Page 14: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 14/19

Diseño y análisis de experimentos 115

1. SST= Variación total.

2.

SSt=Variación entre grupos (tratamientos o niveles de un factor).

3. SSE=Variación natural (error). Referencia.

(Variación interna o natural' = variación aleatorio + error

de

me-

dición).

La variación total se puede descomponer en sus elementos básicos:

I SST = SSt + SSE

I

La figura 4.7 muestra las fuentes de variación para el ejemplo 4.6.

Variación

total

Proceso A

Suma~

Media

(Tratamientos, grupos o niveles)

Proceso B

Proceso

e

Variación entre grupos

- 1

Figura 4.7. Fuentes de varia ción

La figura 4.8 presenta los datos de manera gráfica. Siempre es útil graficar los

datos para tener una referencia visual que pueda relacionarse con los resul-

tados numéricos del Anova.

Procesa A Proceso B Procesa e

2.07

2.06

2.0,5

2.04

2.03

~ ~~~ ~ ~~ ~

2.02

2.01

2.00

1.99

1.98

o

o

-/ F igura 4.8. Representación gráfica de los datos

Page 15: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 15/19

116 Determinar las variables significativas

6

A simple vista se observa la variación que existe entre las medias de los proce-

sos, que pudiera o no ser significativa, con base en la referencia que el Anova

provee, además de apreciar la variación interna de cada proceso. Aunque

ésta no es la manera de trabajar del Anova, es una manera sencilla de ilustrar-

lo: la variación interna (referencia) tie'ne un rango (el valor mayor menos el

valor menor), R(interna)=0.030 y la variación en tre grupos un valor, R(gru-

pos)=0.067. Al comparar las dos variaciones se nota que la variación entre

los procesos es un poco más del doble que la referencia. ¿Esesta diferencia

significativa para considerar que los procesos son di,fere.r1tes?El Anova lo

responderá más adelante.

\

E lab o r ac i ó n d el A n o v a d e u n f ac t o r f i j o

El cólculo.de sumas de cuadrados y grados de libertad se realiza de la si-

guiente rncnero:

. y2 (Suma total)2

SST = LLY¡f -

N

L(~ada dato)2 - N

Ly2 y2 L(Cada suma de grupo)2

SSt = ni - N n

SSE = SST - SSt

N

=

número totol de dotos.

n

=

número de dotos por grupo

(r ép lí cos] .

O

=

número de niveles del foctor

(trotomientos o gruposl.

gl(SST) = N - 1

gl(SSt) = a - 1

gl(SSE) = gI(SST) - gl(SSt) = N - a

~,

(Suma total)2

SST = L(Cada dato)2 - N

(Suma total)2

N

-,

(18.24)2

= (2.05)2

+

(2.03)2

+ ... +

(2.05)2 - 9 = 0.0078 ,

L(Cada suma de grupo)2

SSt = n

(Suma totol)2

N

(6.1)2 + (5.97)2 + (6.17)2

3

(18.24)2 = 0.006867

9J

1~~' ----

Page 16: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 16/19

Diseño

y

análisis

de

experimentes

117

Otra manera de obtener los mismos resultados es:

SST

=

sf(N -

11

=

0.000975(9 - 11

=

0.0078

donde sf es la varianza del

total

de los datos.

SSt

=

sf(N - n I

= 0.00114~(9 - 31= 0.006867 .

donde sf es la varianza de los grupos tomadas sus medios

como datos. '

SSE = L S f   n -

11

=

0.000466(3 - 11

=

0.000933

donde sf es la voricnzo del grupo i, (i = 1..0 1 .

Lo anterior se resume en la tabla

4.3.

Fuente.-.~

vario ci6n

  55

el

MS

F

Tratamientos(tl

SSt

a-1

MSt=SSt/a-1 MSt/MSE

rl

~

Error. (E)

l

.'

SSE

N-a

MSE=SSE/N-a

 por diferencial

Total

SST

N-l

 

MS = Medida de variación promedio

F = Comparación entre variación interna [error]

y

la variación entre grupos (tratomientosl

- 1

Tabla 4.3. Resumen del Anova

La tabla 4.4 muestra el Anova para el ejemplo 4.6.

, 1

Fuente de variación

55

 

MS·

,

F

Tratamientos(tl

-

0.006867 0.003434 22.08

,

I

Error (El

10.000933

6

..

0.000156

 por diferencia

.~

Total

0.00780

8

~ Tabla 4.4. Anov: del ejemplo 4.6

Page 17: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 17/19

118 Determinar las variables ~ignificativas

6

Una recomendación para determinar el número de réplicas (n), es que los grados

de libertad del error sean de por lo menos 20 o 25 (Montgomery, 1991 a).

De acuerdo con esta recomendación, N=a+25, de donde n=N/a, siendo   0 

el número de niveles del factor A. Para este ejemplo, considerando un mínimo

de 25 grados de

líbertcd

en el error se tiene N ;3+25, n=28/3, redondea-

do hacia arriba es 10.

R egión de rechazo (RR )de H o

y

decisión

El Anova es una prueba de hipótesis de dos o más medias en donde Ho:

/Ll =/L2=···=/Lo=/L contra Ha: al menos una de las medias es diferente a

las demás.

El estadístico de prueba (EP)es F=MSt/MSE.

Para decidir si los procesos son iguales o no (no rechazar o rechazar

Ho], se competo el valor F del Anovo con el valor de referencia de la tabla

F. Lo anterior se presenta gráficamente en la figura 4.9.

F(tablas)=F

a.gl(t).gl (E)

= FO.05.2.6=

5.14

Decisión:

Como

22.08

es mayar que 5.14,

se

rechaza

la igualdad de

'105

medies-de los procesos. Es decir,

la variable

proceso

afecta la

longitud medio de los clavos.,

5.14 ~ 22.08

- 1 F igura 4 .9. Región de re chazo -

Eiercicio 4 3

0,., •

En un proceso de fabricación de vidrio, se deseo saber si la temperatura afecta la

densidad del vidrio. Se realizaron pruebas y se obtuvieron los resultados mostra-

dos en la tabla 4.5 (Escalante, 1992).

Temperatura

Densidad

J

-

4   5 7   8

6 ]

-2

;

3   8 5   6

9.1

r •

3 7 6 4   6

7   6  

4

,

3   5 3   5 4   8

I

- 1 T ab la 4.5 . Info rm ació n p ara el eje rcicio 4.3

SST = I(Cada dato)2 _ (Suma~otal)2

.

. , .

~~

Page 18: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 18/19

Diseño

y

análisis de experimentos

119

I.(Cada suma de grupo)2

SSt = n

~ (Suma total)2

N

= ~_ ~c   _ _ ~ 

Tabla Anava

F

••••••••• variación

55 al

M5

Tratamientos(tl

Error (El

 p or diferencial

Total

F tablas)=F a,gllt):gIIE) = F O .05, , =

_egión de rechazo de la igualdad

de la media de los procesos.

la variable afecta a la respuesta.

~

r

~'c;

FO .05,  

Conclusión __ ---:- -,--___________ •

P r u eb as d e c o m p ar ac i ó n d e m ed ias

A continuación se ilustran los procedimientos para comparar medias en parejas.

Prueba de Duncan Móntgomery, 1991 b). Una vez que de acuerdo

con el Anova se rechazó la igualdad de los procesos, la prueba de Dun-

can analiza la diferencia de las medias de los procesos por medio de

la obtención de. los rangos Rp

R   f ) S

- = ~ MSE

p = r ( X p . Sy ¡ Y ¡ n

a = nivel de significación de la prueba.

p

=

2 .....

0

(número dé tratamientos).

f = gl (error)

ra(p, f) se encuentra en la tabla de Duncan (apéndice)

Para el ejemplo 4.6 se tiene

Y A = 2.033 YB= 1.990

MSE = 0.000156 n = 3

y e

= 2.056

a = 5 p = 2, 3 f =

gl(E )

=

6

I

Page 19: Muestreo y Doe Escalante2

8/16/2019 Muestreo y Doe Escalante2

http://slidepdf.com/reader/full/muestreo-y-doe-escalante2 19/19

120

Determinar las variables significativas

6

s.:

=

~MSE

=

10.00~156

=

0.00721

Y ¡

n

- V

R

2

= roos  2 , 6)s y;= (3.46)(0.00721) = 0.02495

R 3 = ro.os  3 , 6)sy¡ =  3 .58 0 .O p721 = 0.02581

la información resultante se coloca en una tabla para poder comparar las

diferencias y saber qué grupos de medias son iguales entre sí (tabla..4.6). '

Grupos

G

u

B Rp (mayor a' menor]

B

0.02581

p

A

0.02495

o

e

En lo tabla se anoton los diferencias entre pares de medios: mayor-menor.

Grupos iguales: B

lA e l

- 1 Tabla 4.6. Comparación de ~edias

Como 0.066 es mayor que 0.02581 y 0.043 es mayor que 0.02495, se con-

cluye que las medias de los procesos A y 8 son diferentes, y que las medias

de los procesos 8 y C también son diferentes. Como 0.023 no es mayor que

0.02495, las medias de los procesos A y

e

se consideroneslodisñcornente

iguales.

la figura 4.10 es una

gráfi de respuest

parecida a la figura 4.8.

Cada punto representa la media de cada proceso y se incluye también su'

2.06

2.05

2.04

i 2.03

E 2,02

] 2.01

í~:~

1.98

Yl = 2.033

S I =

0,01527

 

Y 3 =

2.056

S3 =

0.01155

.................................. Objetivo

Y 2 =

1.990

S2 =

0.01000

A B

e Proceso

Noto: los desviaciones estándar no están a escalo con respecto a la longitud media.

- 1

Figura 4.10. Gráfica de respuesta del ejemplo 4.6