Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-1
Capítulo 11
Análise da Variância
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-2
Objetivos do Aprendizado
Neste capítulo você aprenderá:
Os conceitos básicos da modelagem do experimento
A utilizar a análise de variância de fator único para testar diferenças entre as médias aritméticas de diversos grupos
A utilizar a análise da variância de dois fatores e interpretar o efeito da interação
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-3
Visão Geral do Capítulo
Análise da Variância (ANOVA)
Teste F
Teste
Tukey-
Kramer
ANOVA
Fator Único
ANOVA
Dois Fatores
Efeitos da
Interação
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-4
ANOVA – Descrição Geral
O pesquisador controla um ou mais fatores de interesse
Cada fator contém dois ou mais níveis
Os níveis podem ser numéricos ou categóricos
Diferentes níveis produzem diferentes grupos
Pense nos grupos como populações
Observe os efeitos na variável dependente
Os grupos são iguais?
Planejamento do experimento: o plano usado para coletar os dados
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-5
Planejamento Completamente
Aleatorizado
As unidades ou objetos do experimento são designadas aleatoriamente para os diferentes grupos
Assume-se que os objetos são homogêneos
Somente um fator ou variável independente
Com dois ou mais níveis (grupos)
Abordagem através da análise da variância com um fator (ANOVA de um fator)
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-6
Análise da Variância de Fator
Único
Avaliar a diferença entre as médias de três ou mais grupos
Exemplos: Taxas de acidentes para o 1o. , 2o. e 3o.
turnos de uma fábrica
Milhagem esperada para cinco diferentes tipos
de pneus
Premissas
Populações são normalmente distribuídas
Populações têm variâncias iguais
Amostras extraídas de forma aleatória e independente
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-7
Hipótese: ANOVA de fator único
As populações têm médias iguais
i.e., não há efeito de tratamento (não há variações entre as médias dos grupos)
Pelo menos uma população tem média diferente das demais
i.e., há um efeito de tratamento (grupos)
Não significa que todas as médias são diferentes entre si (pelo menos uma das médias é diferente das demais)
c3210 μμμμ:H
iguais são aispopulacion médias as todasNem:1H
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-8
Hipótese: ANOVA de fator
único
Todas as médias são iguais:
A hipótese nula é verdadeira
(Não há efeito do grupo)
c3210 μμμμ:H
iguais são μ todasNem:H j1
321 μμμ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-9
Hipótese: ANOVA de fator
único
Pelo menos uma média é diferente:
A hipótese nula NÃO é verdadeira
(há efeito de tratamento)
c3210 μμμμ:H
321 μμμ 321 μμμ
or
iguais são μ todasNem:H j1
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-10
Dividindo a Variação
A variação total pode ser dividida em duas partes:
STQ = Soma total dos quadrados
(Variação Total)
SQE = Soma dos quadrados entre grupos
(Variação entre grupos)
SQD = Soma dos quadrados dentro dos grupos
(Variação dentro dos grupos)
STQ = SQE + SQD
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-11
Dividindo a Variação
Variação Total = mede a dispersão de cada dado individual em
torno da grande média. A grande média é a média aritmética de
todos os valores em todos os grupos combinados. (STQ)
Variação dentro dos grupos = dispersão existente dentro de cada
grupo. Baseada nas diferença entre cada observação e a média
do seu grupo. (SQD)
Variação entre grupos = mede a dispersão entre os grupos.
Baseada nas diferenças entre as médias de cada grupo e a
grande média. (SQE)
STQ = SQE + SQD
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-12
Dividindo a Variação
Variação entre
grupos (SQE)
Variação dentro dos grupos
(SQD)
Variação Total (STQ)
= +
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-13
Tabela ANOVA de um fator
Fonte da
Variação
g.l. Soma dos
Quadrados
Média dos
Quadrados
(Variância)
F
Entre
Grupos
c-1 SQE MQE
Dentro dos
Grupos
n-c SQD MQD
Total n-1 STQ = SQE
+ SQD
c = número de grupos
n = soma dos tamanhos de amostra de todos os grupos
gl = graus de liberdade
MQD
MQEF
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-14
A soma total dos quadrados
c
j
n
i
ij
j
XXSTQ1 1
2)(
Where:
STQ = Soma total dos quadrados
c = número de grupos
nj = número de valores no grupo j
Xij = iésimo valor do grupo j
X = grande média (média de todos os valores)
STQ = SQE + SQD
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-15
A soma total dos quadrados
22
12
2
11 )(...)()( XXXXXXSTQ nc
c
j
n
i
ij
j
XXSTQ1 1
2)(
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-16
Variação dentro dos grupos
Onde:
SQD = Soma dos quadrados dentro dos grupos
c = número de grupos
nj = número de valores no grupo j
Xj = média aritmética da amostra do grupo j
Xij = iésimo valor no grupo j
2
11
)(j
j
XXSQD ij
n
i
c
j
STQ = SQE + SQD
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-17
Variação dentro dos grupos
22
21
2
11 )(...)()(11 c
XXXXXXSQD nc
2
11
)( jij
n
i
c
j
XXSQDj
j
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-18
Variação entre grupos
Onde:
SQE = Soma dos quadrados entre grupos
c = número de grupos
nj = número de observações no grupo j
Xj = média aritmética da amostra do grupo j
X = grande média (média de todos os valores)
2
1
)( XXnSQEj
c
j
j
STQ = SQE + SQD
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-19
Variação entre grupos
2j
c
1j
j )XX(nSQE
2cc
222
211 )XX(n...)XX(n)XX(nSQE
µ1 µ2 µc
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-20
Médias dos Quadrados
cn
SQDMQD
1
c
SQEMQE
1
n
STQMTQ
Média dos quadrados entre grupos
Média dos quadrados dentro dos
grupos
Média total dos quadrados
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-21
Tabela ANOVA de um fator
Fonte da
Variação
g.l. Soma dos
Quadrados
Média dos
Quadrados
(Variância)
F
Entre
Grupos
c-1 SQE MQE
Dentro dos
Grupos
n-c SQD MQD
Total n-1 STQ = SQE
+ SQD
c = número de grupos
n = soma dos tamanhos de amostra de todos os grupos
gl = graus de liberdade
MQD
MQEF
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-22
ANOVA de um fator
Teste Estatístico
Estatística de teste:
MQE média dos quadrados entre grupos
MQD média dos quadrados dentro dos grupos
Graus de liberdade
gl1 = c – 1 (c = numero de grupos)
gl2 = n – c (n = soma de todos os tamanhos de amostras)
MQD
MQEF
H0: μ1= μ2 = … = μc
H1: Pelo menos duas populações têm médias diferentes
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-23
ANOVA de um fator
Teste Estatístico A estatística F é a razão entre as variações entre e dentro
dos grupos
A razão será sempre positiva
gl1 = c -1 será em geral pequeno
gl2 = n - c será em geral grande
Decisão:
Rejeita H0 se F > FS, senão não rejeita H0
0
= .05
Rejeita H0Nãorejeita H0 FS
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-24
ANOVA de um fator
Exemplo
Clube 1 Clube 2 Clube 3
254 234 200
263 218 222
241 235 197
237 227 206
251 216 204
Você quer verificar se três
diferentes clubes de golfe têm
circuitos com diferentes
distâncias. Você aleatoriamente
escolhe cinco medidas de
jogadas em carrinhos
automatizados para cada clube.
A um nível de significância de
5%, há diferenças entre as
distâncias?
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-25
ANOVA de um fator
Exemplo
227.0 x
205.8 x 226.0x 249.2x 321
••••
•
270
260
250
240
230
220
210
200
190
••
•••
•••••
Distância
1X
2X
3X
X
Clube1 2 3
Clube 1 Clube 2 Clube 3
254 234 200
263 218 222
241 235 197
237 227 206
251 216 204
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-26
ANOVA de um fator
Exemplo
X1 = 249.2
X2 = 226.0
X3 = 205.8
X = 227.0
n1 = 5
n2 = 5
n3 = 5
n = 15
c = 3
SQE = 5 (249.2 – 227)2 + 5 (226 – 227)2 + 5 (205.8 – 227)2 = 4716.4
SQD = (254 – 249.2)2 + (263 – 249.2)2 +…+ (204 – 205.8)2 = 1119.6
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-27
ANOVA de um fator
Exemplo
MQE = 4716.4 / (3-1) = 2358.2
MQD = 1119.6 / (15-3) = 93.325.275
93.3
2358.2F
F = 25.2750
= .05
FS = 3.89
Rejeita H0Não
rejeita H0
Valor
Crítico:
FS = 3.89
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-28
ANOVA de um fator
Exemplo
H0: μ1 = μ2 = μ3
H1: μj não são todas iguais
= .05
gl1= 2 gl2 = 12
Decisão:
Rejeita H0 a α = 0.05
Conclusão: Há evidências
de que pelo menos uma μj
seja diferente das demais.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-29
ANOVA de um fator no Excel
EXCEL: Selecione: Ferramentas => Análise de dados => ANOVA: fator único
Anova: fator único
RESUMO
Grupo Contagem Soma Média Variância
Clube 1 5 1246 249,2 108,2
Clube 2 5 1130 226 77,5
Clube 3 5 1029 205,8 94,2
ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 4716,4 2 2358,2 25,27545552 4,98524E-05 3,885290312
Dentro dos grupos 1119,6 12 93,3
Total 5836 14
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-30
O Procedimento de Tukey-
Kramer
Mostra que população tem média significativamente diferente
ex.: μ1 = μ2 ≠ μ3
Feito após a rejeição da hipótese de igualdade de médias através da ANOVA
Permite múltiplas comparações
Compara diferenças em valor absoluto com intervalo crítico
xμ1 = μ 2
μ3
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-31
Intervalo Críticio para o
Procedimento deTukey-Kramer
Onde:
QS = Valor crítico da cauda superior, a partir da distribuição
de intervalos de Student, com c g.l. no numerador e n - c g.l. no
denominador para determinado nível de (ver tabela E.9)
MQD = Média dos Quadrados dentro dos Grupos
nj e nj’ = Tamanho das amsotras para os grupos j e j’
j'j n
1
n
1
2
MQDCritico Intervalo SQ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-32
O Procedimento de Tukey-
Kramer1. Calcule as diferenças de médias
em valores absolutos:Clube 1 Clube 2 Clube 3
254 234 200
263 218 222
241 235 197
237 227 206
251 216 20420.2205.8226.0xx
43.4205.8249.2xx
23.2226.0249.2xx
32
31
21
2. Encontre QS na Tabela E.9 com c = 3 e (n – c) = (15 – 3) =
12 graus de liberdade para o nível desejado de ( = .05
neste exemplo):
3.77Q S
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-33
O Procedimento de Tukey-
Kramer
5. Todos os valores absolutos das diferenças são maiores que o intervalo crítico. Portanto há uma diferença significativa entre cada par de médias a um nível de significância de 5%.
16.2855
1
5
1
2
93.33.77
n
1
n
1
2
MQDQI
j'j
S
Críticontervalo
3. Calcule o intervalo crítico:
20.2xx43.4xx23.2xx 323121 4. Compare:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-34
Premissas ANOVA
Aleatoriedade e Independência Selecione amostras aleatórias a partir das c populações ou
designe aleatoriamente os itens aos c níveis do fator
Normalidade As amostras são extraídas de populações distribuídas nos
moldes da distribuição normal
Se violado, use teste não-paramétrico de Kruskal Wallis (Capítulo 12)
Homogeneidade das Variancias O teste F é pouco afetado se as amostras são de mesmo
tamanho, se os tamanhos forem diferentes o teste é prejudicado
Essa premissa pode ser verificada pelo Teste de Levene
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-35
Premissas ANOVA
Teste de Levene
Testa a premissa de homogeneidade de variâncias.
Primeiro, defina as hipóteses nula e alternativa:
H0: σ2
1 = σ22 = …=σ2
c
H1: Nem todas as σ2j são iguais
Segundo, calcule os valores absolutos das diferenças
entre cada um dos valores e a mediana de seu grupo.
Terceiro, faça um teste ANOVA de um fator para
esses valores absolutos de diferenças.
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-36
ANOVA de dois fatores
Examina os efeitos de:
Dois fatores de interesse na variável dependente
ex., efeito de diferentes lançadores e combustíveis no alcance de mísseis
Interação entre os diferentes níveis desses dois fatores
ex., é possível que determinado lançador tenha desempenho melhor com determinado tipo de combustível?
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-37
ANOVA de dois fatores
Premissas
Populações são normalmente distribuídas
Populações têm iguais variâncias
Amostras independentes extraídas de forma aleatória
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-38
ANOVA de dois fatores
Fontes de Variação
Dois fatores de interesse: A e B
r = número de níveis do fator A
c = número de níveis do fator B
n’ = número de réplicas (valores) em cada célula
n = número de valores em todo o experimento (n = rcn’)
Xijk = valor da k-ésima observação para o nível i do fator A e o nível j do fator B
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-39
ANOVA de dois fatores
Fontes de Variação
STQ
Variação Total
SQAVariação do Fator A
SQBVariação do Fator B
SQABVariação decorrente da
interação entre A e B
SQRVariação Aleatória (Erro)
Graus de
liberdade:
r – 1
c – 1
(r – 1)(c – 1)
rc(n’ – 1)
n - 1
STQ = SQA + SQB + SQAB + SQR
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-40
ANOVA de dois fatores
Equações
r
i
c
j
n
k
ijk XXSTQ1 1 1
2)(
2
1
.. )( XXncSQAr
i
i
2
1
.. )( XXnrSQBc
j
j
Variação Total:
Variação do fator A:
Variação do fator B:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-41
ANOVA de dois fatores
Equações
2
1 1
..... )( XXXXnSQABr
i
c
j
jiij
r
i
c
j
n
k
ijijk XXSQR1 1 1
2.)(
Variação decorrente da interação:
Soma dos quadrados do Erros:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-42
ANOVA de dois fatores
Equações
Media Grande1 1 1
nrc
X
X
r
i
c
j
n
k
ijk
r) ..., 2, 1, (iA fator do nível i do Media ésimo1 1..
nc
X
X
c
j
n
k
ijk
i
r = número de níveis do fator A
c = número de níveis do fator B
n/ = número de replicações em cada célula
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-43
ANOVA de dois fatores
Equações
ij celula da Median
XX
n
1k
ijkij.
c) ..., 2, 1, (j Bfator do nível j do Medianr
X
X ésimo
r
1i
n
1k
ijk
.j.
r = número de níveis do fator A
c = número de níveis do fator B
n/ = número de replicações em cada célula
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-44
ANOVA de dois fatores
Equações
1Afator do quadrados dos Media
r
SQAMQA
1Bfator do quadrados dos Media
c
SQBMQB
)1)(1(interação da quadrados dos Media
cr
SQABMQAB
)1'(erros dos quadrados dos Media
nrc
SQRMQR
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-45
ANOVA de dois fatores:
O teste da Estatística F
Teste F para o efeito do fator B:
Teste F para o efeito da interação:
H0: μ1.. = μ2.. = • • • = μr..
H1: Nem todas μi.. são
iguais
H0: a interação entre A e B é igual a
zero
H1: interacão entre A e B não é zero
Teste F para o efeito do fator A:
H0: μ.1. = μ.2. = • • • = μ.c.
H1: Nem todas μ.j. são
iguais
Rejeita H0
se F > FSMQR
MQAF
MQR
MQBF
MQR
MQABF
Rejeita H0
se F > FS
Rejeita H0
se F > FS
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-46
ANOVA de dois fatores:
Tabela Resumo
Fonte de
Variação
Graus de
liberdade
Soma dos
Quadrados
Média dos
Quadrados
(Variância0
F
Fator A r – 1 SQAMQA
= SQA/(r – 1)
MQA/
MQR
Fator B c – 1 SQBMQB
= SQB /(c – 1)
MQB/
MQR
AB
(Interação)(r – 1)(c – 1) SQAB
MQAB
= SQAB / (r – 1)(c –
1)
MQAB/
MQR
Erro rc(n’ – 1) SQRMQE
= SQE/rc(n’ – 1)
Total n – 1 STQ
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-47
ANOVA de dois fatores:
Características
Graus de liberdade podem ser somados
n-1 = rc(n/-1) + (r-1) + (c-1) + (r-1)(c-1)
Total = erro + fator A + fator B + interação
O denominador do teste F é sempre o mesmo mas o
numerador é diferente
A soma dos quadrados também totalizam STQ
STQ = SQR + SQA + SQB + SQAB
Total = erro + fator A + fator B + interação
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-48
ANOVA de dois fatores:
Interação
Sem efeito de interação:
Fator B Nível 1
Fator B Nível 3
Fator B Nível 2
Fator A Níveis
Fator B Nível 1
Fator B Nível 3
Fator B Nível 2
Fator A Níveis
Média
R
esposta
s
Média
Resposta
s
Efeito interação presente:
Statistics for Managers Using Microsoft Excel, 5e © 2008 Prentice-Hall, Inc. Chap 11-49
Resumo do Capítulo
Descrição da análise de variância de um fator
A lógica da ANOVA
Premissas da ANOVA
Teste F para a diferença nas c médias
O Procedimento de Tukey-Kramer para comparações
múltiplas
Descrição da análise de variância de dois fatores
Exame dos efeitos de múltiplos fatores
Exame dos efeitos de interação ente fatores
Neste capítulo, nós vimos: