89
Mestrado Profissional em Administração Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Mestrado Profissional em Administração - hedibert.orghedibert.org/wp-content/uploads/2015/03/AnaliseMultivariada-aula10.pdfIntrodução É um procedimento gráfico para representar

Embed Size (px)

Citation preview

Mestrado Profissional em Administração

Disciplina: Análise Multivariada

Professor: Hedibert Freitas Lopes

1º trimestre de 2015

2

Análise de Correspondência

MANLY, Cap. 10 HAIR et al., Cap. 8 Talbot & Talbot (2005) Correspondence Analysis and Data Coding with Java and R. Greenacre (2007) Correspondence Analysis in Practice, Second Edition.

3

Introdução

É um procedimento gráfico para representar associação em tabelas de contingência.

Obje t i vo : o b te r u m g r á f i c o ( g e r a l m e n te bidimensional) que represente a relação de dependência entre linhas e colunas da tabela.

Exemplo: ! Pesquisa de marketing em que foram entrevistados

1320 consumidores de aparelhos de som, perguntando-se qual a marca adquirida e qual a principal razão para a escolha de tal marca.

4

Exemplo: Marcas de Som

Atributo Qualidade

de som Tecnologia Avançada

Potência do som

Recursos Técnicos Preço

Confiança na Marca

Total

Marca Sony 135 140 95 55 40 60 525 Aiwa 50 115 40 60 5 15 285 Gradiente 90 55 20 35 40 10 250 Philips 60 25 35 10 5 30 165 Sharp 30 20 5 10 10 20 95 Total 365 355 195 170 100 135 1320

•  Interesse: estudar associação entre a marca e a razão da escolha dela pelo consumidor.

•  Forma de medir o grau de associação entre as variáveis: estatística qui-quadrado de Pearson.

•  No exemplo, Χ2 = 179,62 e o p-valor é <0,001.

5

Notação Genericamente,

Seja X = [xij], E=[eij], eij = xi.x.j/x.., i=1,2,...,m e j=1,2,...,n. A análise de correspondência utiliza a distância de qui-quadrado

para obter a melhor representação gráfica (proporcional à distância euclidiana ponderada).

Variável 2 Categ. 1 Categ. 2 ... Categ. j ... Categ. n

Total

Variável 1

Categ. 1 x11 x12 . . . x1j . . . x1n x1.

Categ. 2 x21 x21 . . . x21 . . . x21 x2. : : : : : : Categ. i xi1 xi2 . . . xij . . . xin xi. : : : : : : Categ. m xm1 xm2 . . . xmj . . . xmn xm. Total x.1 x.2 . . . x.j . . . x.m x..

6

Os perfis das linhas definem m pontos no espaço euclidiano n-dimensional.

AtributoQualidade

de somTecnologiaAvançada

Potênciado som

RecursosTécnicos Preço

Confiançana Marca

Total

Marca Sony 25,71 26,67 18,10 10,48 7,62 11,43 100Aiwa 17,54 40,35 14,04 21,05 1,75 5,26 100

Gradiente 36,00 22,00 8,00 14,00 16,00 4,00 100Philips 36,36 15,15 21,21 6,06 3,03 18,18 100Sharp 31,58 21,05 5,26 10,53 10,53 21,05 100Total 27,65 26,89 14,77 12,88 7,58 10,23 100

Interpretação dos Perfis Linha

7

•  27,65% escolhem a marca em função da qualidade do som e 7,58% escolhem por causa do preço.

•  Com relação aos consumidores que compraram produto da marca Gradiente, 36% o fizeram devido à qualidade do som e 16% devido ao preço, que são porcentagens um pouco acima de suas respect ivas porcentagens observadas na população em geral.

Interpretação dos Perfis Linha

8

Os perfis das colunas definem n pontos no espaço euclidiano m-dimensional.

Interpretação dos Perfis Coluna

AtributoQualidade

de somTecnologiaAvançada

Potênciado som

RecursosTécnicos Preço

Confiançana Marca

Total

Marca Sony 36,99 39,44 48,72 32,35 40,00 44,44 39,77Aiwa 13,70 32,39 20,51 35,29 5,00 11,11 21,59

Gradiente 24,66 15,49 10,26 20,59 40,00 7,41 18,94Philips 16,44 7,04 17,95 5,88 5,00 22,22 12,50Sharp 8,22 5,63 2,56 5,88 10,00 14,81 7,20Total 100 100 100 100 100 100 100

9

Interpretação dos Perfis Coluna

•  39,77% escolheram a marca Sony e 7,20%, a marca Sharp .

•  Com relação aos consumidores preocupados com o atributo tecnologia avançada, 32,39% escolhem a marca Aiwa, que é maior do que 21,59%, que é a porcentagem observada na população total. Dentro de Recursos técnicos, 35,29% escolheram a marca Aiwa. Esta marca parece estar mais associada a estes 2 atributos.

10

Desenvolvimento Algébrico

Na análise de correspondência, o interesse está na análise dos perfis das linhas e das colunas e não nos valores brutos. O perfil de uma linha é dado pela probabilidade condicional de uma observação pertencer à coluna j dado que ela pertence à linha i. De maneira análoga, o perfil de uma coluna é a probabilidade condicional de uma observação pertencer à linha i dado que ela pertence à coluna em questão.

11

Desenvolvimento Algébrico

Perfis das linhas: verificamos como se distribuem os diferentes atributos para cada marca avaliada.

Perfis das colunas: verificamos como se distribuem as diferentes marcas para cada atributo avaliado.

12

A tabela a seguir apresenta os autovalores e as inércias obtidas:

Autovalor Inércia Principal Porcentagem Porcentagemacumulada

0,26781 0,07172 52,71 52,710,22283 0,04965 36,49 89,200,10228 0,01046 7,69 96,880,06511 0,00424 3,12 100,00

Total 0,13608 100 -

Avaliação da Análise

13

Coordenadas dos pontos determinados pelas linhas e dos pontos determinados pelas colunas da tabela:

Dimensão 1 Dimensão 2Pontos Linhas Sony 0,0320 -0,0804

Aiwa -0,4703 -0,0326Gradiente 0,1386 0,4188Philips 0,3286 -0,3301Sharp 0,2989 0,0131

Pontos Colunas Qualidade do som 0,2246 0,0713Tecnologia avançada -0,2924 0,0006Potência do som -0,0002 -0,2773Recurso técnico -0,3368 0,1350Preço 0,3399 0,5320Confiança na marca 0,3342 -0,3578

Construção do Gráfico

14 Dimension 1 (52.7%)

Dim

ensi

on 2

(36.

5%)

-0.6 -0.4 -0.2 0.0 0.2 0.4

-0.2

0.0

0.2

0.4

Sony

Aiwa

Gradient

Philips

Sharp

Qualidade do Som

Tecnologia Avancada

Potencia do Som

Recursos Tecnicos

Preco

Confianca na Marca

15

install.packages("ca") library(ca) data=matrix(c(135,140,95,55,40,60,50,115,40,60,5,15,90,55,20,35, 40,10,60,25,35,10,5,30,30,20,5,10,10,20),ncol=6,byrow=TRUE) data = data.frame(data) names(data) <- c("Qualidade do Som","Tecnologia Avancada", "Potencia do Som","Recursos Tecnicos","Preco","Confianca na Marca") rownames(data) <- c("Sony","Aiwa","Gradient","Philips","Sharp") CA = ca(data) summary(CA) plot(CA)

Leitura complementar Murtagh (2005) Correspondence Analysis and Data Coding with Java and R. Chapman&Hall/CRC. Greenacre (2007) Correspondence Analysis in Practice (2nd Ed). Chapman&Hall/CRC. Greenacre (2007) Constructing maps of data using correspondence analysis.http://statmath.wu.ac.at/courses/CAandRelMeth/greenacreCA.pdf

17

Escalonamento Multidimensional

MANLY, Cap. 11. HAIR et al., Cap. 10. Everitt &Hothorn (2011) An Introduction to Applied Multivariate Analysis with R - Cap. 4. Izenman (2008) Modern Multivariate Statistical Techniques: Regression, Classification,and Manifold Learning, Cap 13.

18

Objetivo A partir de uma matriz de similaridade (ou de

dissimilaridade) entre objetos (marcas, por

exemplo) criar variáveis (dimensões/ fatores)

q u e e x p l i q u e m a s s e m e l h a n ç a s

(dessemelhanças) expressas nessa matriz.

Os objetos são denominados estímulos.

Posicionamento de marcas.

•  TABLE 13.1. Some application areas and research topics in MDS.

•  Psychology: Study the underlying structure of perceptions of different classes

•  of psychological stimuli (e.g., personality traits, gender roles) or physical

•  stimuli (e.g., human faces, everyday sounds, fragrances, colors) and create

•  a “perceptual map” of those stimuli. Understand the psychological dimensions

•  hidden in the data so that we can describe how proximity judgments

•  are generated. •  Marketing: Derive “product maps” of

consumer choice and product preference •  (e.g., automobiles, beer) so that

relationships between products can be discerned.

•  Use these maps to position new products appropriately, to modify

•  an existing product image to emphasize brand differentiation, or to design

•  future experiments to determine what type of consumer can best discriminate

•  between similar products and on which dimensions.

•  Ecology: Provide “environmental impact maps” of pollution (e.g., oil spills,

•  sewage pollution, drilling-mud dispersal) on local communities of animals,

•  marine species, and insects. Use such maps to develop a biological taxonomy

•  to classify populations using morphometric or genetic data or from

•  evolutionary theory. •  Molecular Biology: Reconstruct the spatial

structures of molecules (e.g., •  amino acids) using biomolecular

conformation (3D structure). Interpret •  their interrelations, similarities, and

differences. Construct a 3D “protein •  map” as a global view of the protein

structure universe. •  Computational Chemistry: Use a measure

of molecular similarity (e.g., interatomic •  distance) to characterize the behavior and

function of molecules •  derived from large collections of

compounds. •  Social Networks: Develop “telephone-call

graphs,” where the vertices are telephone •  numbers and the edges correspond to

calls between them. Recognize •  instances of credit card fraud and network

intrusion detection. Identify •  clusters in large scientific collaboration

networks. •  Graph Layout: Design a diagram to

describe a network and the system it represents

•  using a graph-theoretic distance (e.g., minimum-path length) between

•  pairs of nodes or vertices. Examples include communications networks,

•  electrical circuit diagrams, wiring diagrams, and protein-protein interaction

•  graphs. Create graphic visualizations of digital image libraries, with

•  images as vertices and proximities (e.g., perceptual differences) between

•  pairs of images as edge weights. •  Music: Use a measure of musical sound

quality (e.g., a set of spectral components •  with high resolution at low frequencies to

mimic the human auditory •  system) as input to a nonlinear distance

measure to assess the similarities •  and differences between a variety of

songs.

20

Um exemplo prático O objetivo de uma pesquisa é avaliar a

semelhança ou não semelhança existente entre seis marcas de automóveis:

PEUGEOT RENAULT CITROËN TOYOTA HONDA FIAT

Podemos fazer isso, por exemplo, baseando na opinião de um grupo de especialistas que ordenam (classificam) os pares de marcas de automóveis dos mais semelhantes até os menos semelhantes.

21

Um exemplo prático

01 TOYOTA HONDA 09 CITROËN TOYOTA

02 RENAULT PEUGEOT 10 CITROËN HONDA

03 HONDA PEUGEOT 11 CITROËN FIAT

04 TOYOTA PEUGEOT 12 CITROËN RENAULT

05 HONDA RENAULT 13 CITROËN PEUGEOT

06 RENAULT TOYOTA 14 FIAT TOYOTA

07 RENAULT FIAT 15 FIAT HONDA

08 PEUGEOT FIAT

Resultado: par mais semelhante (1) até o par menos semelhante (15)

22

Um exemplo prático

saida$points[, 1]

said

a$po

ints

[, 2]

-8 -6 -4 -2 0 2 4 6

-4-2

02

46

8

PeugeotRenault

Citroen

Toyota

HondaFiat

23

Objetivo Representar graficamente (se possível) como objetos

(estímulos) são semelhantes ou dissemelhantes entre si de acordo com as suas posições tomadas nesse gráfico.

A contribuição do EMD é, basicamente, permitir ao pesquisador e ao tomador de decisões a possibilidade de avaliar relativamente, por meio de mapas de percepção, a relação e a interação entre objetos ou estímulos, em função de medidas de distancia (dissimilaridade) ou similaridade entre objetos (Fonte: Fávero et al. 2009).

Some application areas and research topics in MDS Psychology Study the underlying structure of perceptions of different classes of psychological stimuli (e.g., personality traits, gender roles) or physical stimuli (e.g., human faces, everyday sounds, fragrances, colors) and create a “perceptual map” of those stimuli. Understand the psychological dimensions hidden in the data so that we can describe how proximity judgments are generated. Marketing Derive “product maps” of consumer choice and product preference (e.g., automobiles, beer) so that relationships between products can be discerned. Use these maps to position new products appropriately, to modify an existing product image to emphasize brand differentiation, or to design future experiments to determine what type of consumer can best discriminate between similar products and on which dimensions. Ecology Provide “environmental impact maps” of pollution (e.g., oil spills, sewage pollution, drilling-mud dispersal) on local communities of animals, marine species, and insects. Use such maps to develop a biological taxonomy to classify populations using morphometric or genetic data or from evolutionary theory.

Molecular Biology Reconstruct the spatial structures of molecules (e.g.,amino acids) using biomolecular conformation (3D structure). Interpret their interrelations, similarities, and differences. Construct a 3D “protein map” as a global view of the protein structure universe. Computational Chemistry Use a measure of molecular similarity (e.g., interatomic distance) to characterize the behavior and function of molecules derived from large collections of compounds. Social Networks Develop “telephone-call graphs,” where the vertices are telephone numbers and the edges correspond to calls between them. Recognize instances of credit card fraud and network intrusion detection. Identify clusters in large scientific collaboration networks. Music Use a measure of musical sound quality (e.g., a set of spectral components with high resolution at low frequencies to mimic the human auditory system) as input to a nonlinear distance measure to assess the similarities and differences between a variety of songs.

26

Matriz de Dissimilaridades

PEUGEOT RENAULT CITROËN TOYOTA HONDA FIAT

PEUGEOT 00 02 13 04 03 08

RENAULT 02 00 12 06 05 07

CITROËN 13 12 00 09 10 11

TOYOTA 04 06 09 00 01 14

HONDA 03 05 10 01 00 15

FIAT 08 07 11 14 15 00

Dissimilaridades (distâncias) entres capitais brasileiras

27

SP RJ Manaus Natal Poa Bras Salv RB Cuiabá BH São Paulo 0 348 2689 2322 850 875 1455 2704 1326 490 Rio 348 0 2849 2086 1122 934 1210 2982 1576 340 Manaus 2689 2849 0 2765 3131 1932 2606 1149 1452 2556 Natal 2322 2086 2765 0 3172 1775 876 3617 2524 1832 Porto Aleg. 850 1122 3131 3172 0 1619 2302 2814 1679 1340 Brasília 875 934 1932 1775 1619 0 1060 2247 874 625 Salvador 1455 1210 2606 876 2302 1060 0 3206 1915 965 Rio Branco 2704 2982 1149 3617 2814 2247 3206 0 1414 2786 Cuiabá 1326 1576 1452 2524 1679 874 1915 1414 0 1372 Belo Horiz. 490 340 2556 1832 1340 625 965 2786 1372 0

28

Fonte: IBGE

29

Fonte: IBGE

30

Geração de (dis) similaridades

31

Escalonamento multidimensional métrico

As distâncias ou similaridades representam medidas métricas.

Por exemplo: –  reproduzir um mapa a partir das distâncias

entre municípios. – distancias euclidianas (dissimilaridade) – correlações (similaridade)

32

Geração de (di) similaridades (1) Escalas gráficas

Coca/Pepsi Indistinguíveis Opostos

Coca/Pepsi

Indistinguíveis Opostos Muito

parecidos Muito

diferentes

Nem muito diferentes, nem muito parecidos

33

Geração de (di) similaridades (2) Escala do tipo Likert - Itemizadas Coca/Pepsi Indistinguíveis 1 2 3 4 5 6 7 Opostos

Coca/Pepsi _____

1: indistinguíveis 2: Muito parecidos 3: Parecidos

4: Nem muito parecidos, nem muito diferentes

5: Diferentes 6: Muito diferentes 7: Opostos

34

Escalonamento multidimensional não métrico

As distâncias ou s imi lar idades não representam medidas métricas.

Por exemplo: – Ordenar pares de estímulos (objetos) segundo

a semelhança ou dissemelhança entre cada par de objetos.

35

T o d o s o s e s t í m u l o s s ã o a p r e s e n t a d o s simultaneamente. O entrevistado deve organizá-los em grupos de estímulos semelhantes. Se um par de estímulos pertencer a um mesmo grupo, ele receberá nota um, caso contrário, nota zero.

A similaridade de um par é obtida somando-se as notas recebidas por todos os entrevistados.

Geração de (dis) similaridades Agrupamento:

36

Exemplo: Apresenta os 5 estímulos ao entrevistado. Na opinião dele,

deve agrupar as cervejas segundo semelhança entre elas. Kaiser, Brahma, Antartica, Skol e Bavária.

Entrevistado 1: Skol/Bavária Kaiser, Brahma, Antartica Grupo 1 Grupo 2

Entrevistado 2: Skol/Bavária Brahma, Antartica Kaiser

Grupo 1 Grupo 2 Grupo 3

Entrevistado 3: Skol Bavária / Antartica Brahma/ Kaiser

Grupo 2 Grupo 3 Grupo 1

Geração de (dis) similaridades

37

1 2 31 Kaiser/Skol 0 0 0 0 32 Kaiser/Brahma 1 0 1 2 1… … … … … … …

10 Bavária/Antartica 0 0 1 1 2

Dissimilar.Pares de estímulos

Entrev. Similar.

Geração de (dis) similaridades Medidas de similaridade ou dissimilaridade:

Nota de cada entrevistado: 1 indica que pertence ao mesmo grupo 0 indica que não pertence ao mesmo grupo

38

Os m pares de estímulos são ordenados segundo sua semelhança. Os pares recebem notas de 1 a m, de tal forma que quanto maior a nota mais diferentes são os estímulos do par (medida de dissimilaridade).

Geração de (dis) similaridades Avaliação por postos ou ordenação:

Se n é o número de estímulos, então m=n(n-1)/2.

39

Geração de (dis) similaridades Exemplo: Apresenta todos os pares de estímulos ao entrevistado. Na

opinião dele, deve ordená-los em ordem crescente de dissemelhança entre os pares.

Pares Dissimil. Brahma Antartica 1

Skol Bavaria 2 Kaiser Bavaria 3 Kaiser Skol 4 Kaiser Brahma 5 Kaiser Antartica 6

Brahma Bavaria 7 Antartica Bavaria 8 Brahma Skol 9

Antartica Skol 10

40

Matriz de Dissimilaridades

Antart. BrahmaKaiser Bavária Skol

Antart. 0Brahma 1 0Kaiser 6 5 0Bavária 8 7 3 0Skol 10 9 4 2 0

Geração de (dis)similaridades

41

Escolha das posições (eixos) e Número de dimensões k

42

Exemplo Distâncias entre 4 objetos num plano d(A, B)= 5 d(B,C)=4 d(A,C)=3 d(A,D)= 4 d(B,D)=3 d(C,D)=5

C

A

B

Construção do mapa

A B

C

D

43

Soluções equivalentes Distâncias entre 4 objetos num plano d(A, B)= 5 d(B,C)=4 d(A,C)=3 d(A,D)= 4 d(B,D)=3 d(C,D)=5

A B

C

D

A B

C D

A B

C

D

44

Comentários

Se o número suposto de dimensões não corresponder a real , o método apresentado não poderá ser utilizado p a r a r e p r o d u z i r f i e l m e n t e o posicionamento dos pontos.

45

Exemplo Dissimilaridades entre 4 objetos em um

espaço bidimensional. d(A, B)= 5 d(B,C)=4 d(A,C)=3 d(A,D)=5 d(B,D)=5 d(C,D)=5

A

B

C

Construção do mapa

A

B

C D ?

46

Passos para obtenção do gráfico e

Medida de qualidade da representação gráfica

47

Descrição da análise

Matriz de (dis) similaridades

Estipular o número de dimensões: k

Para cada estímulo, encontrar um conjunto de k coordenadas de modo que as distâncias entre pares de estímulos, obtidas a partir dessas coordenadas obedeça, o mais fielmente possível, a ordem estabelecida na matriz de (dis)similaridade dos dados.

⇒⇓

48

Exemplo

Comparar os cinco partidos quanto a semelhança (ou dissemelhança): – PFL – PMDB – PPB – PSDB – PTB

49

Geração de uma matriz de Similaridades

Avalie os seguintes pares de partidos políticos: Opostos Indistinguíveis

0 1 2 3 4 5 6 7 8 9 10PDT/PFLPDT/PMDBPDT/PPB

PT/PTB

50

Geração de uma matriz de dissimilaridades

Avalie os seguintes pares de partidos políticos: Indistinguíveis Opostos

0 1 2 3 4 5 6 7 8 9 10PDT/PFLPDT/PMDBPDT/PPB

PT/PTB

51

Escalonamento Multidimensional

Obter o posicionamento dos seguintes partidos em um espaço de dimensão 2: – PFL – PMDB – PPB – PSDB – PTB

52

Matriz de dissimilaridades (δij)

PFL PMDB PPB PSDB PTBPFL 0PMDB 0,3 0PPB 0,13 0,41 0PSDB 0,22 0,27 0,87 0PTB 0,24 0,4 0,08 0,15 0

δij

53

Passo 1: Propor uma configuração inicial

Partido X YPFL 0 0PMDB 3 3PPB 0,5 0,5PSDB 2,5 2,5PTB 2 2

54

Encontrar a matriz de distâncias euclidianas da configuração: dij

PFL PMDB PPB PSDB PTBPFL 0PMDB 4,24 0PPB 0,71 3,54 0PSDB 3,54 0,71 2,83 0PTB 2,83 1,41 2,12 0,71 0

dij

55

Comparar as distâncias com a matriz de dissimilaridades

δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83

A ordem se mantém?

56

Comparar as distâncias com a matriz de dissimilaridades

δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83

A ordem se mantém?

57

Comparar as distâncias com a matriz de dissimilaridades

δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83

A ordem se mantém?

58

Comparar as distâncias com a matriz de dissimilaridades

δij dijPPB/PTB 0,08 2,12PFL/PPB 0,13 0,71PSDB/PTB 0,15 0,71PFL/PSDB 0,22 3,54PFL/PTB 0,24 2,83PMDB/PSDB 0,27 0,71PFL/PMDB 0,3 4,24PMDB/PTB 0,4 1,41PMDB/PPB 0,41 3,54PPB/PSDB 0,87 2,83

A ordem se mantém?

59

Construção de uma medida de ajuste

S i t u a ç ã o i d e a l : E n c o n t r a r u m a configuração na qual:

dij > dit " dij > dit

Medida de ajuste: Quão distante a solução encontrada está da situação ideal? dij: distância numa situação ideal

^

^

^

60

Determinação de dij

δij dijPPB/PTB 0,08 2,12 1,18PFL/PPB 0,13 0,71 1,18PSDB/PTB 0,15 0,71 1,18PFL/PSDB 0,22 3,54 2,36PFL/PTB 0,24 2,83 2,36PMDB/PSDB 0,27 0,71 2,36PFL/PMDB 0,3 4,24 2,83PMDB/PTB 0,4 1,41 2,83PMDB/PPB 0,41 3,54 3,19PPB/PSDB 0,87 2,83 3,19

^ dij Média das

distâncias dij

Repetir

procedimento para os demais casos

61

Stress de Kruskal Expressa o quanto a situação real se

afasta de uma situação ideal

( )∑

ji,

2ij

ijij

d

d - dj,i

stress =

62

Avaliação do ajuste

Stress Qualidade do ajuste

> 20% Ruim

10% Aceitável

5% Bom

2,5% Excelente

0% Perfeito

Exemplo:

stress = 38,5%

63

Passo 2 Tentar diminuir o stress, encontrando um

novo conjunto de coordenadas, a partir da configuração original.

Problema: qual é a configuração de pontos que minimiza o stress?

Repetir os procedimentos até que se obtenha a convergência do stress.

64

Solução do S-plus

Passo Stress1 38,47%5 4,89%10 3,08%Final 3,06%

65

Coordenadas Finais S-plus

Estímulo 1 2PFL 0,09 0,10PMDB -0,21 0,37PPB 0,43 -0,13PSDB -0,33 -0,04PTB 0,02 -1,17

Dimensão

66

Posicionamento em 2 dimensões

Dimensão 1

2,01,51,0,50,0-,5-1,0-1,5

Dim

ensã

o 2

1,5

1,0

,5

0,0

-,5

-1,0

-1,5

ptb

psdb

ppb

pmdb

pfl

67

Mapeamento de marcas de DVD

Uma amostra de consumidores comparou 8 marcas de DVD: CCE, Gradiente, LG, Panasonic, Phillips, Sharp, Sony e Toshiba.

O critério para comparação foi a

qualidade esperada do produto.

68

Matriz de Dissimilaridades

G P S L P T C SGradiente 0,0Panasonic 2,2 0,0Sony 1,9 2,0 0,0LG 6,7 6,0 6,8 0,0

Phillips 4,0 3,7 3,5 4,0 0,0Toshiba 1,0 2,5 2,0 6,0 3,8 0,0CCE 7,0 6,5 6,8 1,2 3,0 6,0 0,0Sharp 4,0 4,5 3,2 5,0 2,4 4,0 6,0 0,0

69

Coordenadas Finais

1 2GRADIENTE 1,27 0,13PANASONIC 0,87 0,59

SONY 1,25 0,07LG -1,99 0,35

PHILLIPS -0,46 -0,66TOSHIBA 0,88 0,41CCE -1,99 0,46SHARP 0,18 -1,35

DimensãoMarca

70

Mapeamento de marcas de

videocassete

Dimensão 1

1,51,0,50,0-,5-1,0-1,5-2,0-2,5

Dim

ensã

o 2

1,0

,5

0,0

-,5

-1,0

-1,5

sharp

cce toshiba

phillips

lg

sony

panasoni

gradient

Stress = 6,0%

Mapeamento de marcas de DVD

71

1 - Antart.-Brahma 6 - Kaiser-Antart. 2 - Skol-Bavária 7 - Bavária-Brahma 3 - Bavária-Kaiser 8 - Bavária-Antart. 4 - Skol-Kaiser 9 - Brahma-Skol 5 - Brahma-Kaiser 10 - Skol-Antart.

Cerveja.sdd Apresenta todos os pares de estímulos ao entrevistado.

Antartica – Brahma – Skol – Bavária – Kaiser

Na opinião dele, deve ordená-los em ordem crescente de dissemelhança entre os pares. Veja resultado:

72

Matriz de Dissimilaridades

Antart. BrahmaKaiser Bavária Skol

Antart. 0Brahma 1 0Kaiser 6 5 0Bavária 8 7 3 0Skol 10 9 4 2 0

73

S-plus Na janela de comandos: library(MASS)

saida<-isoMDS(cerveja,k=2)

plot(saida$points, type="n")

marcas<-c("Antartica", "Brahma", "Kaiser", "Bavaria", "Skol")

text(saida$points,labels=marcas)

saida

74

Posicionamento em duas dimensões

Dimensão 1

2 1 0 -1 -2

Dim

ensã

o 2

,6

,4

,2

0,0

-,2

-,4

skol

bavária

kaiser

brahma

antartica

Stress < 0,1 %

75

S-plus Na janela de comandos: library(MASS)

saida<-isoMDS(cerveja,k=1)

d1<-rep(0,nrow(cerveja))

plot(d1,saida$points, type="n")

marcas<-c("Antartica", "Brahma", "Kaiser", "Bavaria", "Skol")

text(d1,saida$points,labels=marcas)

saida

76

Posicionamento em uma dimensão

,6 ,4 ,2 -,0 -,2 -,4 -,6

Dim

ensã

o 1

1,5

1,0

,5

0,0

-,5

-1,0

-1,5

skol

bavária

kaiser

brahma

antartica

Stress < 0,1 %

77

Mapeamento de marcas de DVD

Uma amostra de consumidores comparou 8 marcas de DVD: CCE, Gradiente, LG, Panasonic, Phillips, Sharp, Sony e Toshiba.

O critério para comparação foi a

qualidade esperada do produto.

78

Matriz de Dissimilaridades G P S L P T C S

Gradiente 0,0Panasonic 2,2 0,0Sony 1,9 2,0 0,0LG 6,7 6,0 6,8 0,0

Phillips 4,0 3,7 3,5 4,0 0,0Toshiba 1,0 2,5 2,0 6,0 3,8 0,0CCE 7,0 6,5 6,8 1,2 3,0 6,0 0,0Sharp 4,0 4,5 3,2 5,0 2,4 4,0 6,0 0,0

Arquivo: DVD.sdd

79

Exercício: Mapeamento de marcas de DVD

Usando o arquivo DVD.sdd, construa um gráfico de duas dimensões usando escalonamento multidimensional.

Qual a qualidade dessa representação gráfica com base na medida Stress. Qual a sua conclusão?

Interprete o gráfico assumindo que os pares de estímulos (aparelhos de DVDs) foram comparados em termos de semelhanças da qualidade esperada do produto.

Calcule a medida Stress para as dimensões k=1 até k=5. Construa um gráfico de Stress versus k. Faça interpretação.

80

S-plus Na janela de comandos: library(MASS)

saida<-isoMDS(DVD,k=1)

plot(saida$points, type="n")

marcas<-c("Gradiente", "Panasonic", "Sony", "LG", "Phillips", "Toshiba", "CCE", "Sharp")

text(saida$points,labels=marcas)

saida

81

Preferência Os es t ímu los podem também ser

comparados segundo a preferência do respondente e não segundo sua semelhança.

Todos os métodos de construção de

matrizes de similaridade se aplicam. Diferenças na interpretação dos mapas.

82

Resposta = Preferência

A partir do ordenamento dos estímulos segundo a preferência (tal como em análise de preferência conjunta), pode-se construir uma matriz de similaridades. A partir dessa matriz, pode-se gerar mapas.

83

Tipos de Análises

•  Individual (Desagregada) - um mapa por entrevistado.

•  Agregada - um único mapa para um grupo de entrevistados

84

Número de estímulos

Alto grande número de pares de estímulos a serem avaliados.

Solução: Cada respondente analisa apenas um pequeno número de pares, de tal sorte que vários grupos de respondentes aval iem todos os possíveis pares.

85

Número de dimensões

# Conhecimento a priori da estrutura da população.

# Interpretabilidade do mapa. # Estabelecimento de um nível mínimo de

ajuste. # Variação do stress (critério do cotovelo). # Conveniência de uso.

86

Stress em função do número de dimensões

0

2

4

6

8

10

12

14

16

18

0 1 2 3 4 5Dimensões

Stress

87

Aplicação aos dados das bebidas não alcoólicas – Bebidasmedias.xls

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10Pepsi 5,17 2,78 3,11 4,89 2,44 5,22 3,22 5,22 2,72 3,33Coca-cola 5,20 2,13 3,73 5,20 2,00 4,80 3,67 5,40 2,13 3,67Gatorade 3,42 5,00 6,25 3,33 4,83 4,67 6,17 3,75 5,00 6,17Allsport 3,57 3,93 5,57 3,21 3,79 4,64 5,79 3,36 4,07 5,71Lipton 6,17 5,44 5,00 5,89 5,56 4,83 4,83 5,78 5,50 4,89Nestea 6,11 5,11 4,83 6,28 5,11 4,78 4,78 6,17 5,22 4,78

Médias por marca de bebida

88

Matriz de distância

Marca Pepsi Coca-cola Gatorade Allsport Lipton NesteaPepsi 0,00

Coca-cola 1,40 0,00Gatorade 7,10 7,26 0,00Allsport 5,69 5,75 2,03 0,00Lipton 5,96 6,40 4,92 5,40 0,00Nestea 5,49 5,86 5,27 5,54 0,86 0,00

89

Posicionamento de bebidas não alcoólicas

Dimensão 1

2,01,51,0,50,0-,5-1,0-1,5

Dim

ensã

o 2

1,5

1,0

,5

0,0

-,5

-1,0

-1,5

nestealipton

allsport

gatorade

cocapepsi

Stress = 0,048%