Classificadores Bayesianos
Introduction to Data Mining (Cap. 5.3)
Tan, Steinbach, KumarIrineu Júnior Pinheiro dos Santos
Mirela Ferreira CésarRoberto Ribeiro Castro Menezes
2
Sumário Introdução Teorema de Bayes
Teorema de Bayes na Classificação Classificador Naive Bayes
M-Estimate das Probabilidades Condicionais
3
Introdução - Conceitos
Classificadores Bayesianos são classificadores estatísticos que tem a função de classificar um objeto numa determinada classe, baseando-se na probabilidade deste objeto pertencer a esta classe.
Em muitas aplicações, a relação entre o conjunto de atributos e a variável classe são não-determinísticos.
4
Introdução - Exemplo
Predizer quando uma pessoa tem doença no coração considerando os fatores alimentação saudável e freqüência que pratica exercícios.
5
Introdução - Exemplo
Outros Fatores podem ocasionar a doença: fumo,
colesterol elevado e hereditariedade.
Doença no coração?
AlimentaçãoSaudável eExercícios
Relação não determinística
6
Teorema de Bayes Fornece o cálculo das probabilidades de que uma
determinada amostra de dados pertença a cada uma das classes possíveis, predizendo para a amostra, a classe mais provável.
Considerando X e Y variáveis aleatórias, uma probabilidade condicional P(Y|X) refere-se a probabilidade de Y assumir um valor determinado, observando-se o valor assumido por X.
)(
)()|()|(
XP
YPYXPXYP
7
Teorema de Bayes na Classificação Exemplo:
ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não
Classificar os seguintes valores:X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)Y = Compra_Computador?
8
Teorema de Bayes na Classificação Exemplo:
ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não
P(Y=sim) e P(Y=não)P(Y=sim) = 9/14 = 0,643 P(Y=não) = 5/14 = 0,357 = 1-P(Y=sim)
9
Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não
Probabilidades:P[Idade <= 30 | Y = sim] = 2/9 = 0,222P[Idade <= 30 | Y = não] = 3/5 = 0,6
10
Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não
Probabilidades:P[Renda = Media | Y = sim] = 4/9 = 0,444P[Renda = Media | Y = não] = 2/5 = 0,4
11
Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não
Probabilidades:P[Estudante = sim | Y = sim] = 6/9 = 0,667P[Estudante = sim | Y = não] =1/5 = 0,2
12
Teorema de Bayes na Classificação X = (Idade <= 30, Renda = Media, Estudante = sim, Crédito = bom)
ID Idade Renda Estudante Crédito Compra_computador1 <= 30 Alta Não Bom Não2 <= 30 Alta Não Bom Não3 31..40 Alta Não Bom Sim4 > 40 Média Não Bom Sim5 > 40 Baixa Sim Bom Sim6 > 40 Baixa Sim Excelente Não7 31..40 Baixa Sim Excelente Sim8 <= 30 Média Não Bom Não9 <= 30 Baixa Sim Bom Sim10 > 40 Média Sim Bom Sim11 <= 30 Média Sim Excelente Sim12 31..40 Média Não Excelente Sim13 31..40 Alta Sim Bom Sim14 > 40 Média Não Excelente Não
Probabilidades:P[Credito = bom | Y = sim] = 6/9 = 0,667P[Credito = bom | Y = não] = 2/5 = 0,4
13
Teorema de Bayes na Classificação Calculamos isoladamente o valor da probabilidade
condicional de cada atributo, mas para que eles sejam calculado de forma interseccionada, temos:
P[x1, x
2,... x
d | C] = P(x
1| C) * P(x
2| C) * … * P(x
d| C)
Com isso, é possível chegar a uma forma mais geral do Teorema de Bayes:
)(
)|()()|( 1
XP
YXPYPXYP i
di
14
Teorema de Bayes na ClassificaçãoTemos:
P(X|Y=sim) = 0,222 * 0,444 * 0,667 * 0,667 = 0,044
P(X|Y=não) = 0,6 * 0,4 * 0,2 * 0,4 = 0,019
Pela lei da probabilidade total:
P(X) = P(X|Y=sim)*P(Y=sim) + P(X|Y=não)*P(Y=não)
P(X) = 0,044*0,643 + 0,019*0,357 = 0,028 + 0,007 = 0,035
P(X|Y=sim) * P(Y=sim) / P(X) = 0,044 * 0,643 = 0,028 / 0,035 = 0,8
P(X|Y=não) * P(Y=não) / P(X) = 0,019 * 0,357 = 0,007 / 0,035 = 0,2
Ou seja, P(X|Y=sim) > P(X|Y=não) O classificador Bayesiano prediz que a tupla X é classificada
na classe Compra-Computador = sim
15
Classificador Naive Bayes Um classificador Naive Bayes estima a probabilidade de
classe condicional P(X|Y).
Pré-considerações: Assume-se que os atributos são condicionalmente
independentes (Naive Bayes ingênuo ou simples); As probabilidades condicionais são estimadas para os atributos
de acordo com a sua classificação: Categórico; Contínuo.
16
Atributos Condicionalmente Independentes São atributos que apresentam independência estatística
entre si: Dois eventos são estatisticamente independentes se a
probabilidade da ocorrência de um evento não é afetada pela ocorrência do outro evento.
Exemplo: Tamanho do braço x Habilidades de Leitura
Considerando a Idade, a dependência não ocorre.
17
Atributos Categóricos É aquele atributo para o qual é possível estabelecer um
conjunto de valores finito.
Exemplo: Sexo: {Masculino, Feminino} Cor da Pele: {Branca, Marrom, Amarela, Preta}
18
Atributos Categóricos Para uso no algoritmo Naive Bayes:
Estima-se a fração das instâncias de treinamento de acordo com cada valor da classe.
Exemplo:
Casa Própria Estado Civil Inadimplente
Sim Casado Sim
Sim Solteiro Não
Não Casado Não
Sim Divorciado Não
P(Casa Própria=Sim|Não)
19
Atributos Categóricos
Exemplo:
Casa Própria Estado Civil Inadimplente
Sim Casado Sim
Sim Solteiro Não
Não Casado Não
Sim Divorciado Não
P(Casa Própria=Sim|Não) = 2/3
20
Atributos Contínuos
São considerados contínuos os atributos que possuem muitos ou infinitos valores possíveis
Exemplo: Idade: Peso:
00R
21
Atributos Contínuos Existem duas formas de estimar a probabilidade de
classe condicional para atributos contínuos: Discretização dos atributos; Distribuição Gaussiana.
22
Atributos Contínuos Discretização de atributos contínuos:
Os atributos contínuos são divididos em intervalos discretos, que substituem os valores desses atributos.
Esta abordagem transforma os atributos contínuos em atributos ordinais.
A transformação dos atributos contínuos em atributos discretos permite que sejam tratados como atributos categóricos.
23
Atributos Contínuos Distribuição Gaussiana:
Assume uma certa forma de distribuição de probabilidade para variáveis contínuas, e estima os parâmetros da distribuição usando os dados de treinamento.
Caracterizada por dois parâmetros: Média (µ) Variância (σ2) da amostra
24
Atributos Contínuos
Para cada valor de classe y, a probabilidade da classe condicional para o atributo X é:
n
y
2
2
2exp
2
1)|(
x
yYxXP
1
22
n
x
25
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
Atributos Categóricos Atributos Contínuos Classe
Exemplo: Dado o seguinte conjunto de treinamento:
26
Classificador Naive Bayes Cálculo dos atributos categóricos:
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
P(Casa Própria=Sim|Não) = 3/7
27
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
P(Casa Própria=Sim|Não) = 3/7
P(Casa Própria=Não|Não) = 4/7
Cálculo dos atributos categóricos:
28
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
P(Casa Própria=Sim|Não) = 3/7
P(Casa Própria=Não|Não) = 4/7
P(Casa Própria=Sim|Sim) = 0
Cálculo dos atributos categóricos:
29
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
P(Casa Própria=Sim|Não) = 3/7
P(Casa Própria=Não|Não) = 4/7
P(Casa Própria=Sim|Sim) = 0
P(Casa Própria=Não|Sim) = 1
Cálculo dos atributos categóricos:
30
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
P(Casa Própria=Sim|Não) = 3/7
P(Casa Própria=Não|Não) = 4/7
P(Casa Própria=Sim|Sim) = 0
P(Casa Própria=Não|Sim) = 1
P(Estado Civil=Solteiro|Não) = 2/7
P(Estado Civil=Divorciado|Não) = 1/7
P(Estado Civil=Casado|Não) = 4/7
P(Estado Civil=Solteiro|Sim) = 2/3
P(Estado Civil=Divorciado|Sim) = 1/3
P(Estado Civil=Casado|Sim) = 0
Cálculo dos atributos categóricos:
31
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
Média:
µ = (125 + 100 + 70 + 120 + 60 + 220 + 75) / 7 = 110
Variância:
σ2 = (125-110)2 + (100-110)2 + (70-110)2 + (120-110)2 + (60-110)2 + (220-110)2 + (75-110)2 / 6 = 2975
Cálculo dos atributos contínuos:
Para a classe Não
32
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
Cálculo dos atributos contínuos:
Para a classe Sim
Média:
µ = (95 + 85 + 90) / 3 = 90
Variância:
σ2 = (95-90)2 + (85-90)2 + (90-90)2 / 2 = 25
33
Classificador Naive Bayes
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
P(Casa Própria=Sim|Não) = 3/7
P(Casa Própria=Não|Não) = 4/7
P(Casa Própria=Sim|Sim) = 0
P(Casa Própria=Não|Sim) = 1
P(Estado Civil=Solteiro|Não) = 2/7
P(Estado Civil=Divorciado|Não) = 1/7
P(Estado Civil=Casado|Não) = 4/7
P(Estado Civil=Solteiro|Sim) = 2/3
P(Estado Civil=Divorciado|Sim) = 1/3
P(Estado Civil=Casado|Sim) = 0
Para o cálculo da Renda Anual:
Classe Não:
Média: 110 Variância: 2975
Classe Sim:
Média: 90 Variância: 25
Resultado dos cálculos básicos:
34
Classificador Naive Bayes Dado o conjunto de treinamento anterior, qual a
classe do seguinte registro de teste:
X = (Casa Própria=Não, Estado Civil=Casado, Renda Anual=120K)
Avaliar qual a maior probabilidade entre as probabilidades posteriores: P(Inadimplente=Não|X) e P(Inadimplente=Sim|X)
35
Classificador Naive Bayes Para calcular as probabilidades posteriores
P(Não|X) e P(Sim|X) necessitamos: Calcular as classes condicionais P(X|No) e P(X|Yes)
P(X|Não) P(Casa Própria=Não|Não) * P(Estado Civil=Casado|Não) * P(Renda Anual=120K|Não) 4/7 * 4/7 * 0,0072 0,0024
P(X|Sim) P(Casa Própria=Não|Sim) * P(Estado Civil=Casado|Sim) * P(Renda Anual=120K|Sim) 1 * 0 * 1,2x10-9 0
Distribuição Gaussiana
36
Classificador Naive Bayes Juntando os termos:
P(Não|X) α * P(Não) * P(X|Não) α * 7/10 * 0,0024 0,0016α Onde α = 1/P(X) → Termo constante!
Como a probabilidade condicional de P(X|Sim) é zero: P(Sim|X) = 0
Logo, P(Não|X) > P(Sim|X) O registro X é classificado como Não
37
M-Estimate das Probabilidades Condicionais
Problema: se a probabilidade da classe condicional de um dos atributos é zero, a probabilidade posterior para a classe inteira, quando avaliado esse atributo, também será.
Pois Lembre-se: P[x
1, x
2,... ,x
k | C] = P(x
1| C) * P(x
2| C) * … * P(x
k| C)
Quando essa condição existe para atributos das duas classes, o algoritmo não é capaz de classificar o registro.
38
M-Estimate das Probabilidades Condicionais Exemplo, imagine que o conjunto de treinamento fosse assim:
E agora queremos saber P(X | C) sendo X = (Casa Própria = Sim, Estado Civil = Divorciado, Renda = 120k)
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
39
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
40
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
41
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
P(Casa Própria = Sim | Não) = 2/6 = 0.33
42
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
P(Casa Própria = Sim | Não) = 2/6 = 0.33
P(Estado Civil = Divorciado | Não) = 0
43
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
P(Casa Própria = Sim | Não) = 2/6 = 0.33
P(Estado Civil = Divorciado | Não) = 0
P(Renda Anual = 120k | Não) = 0,0072
Média (µ) = 91,66kVariância (σ2) = 732,76
44
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
P(Casa Própria = Sim | Não) = 2/6 = 0.33
P(Estado Civil = Divorciado | Não) = 0
P(Renda Anual = 120 | Não) = 0,0072
P(Casa Própria = Sim | Yes) = 0/3 = 0
45
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
P(Casa Própria = Sim | Não) = 2/6 = 0.33
P(Estado Civil = Divorciado | Não) = 0
P(Renda Anual = 120 | Não) = 0,0072
P(Casa Própria = Sim | Sim) = 0/3 = 0
P(Estado Civil = Divorciado | Sim) = 0.333
46
Registro Casa Própria Estado Civil Renda Anual Inadimplente
1 Sim Solteiro 125K Não
2 Não Casado 100K Não
3 Não Solteiro 70K Não
4 Sim Casado 120K Não
5 Não Divorciado 95K Sim
6 Não Casado 60K Não
7 Sim Divorciado 220K Não
8 Não Solteiro 85K Sim
9 Não Casado 75K Não
10 Não Solteiro 90K Sim
M-Estimate das Probabilidades Condicionais
P(Não) = 6/9 = 0.666
P(Sim) = 3/9 = 0.333
P(Casa Própria = Sim | Não) = 2/6 = 0.33
P(Estado Civil = Divorciado | Não) = 0
P(Renda Anual = 120 | Não) = 0,0072
P(Casa Própria = Sim | Sim) = 0/3 = 0
P(Estado Civil = Divorciado | Sim) = 0.333
P(Renda Anual = 120 | Sim) = 1,2 * 10-9
47
M-Estimate das Probabilidades Condicionais
Aplicando a fórmula de Bayes:
P(C = Não | X) = α * 0.666 * (0.333 * 0 * 0,0072) P(C = Sim | X) = α * 0.333 * ( 0 * 0.333 * 1,2 * 10-9)
P(C = Não | X) = 0 P(C = Sim | X) = 0 Ou seja, o algoritmo não foi capaz de predizer a probabilidade
neste caso
48
M-Estimate das Probabilidades Condicionais
É possível contornar o problema utilizando a abordagem M-Estimate para o cálculo das probabilidades condicionais
49
M-Estimate das Probabilidades Condicionais
Onde: n é o número total de instâncias da classe y nc é o número de exemplos de treinamento da classe y com o valor x m é um parâmetro conhecido como o tamanho de amostra equivalente
m é dito valor de compensação p é um parâmetro especificado pelo usuário
+ ou – a proporção da classe no treinamento
Utilizando m = 3 e p = 2/3 (para a classe “Não”), é possível calcular a probabilidade condicional que anteriormente era zero: P(Estado Civil=Divorciado|Não) = (0 + 3*2/3)/(6+3) = 2/9
50
M-Estimate das Probabilidades Condicionais Assumindo p=1/3 para classe “Sim” e p=2/3 para a classe “Não”, as
classes condicionais dos demais atributos são calculadas: P(Casa própria=Sim|Não) = (2 + 3*2/3)/(6 + 3) = 4/9 = 0.444 P(Estado Civil = Divorciado | Não) = 2/9 = 0.222 (calculado na lâmina anterior) P(Renda Anual = 120k | Não) = 0,0072
P(C = Não | X) = α * 0.666 * (0.444 * 0.222 * 0,0072) = 0,004α
P(Casa própria=Sim|Sim) = (0 + 3*1/3)/(3 + 3) = 1/6 = 0,166 P(Estado Civil = Divorciado | Sim) = (1 + 3 * 1/3) / (3 + 3) = 2/6 = 0,333 P(Renda Anual = 120k | Sim) = 1,2 * 10-9
P(C = Sim | X) = α * 0.333 * ( 0,166 * 0.333 * 1,2 * 10-9) = 0,022 * 10-9α
Portanto, o algoritmo de Naive Bayes prediz que para o conjunto de atributos X utilizado, a classe deverá ser NÃO
51
Caracteristicas Naive Bayes
Vantagens: São robustos para isolar pontos de ruído, pois tais pontos são
calculados pela média quando estima-se a probabilidades condicionais dos dados.
Atributos irrelevantes não tem impacto na computação da probabilidade posterior.
Desvantagens: Atributos correlacionados degradam a performance de classificadores
bayesianos, pois a independência condicional não é mais assegurada.
Perguntas?