Upload
yohei-sato
View
4.380
Download
0
Embed Size (px)
Citation preview
1
特徴の評価とベイズ誤り確率
id:yokkuns 里 洋平
パターン認識勉強会
2
目次
● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは
3
目次
● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは
4
認識性能の改善
5 前処理部 特徴抽出部
識別部
識別演算部
識別辞書
5
● 認識性能は、前処理部、特徴抽出部、識別部を含めた認識系全体の評価尺度
● よて、性能を改善するためには、性能を低下させた原因が認識系のどの処理部にあるかを明確にする必要がある
5
例 1
● 特徴空間上で、二つのクラスが完全に分離してる
ω1
ω2
6
例 1
● 特徴空間上で、二つのクラスが完全に分離してるのに認識性能が悪い
ω1
ω2
7
例 1
● 特徴空間上で、二つのクラスが完全に分離してるのに認識性能が悪い
原因は、特徴抽出部ではなく、識別部
ω1
ω2
8
例 2
● 特徴空間上で、二つのクラスが完全に重なっていて性能がわるい
ω1
ω2
9
例 2
● 特徴空間上で、二つのクラスが完全に重なっていて性能がわるい
原因は、識別部ではなく、特徴抽出部
ω1
ω2
10
特徴抽出部の設計
● あらかじめ特徴の評価を行うことが重要● 特徴が適切でなければ高精度の認識系は実現で
きない。● 特徴の良し悪しはクラス間分離能力によって評
価できる。
11
特徴抽出部の設計
● あらかじめ特徴の評価を行うことが重要● 特徴が適切でなければ高精度の認識系は実現で
きない。● 特徴の良し悪しはクラス間分離能力によって評
価できる。
クラス内分散・クラス間分散比
12
目次
● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは
13
クラス間の分離の精度
● 特徴空間上で以下のようになるのが望ましい– 同じクラス : なるべく接近– 異なるクラス : なるべく離れる
● クラス内分散・クラス間分散比
14
クラス内分散・クラス間分散比● クラス内分散 - クラス内の平均的な広がり
● クラス間分散 – クラス間の広がり
● クラス内分散・クラス間分散比
15
欠点
● 多クラスの問題に対しては、必ずしも実際の分布の分離度を反映していない
– 例)以下の Jσ の値は等しい
16
欠点● Jσ がクラス間の距離だけを見ていて分布の重
なりを評価していないため● 全体の分離度を平均的に評価するため、クラス
の対で見た時の分離度が反映されない
17
欠点● Jσ がクラス間の距離だけを見ていて分布の重
なりを評価していないため● 全体の分離度を平均的に評価するため、クラス
の対で見た時の分離度が反映されない
分布の重なり具合を調べる必要がある
18
欠点● Jσ がクラス間の距離だけを見ていて分布の重
なりを評価していないため● 全体の分離度を平均的に評価するため、クラス
の対で見た時の分離度が反映されない
分布の重なり具合を調べる必要がある
ベイズ誤り確率
19
目次
● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは
20
ベイズ誤り確率
● 特徴空間上での分布の重なり● 特徴抽出系によってもたらされる必然的な誤り
(例)ある地点を通過する通行人を観察し、それが男性であるか女性であるかを機会で自動判別
– 身長、体重、音声などの特徴が抽出出来ればある程度判別出来るが、 100% は無理
– これらの特徴を用いた特徴空間上では、男女の分布は互いに重なり合っている
21
定式化 1
ベイズの定理より、以下が成り立つ
まず、 2 クラスの場合で考える。
22
定式化 2ある x に対する誤り確率は、
23
定式化 2ある x に対する誤り確率は、
起こりうる全ての x に対する誤り確率は、
24
定式化 2ある x に対する誤り確率は、
起こりうる全ての x に対する誤り確率は、
Pe を最小にするには、 P(ω1|x) 、 P(ω2|x) の小さい方が選ばれるような判定方法を取ればよい、すなわち
25
定式化 2ある x に対する誤り確率は、
起こりうる全ての x に対する誤り確率は、
Pe を最小にするには、 P(ω1|x) 、 P(ω2|x) の小さい方が選ばれるような判定方法を取ればよい、すなわち
ベイズ決定則
26
定式化 3Pe(x) の最小値を eB(x) で表すと
27
定式化 3Pe(x) の最小値を eB(x) で表すと
条件付きベイズ誤り確率
28
定式化 3Pe(x) の最小値を eB(x) で表すと
条件付きベイズ誤り確率
Pe の最小値を eB で表すと
29
定式化 3Pe(x) の最小値を eB(x) で表すと
条件付きベイズ誤り確率
Pe の最小値を eB で表すと
ベイズ誤り確率
30
定式化 4eB は、以下のようにもかける
上式は、 P(ωi|x) が識別関数として使える事を示している。
31
定式化 4eB は、以下のようにもかける
上式は、 P(ωi|x) が識別関数として使える事を示している。
ベイズ識別関数
32
まとめ
● 高精度の認識系は実現するためには、あらかじめ特徴の評価を行うことが重要
● ベイズ誤り確率が特徴を評価する上で重要