33
1 特徴の評価とベイズ誤り確率 id:yokkuns 洋平 パターン認識勉強会

第5回パターン認識勉強会

Embed Size (px)

Citation preview

Page 1: 第5回パターン認識勉強会

1

特徴の評価とベイズ誤り確率

id:yokkuns 里 洋平

パターン認識勉強会

Page 2: 第5回パターン認識勉強会

2

目次

● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは

Page 3: 第5回パターン認識勉強会

3

目次

● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは

Page 4: 第5回パターン認識勉強会

4

認識性能の改善

5 前処理部 特徴抽出部

識別部

識別演算部

識別辞書

5

● 認識性能は、前処理部、特徴抽出部、識別部を含めた認識系全体の評価尺度

● よて、性能を改善するためには、性能を低下させた原因が認識系のどの処理部にあるかを明確にする必要がある

Page 5: 第5回パターン認識勉強会

5

例 1

● 特徴空間上で、二つのクラスが完全に分離してる

ω1

ω2

Page 6: 第5回パターン認識勉強会

6

例 1

● 特徴空間上で、二つのクラスが完全に分離してるのに認識性能が悪い

ω1

ω2

Page 7: 第5回パターン認識勉強会

7

例 1

● 特徴空間上で、二つのクラスが完全に分離してるのに認識性能が悪い

原因は、特徴抽出部ではなく、識別部

ω1

ω2

Page 8: 第5回パターン認識勉強会

8

例 2

● 特徴空間上で、二つのクラスが完全に重なっていて性能がわるい

ω1

ω2

Page 9: 第5回パターン認識勉強会

9

例 2

● 特徴空間上で、二つのクラスが完全に重なっていて性能がわるい

原因は、識別部ではなく、特徴抽出部

ω1

ω2

Page 10: 第5回パターン認識勉強会

10

特徴抽出部の設計

● あらかじめ特徴の評価を行うことが重要● 特徴が適切でなければ高精度の認識系は実現で

きない。● 特徴の良し悪しはクラス間分離能力によって評

価できる。

Page 11: 第5回パターン認識勉強会

11

特徴抽出部の設計

● あらかじめ特徴の評価を行うことが重要● 特徴が適切でなければ高精度の認識系は実現で

きない。● 特徴の良し悪しはクラス間分離能力によって評

価できる。

クラス内分散・クラス間分散比

Page 12: 第5回パターン認識勉強会

12

目次

● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは

Page 13: 第5回パターン認識勉強会

13

クラス間の分離の精度

● 特徴空間上で以下のようになるのが望ましい– 同じクラス : なるべく接近– 異なるクラス : なるべく離れる

● クラス内分散・クラス間分散比

Page 14: 第5回パターン認識勉強会

14

クラス内分散・クラス間分散比● クラス内分散 - クラス内の平均的な広がり

● クラス間分散 – クラス間の広がり

● クラス内分散・クラス間分散比

Page 15: 第5回パターン認識勉強会

15

欠点

● 多クラスの問題に対しては、必ずしも実際の分布の分離度を反映していない

– 例)以下の Jσ の値は等しい

Page 16: 第5回パターン認識勉強会

16

欠点● Jσ がクラス間の距離だけを見ていて分布の重

なりを評価していないため● 全体の分離度を平均的に評価するため、クラス

の対で見た時の分離度が反映されない

Page 17: 第5回パターン認識勉強会

17

欠点● Jσ がクラス間の距離だけを見ていて分布の重

なりを評価していないため● 全体の分離度を平均的に評価するため、クラス

の対で見た時の分離度が反映されない

分布の重なり具合を調べる必要がある

Page 18: 第5回パターン認識勉強会

18

欠点● Jσ がクラス間の距離だけを見ていて分布の重

なりを評価していないため● 全体の分離度を平均的に評価するため、クラス

の対で見た時の分離度が反映されない

分布の重なり具合を調べる必要がある

ベイズ誤り確率

Page 19: 第5回パターン認識勉強会

19

目次

● 特徴の評価● クラス内分散・クラス間分散比● ベイズ誤り率とは

Page 20: 第5回パターン認識勉強会

20

ベイズ誤り確率

● 特徴空間上での分布の重なり● 特徴抽出系によってもたらされる必然的な誤り

(例)ある地点を通過する通行人を観察し、それが男性であるか女性であるかを機会で自動判別

– 身長、体重、音声などの特徴が抽出出来ればある程度判別出来るが、 100% は無理

– これらの特徴を用いた特徴空間上では、男女の分布は互いに重なり合っている

Page 21: 第5回パターン認識勉強会

21

定式化 1

ベイズの定理より、以下が成り立つ

まず、 2 クラスの場合で考える。

Page 22: 第5回パターン認識勉強会

22

定式化 2ある x に対する誤り確率は、

Page 23: 第5回パターン認識勉強会

23

定式化 2ある x に対する誤り確率は、

起こりうる全ての x に対する誤り確率は、

Page 24: 第5回パターン認識勉強会

24

定式化 2ある x に対する誤り確率は、

起こりうる全ての x に対する誤り確率は、

Pe を最小にするには、 P(ω1|x) 、 P(ω2|x) の小さい方が選ばれるような判定方法を取ればよい、すなわち

Page 25: 第5回パターン認識勉強会

25

定式化 2ある x に対する誤り確率は、

起こりうる全ての x に対する誤り確率は、

Pe を最小にするには、 P(ω1|x) 、 P(ω2|x) の小さい方が選ばれるような判定方法を取ればよい、すなわち

ベイズ決定則

Page 26: 第5回パターン認識勉強会

26

定式化 3Pe(x) の最小値を eB(x) で表すと

Page 27: 第5回パターン認識勉強会

27

定式化 3Pe(x) の最小値を eB(x) で表すと

条件付きベイズ誤り確率

Page 28: 第5回パターン認識勉強会

28

定式化 3Pe(x) の最小値を eB(x) で表すと

条件付きベイズ誤り確率

Pe の最小値を eB で表すと

Page 29: 第5回パターン認識勉強会

29

定式化 3Pe(x) の最小値を eB(x) で表すと

条件付きベイズ誤り確率

Pe の最小値を eB で表すと

ベイズ誤り確率

Page 30: 第5回パターン認識勉強会

30

定式化 4eB は、以下のようにもかける

上式は、 P(ωi|x) が識別関数として使える事を示している。

Page 31: 第5回パターン認識勉強会

31

定式化 4eB は、以下のようにもかける

上式は、 P(ωi|x) が識別関数として使える事を示している。

ベイズ識別関数

Page 32: 第5回パターン認識勉強会

32

まとめ

● 高精度の認識系は実現するためには、あらかじめ特徴の評価を行うことが重要

● ベイズ誤り確率が特徴を評価する上で重要