統計モデルの数理 - 東京大学Bradley{Terry モデル(BTモデル)...

情報・システム工学概論

統計モデルの数理— 第２回：強さをはかる統計モデル —

駒木　文保

工学部計数工学科

2017年 12月 11日

Bradley–Terry モデル (BTモデル)

野球，サッカー，相撲，囲碁・将棋などの勝敗データ

プレイヤーの “強さ”を数値化して将来の結果を予測できる．

スポーツの統計学

詳しくは，竹内・藤野 (1988) などを参照．

BTモデルを基本とした，さまざまな拡張が提案され続けている．

1 / 33

２人のプレイヤーの場合

プレイヤー A, B

A, B の強さπA, πB ∈ (0,∞)

A と B ２人の対戦で A が勝つ確率

pAB =πA

πA + πB.

A が勝つ確率と B が勝つ確率の和

pAB + pBA =πA

πA + πB+

πBπA + πB

2 / 33

例．A と B が同じ強さ

πA = πB = 1

A が勝つ確率

pAB =πA

πA + πB=

1 + 1=

例．A が強く，B が弱い

πA = 10, πB = 0.1

A が勝つ確率

pAB =πA

πA + πB=

10 + 0.1=

101≃ 0.990099.

3 / 33

N 人のプレイヤーの場合

プレイヤー 1, 2, . . . ,N の強さ

π1, π2, . . . , πN .

プレイヤー i とプレイヤー j が対戦して i が勝つ確率

pij =πi

πi + πj.

4 / 33

N 人全員のプレイヤーの強さを c > 0 倍しても意味は変わらない．

強さcπ1, cπ2, . . . , cπN .

プレイヤー i とプレイヤー j が対戦して i が勝つ確率

pij =cπi

cπi + cπj=

πiπi + πj

強さのパラメータには定数倍の不定性がある．

5 / 33

BTモデルの限界

“苦手” は表現できない．

じゃんけんのような関係は表せない．

しかし，近似モデルとしては有効なことが多い．全てのモデルは近似．

３人のプレイヤーがじゃんけんの石 G，はさみ C，紙 P だったら，

pGCpCPpPG =1,

pCGpGPpPC =0.

したがって，pGCpCPpPG ̸= pCGpGPpPC.

6 / 33

BTモデルの場合

勝敗の結果として３すくみがおこる確率

pikpkjpji =πi

πi + πk

πkπk + πj

πjπj + πi

=πiπjπk

(πi + πj)(πj + πk)(πk + πi ).

逆の向きの３すくみがおこる確率

pkipijpjk =πk

πk + πi

πiπi + πj

πjπj + πk

=πiπjπk

(πi + πj)(πj + πk)(πk + πi ).

したがってpikpkjpji = pkipijpjk .

7 / 33

３すくみがないことを，

pijpjkpki = pjipikpkj

が常に成立することと定義する．

“３すくみ”が無いことから BT モデルが導ける．

8 / 33

３すくみが無いとき，pjipij

=pjkpkipikpkj

が成立．ここで，π1 := 1, πj :=

pj1p1j

とおくと，pjipij

=pj1p1ipi1p1j

=πjπi.

また，pjipij

=1− pijpij

pij− 1

より，pij =

πiπi + πj

これは BT モデルに他ならない．

9 / 33

パラメータの推定法

前回触れた最尤推定を２項分布の例で説明．本質的な考え方は他もモデルでも同様．

例．２項分布の確率関数 (θ の値を与えたもとで x の関数と見る)

P(x ; θ) =

)θx(1− θ)n−x .

P(x ; θ) を x の値を与えたもとで θ の関数と見るとき，尤度（ゆうど）関数とよぶ．

尤度関数の対数

logP(x ; θ) = log

)+ x log θ + (n − x) log(1− θ).

を対数尤度関数と呼ぶ．

10 / 33

対数尤度をパラメータで偏微分して 0 とおいて得られる方程式

∂θlogP(x ; θ) =

θ− n − x

1− θ= 0

を尤度方程式と呼ぶ．

最尤推定値θ̂(x) =

は尤度方程式を解いて得られる．

推定量は ̂（ハット）をつけて表すことが多い．

11 / 33

プレイヤーが２人（A と B）の場合．

πA: A の強さ, πB: B の強さ

θ :=πA

πA + πB

とおけば２項分布モデルの推定と本質的に同じ．

12 / 33

２人のプレイヤーの強さが πA, πB であるのと cπA, cπB, (c > 0)であるのは同じことなので，

πA + πB = 2

という制約をつける．

制約をつけることにより，πA, πB の値が一意に決まる．

強さ πA が 1 なら A と B は同じ強さ，

πA が 1 より大きければ，A は B より強い．

13 / 33

プレイヤーが２人の時のパラメータ推定は，θ の最尤推定値 θ̂ を求めてから

π̂Aπ̂A + π̂B

= θ̂,

π̂A + π̂B = 2

を満たすように π̂1, π̂2 を求めればよい．

すると，

π̂A = 2θ̂, π̂B = 2(1− θ̂)

となる．

14 / 33

一般の場合のパラメータ推定

N 人のプレイヤー

nij : i と j の勝負の数 (nij = nji )

xij : i と j に勝った数 (xij = nji − xji )

πi : プレイヤー i の強さ

i と j が対戦した時 i が勝つ確率

πiπi + πj

15 / 33

i と j が nij 回対戦した時 i が xij 回勝つ確率(nijxij

πi + πj

πjπi + πj

)nij−xij

全体の対戦の結果の確率

N−1∏i=1

N∏j=i+1

(nijxij

πi + πj

πjπi + πj

)nij−xij

確率をパラメータ π1, . . . , πN の関数と見たものが尤度関数．

16 / 33

対数尤度 (パラメータ π1, . . . , πN の関数)xji = nij − xij だから

logN−1∏i=1

N∏j=i+1

(nijxij

πi + πj

πjπi + πj

)nij−xij

= logN−1∏i=1

N∏j=i+1

(nijxij

)(πi + πj)

−nijπxiji πj

N−1∏i=1

N∏j=i+1

(nijxij

)(πi + πj)

−nij

(N∏i=1

∏j :j ̸=i

πxiji )

N−1∑i=1

N∑j=i+1

(nijxij

N−1∑i=1

N∑j=i+1

nij log(πi + πj) +N∑i=1

∑j :j ̸=i

xij log πi .

17 / 33

第１項はパラメータに関係がないので C とおき，Ti :=

∑j :j ̸=i xij とおくと，対数尤度関数は，

C −N−1∑i=1

N∑j=i+1

Ti log πi .

Ti (i = 1, . . . ,N) は十分統計量．

制約N∑i=1

πi = N.

18 / 33

ラグランジュの未定乗数法

ラグランジュ関数

C −N−1∑i=1

N∑j=i+1

Ti log πi − λ(N∑i=1

πi − N)

を π1, . . . , πN , λ で偏微分して 0 とおいて得られる式を解く．

19 / 33

πi で偏微分して得られる式

πi−

∑j :j ̸=i

nijπi + πj

− λ = 0 (1)

λ で偏微分して得られる式

N∑i=1

πi = N. (2)

(1), (2) を解けば良い．

20 / 33

(1)よりTi =

∑j :j ̸=i

nijπi

πi + πj+ λπi

左辺を i について和をとる．チーム i の勝数の i に関する和はゲームの総数に等しいから，

Ti =N−1∑i=1

N∑j=i+1

右辺を i について和をとる．

N−1∑i=1

∑j :j ̸=i

nijπi

πi + πj+ λ

N∑i=1

πi =N−1∑i=1

N∑j=i+1

nij + λ

N∑i=1

したがって λ = 0.

21 / 33

したがって，(1), (2) の代わりに∑j :j ̸=i

nijπi

πi + πj= Ti

N∑i=1

πi = N

を解けば良い．陽には解けないので数値的に解く必要がある．

ここでは簡便な反復法を用いる．

書き換え

πi =Ti∑

j :j ̸=i

πi + πj

N∑i=1

πi = N.

22 / 33

初期値 π̂(0)1 , . . ., π̂

(0)N を適当に設定．

π̃(1)i =

Ti∑j :j ̸=i

π̂(0)i + π̂

π̂(1)i =N

π̃(1)i∑N

i=1 π̃(1)i

これを繰り返して π̂(1)i , π̂

(2)i , . . . と更新して行くと

liml→∞

π̂(l)i = π̂i

が成立することが知られている．

23 / 33

数値例表．３人のプレイヤーの対戦結果．プレイヤー i がプレイヤー j に勝利した回数 xij .例えば，x12 = 7.

n12 = n13 = n23 = 10.

T1 = x12 + x13 = 7 + 8 = 15,

T2 = x21 + x23 = 3 + 5 = 8,

T3 = x31 + x32 = 2 + 5 = 7.

24 / 33

以下を解けば最尤推定値が求まる．

π1 =3

π1+π2+ 1

π1+π3

π2 =4

π2+π1+ 1

π2+π3

π3 =7

π3+π1+ 1

π3+π2

3∑i=1

πi = 3.

25 / 33

初期値 π̂(0)1 = 1, π̂

(0)2 = 1, π̂

(0)3 = 1.

π̃(1)1 =

1+1 + 11+1

π̃(1)2 =

1+1 + 11+1

π̃(1)3 =

1+1 + 11+1

26 / 33

和が 3 になるように正規化

π̂(1)1 =

3π̃(1)1

π̃(1)1 + π̃

(1)2 + π̃

32 + 4

5 + 710

= 30323010

同様に

π̂(1)2 =

5, π̂

(1)3 =

１回目の更新が終了.

以下収束するまで繰り返す．

π̃(2)1 =

3/2+4/5 + 13/2+7/10

115+810 + 15+7

27 / 33

収束の様子

l π̂(l)1 π̂

(l)2 π̂

0 1.000000 1.000000 1.0000001 1.500000 0.800000 0.700000 16 1.799039 0.644140 0.5568212 1.665950 0.717395 0.616656 17 1.799043 0.644138 0.5568193 1.735875 0.679141 0.584984 18 1.799045 0.644137 0.5568184 1.768215 0.661194 0.570591 19 1.799046 0.644136 0.5568185 1.783801 0.652558 0.563642 20 1.799046 0.644136 0.5568186 1.791460 0.648323 0.560217 21 1.799047 0.644136 0.5568187 1.795259 0.646225 0.558516 22 1.799047 0.644136 0.5568188 1.797153 0.645180 0.557667 23 1.799047 0.644136 0.5568189 1.798099 0.644658 0.557242 24 1.799047 0.644136 0.556817

10 1.798572 0.644397 0.557030 25 1.799047 0.644136 0.55681711 1.798809 0.644267 0.556924 26 1.799047 0.644136 0.55681712 1.798928 0.644201 0.556871 27 1.799047 0.644136 0.55681713 1.798987 0.644169 0.556844 28 1.799047 0.644136 0.55681714 1.799017 0.644152 0.556831 29 1.799047 0.644136 0.55681715 1.799032 0.644144 0.556824 30 1.799047 0.644136 0.556817

28 / 33

実装

アルゴリズムの実装は難しくない．

簡単な例であれば電卓でも計算可能．

フリーの統計解析用プログラミング言語 R などを使うと容易．

R については多くの情報が RjpWiki などインターネットで入手できる．また，竹村 (2007) も参考になる．

29 / 33

Bradley–Terry モデルの赤池情報量規準（AIC）定義

AIC := −2×最大対数尤度+ 2×パラメータ数.

Bradley–Terry モデルのパラメータ数: N − 1

−2 logN−1∏i=1

N∏j=i+1

(nijxij

)(π̂i

π̂i + π̂j

π̂jπ̂i + π̂j

)nij−xij

+ 2× (N − 1)

=− 2N−1∑i=1

N∑j=i+1

(nijxij

N−1∑i=1

N∑j=i+1

nij log(π̂i + π̂j)

− 2N∑i=1

∑j :j ̸=i

xij log π̂i + 2(N − 1).

30 / 33

その他のモデル 1 すべてのプレイヤーの強さが等しい

すべての対戦組合せ (i , j) (i < j) でプレイヤー i が勝つ確率が 12 .

パラメータ数は 0．

−2 logN−1∏i=1

N∏j=i+1

(nijxij

)xij(1

)nij−xij

+ 2× 0

=− 2 logN−1∏i=1

N∏j=i+1

(nijxij

=− 2N−1∑i=1

N∑j=i+1

(nijxij

)+ (2 log 2)

N−1∑i=1

N∑j=i+1

31 / 33

その他のモデル 2 フルモデル

すべての対戦組合せ (i , j) (i < j) についてプレイヤー i が j に勝つ確率 pij をパラメータとするモデル.

パラメータ数は N(N − 1)/2．

パラメータ pij の最尤推定値は p̂ij =xijnij

−2 logN−1∏i=1

N∏j=i+1

(nijxij

)p̂xijij (1− p̂ij)

nij−xij + 2× N(N − 1)

=− 2N−1∑i=1

N∑j=i+1

(nijxij

)+ xij log

xijnij

+ (nij − xij) log

xijnij

)}+ N(N − 1).

32 / 33

参考文献

竹内啓，藤野和建 (1988) スポーツの数理科学，共立出版．

竹村彰通 (2007) 統計第２版, 共立講座 21世紀の数学 14,共立出版．

33 / 33

統計モデルの数理 - 東京大学Bradley{Terry モデル(BTモデル)...

Documents

ビッグデータビジネスへの期待と課題 - Japan Cloud...ビッグデータビジネスへの期待と課題 M2M・ビッグデータWG シンポジウム「M2M・ビッグデータの将来像」

ProENGEERによるモデル作成と製図の操作説明資料

デバイスファームウェアの管理 - Cisco · デバイスパッケージをインストールして、新しい電話タイプを導入し、複数の電話モデルのファー

PRR説明資料 9QM3-163 将来無人車システムの研究

HASLユーザー会発表資料Herschel-Bulkley の式 Shear rate 非ビンガム体 y K n 1 n y * 1 0 0 1 / ＜Herschel-Bulkley モデルの変形版＞ Herschel-Bulkley Cross モデル

非静力学モデルJMA-NHMwind.geophys.tohoku.ac.jp › ~sawada › main › main.pdf5 第1章はじめに 2009/11/20 加筆・修正このマニュアル（？）は非静力モデルの使い方、及びモデルに関するメモを記述し

参考3 鶴見区将来ヴィジョン - Osaka1 鶴見区将来ヴィジョン【2018年度（平成30年度）～2022年度】策定にあたって「鶴見区将来ヴィジョン」は、鶴見区のめざす将来像とその実現に向けた施策展

40歳台ITエンジニアの将来に向けた次の一手

› lecture › ComputerGraphics2 › ComputerGraphics2_7.pdf 7. 3次元形状モデル - info.shonan-it.ac.jp7.1 形状モデルのデータ構造立体の表現 1. オブジェクトの各面にある4つの直線が，それぞれの四角形の面の境界であ

ネットワークアーキテクチャ• client ‐serverモデル – 二者間の通信モデル • 最初にどのように通信をはじめるかの役割分担 – 能動側と受動側

製品概要 - Cisco...製品概要 •スイッチのモデル（1ページ） •ファントレイアセンブリ（17ページ） •電源モジュール（20ページ）スイッチのモデル

Jubatusから未来の分散インテリジェンスへ · Jubatusは各サーバーのモデル情報を「緩やか」に共有するデータ体は共有せず、モデルのみ共有する

農業経営モデルの例示 - maff.go.jp...1 農業経営モデルの例示経営展望別冊資料（注）現時点のものであり、今後変更の可能性がある資料3－2

Nikon EN-EL14のリチウムイオン電池のSPICEモデル作成方法

ISO/IEC 25010の品質モデルを使って市場不具合を減らすテス …ISO/IEC 9126の品質モデルを使ったテスト設計手法を使用している。ISO/IEC 25010の品質モデルを使ったテスト設計手

需要予測モデル等の再構築等 - Cabinet Office3-1 需要予測モデル等の再構築等平成 26 年度調査の課題（県民需要予測モデルの再構築および県外来訪者需要予測モデルの精査の

「数理モデル」ushio/rstat/20101210MathModel.pdf今日のお話 •数理モデルってどんなものか？•どんな風に使えるか？•実証研究のモデル化 –高巣さん微生物ループへのウイルスの効果

encoder-decoderモデルによる対話応答生成の特性 … › publications › 2019 › mthesis...2018/03/09 · encoder-decoderモデルによる対話応答生成の特性分析

Benjamin-Kharkats静電連続体モデル[1]による液液 …...Benjamin-Kharkats静電連続体モデル[1]による液液界面の電子移動反応の解析理論の面では、連続誘電体モデルの範囲内でKharkats[6]による1次元モデル、

将棋教室の様子 - town.hachirogata.akita.jp · 将棋教室の様子小学校では、7月25日の大会に向けて将棋を学んでいます。大会の詳細は 4ページをご覧ください。