2016年11月20日日曜日

『史上最強図解 これならわかる! ベイズ統計学』

史上最強図解 これならわかる!ベイズ統計学
涌井 良幸 涌井 貞美
ナツメ社
売り上げランキング: 33,414
  • ベイズの定理
  • ベイズの基本公式
  • ベイズの展開公式
  • ベイズ理論の計算の3ステップ
  • 理由不十分の原則
  • ベイズ更新
  • 検査の問題
  • ナイーブ・ベイズ・フィルター
  • 確率分布のベイズ推定
  • ベイジアンネットワーク
  • ベイズ統計学
ベイズの定理
P(A|B)=P(B|A)P(A)P(B)

「ベイズの定理」の解釈の違いにより、ベイズ確率論とベイズ統計論に分かれる。

ベイズ確率論 A・・・原因
B・・・結果
ベイズ統計論 A・・・確率分布の母数
B・・・データ

統計学 従来の統計学(頻度論)
  • ネイマンとピアソンが完成させた。
  • 頻度論者は、不厳密で曖昧なベイズ理論を否定。
ベイズ統計学
  • トーマス・ベイズが「ベイズの定理」を導き出した。
  • 欠点だった「不厳密・曖昧」が長所に。
  • 「経験」や「常識」を取り込んだデータ処理が可能に。

データへの対応 母数(平均,分散,など)
従来の統計学 たくさんある中の一つとして扱う 母集団固有の唯一値を仮定
ベイズ統計学 一期一会的に扱う 確率変数であり、その分布を調べようとする
「条件付き確率」と「同時確率」
条件付き確率 P(B|A) 事象Aが起こったという条件のもとで事象Bが起こる確率。
同時確率 P(B∩A) 事象Aと事象Bが同時に起こる確率。
条件付き確率
P(B|A)=P(AB)P(A)
確率の乗法定理
P(AB)=P(A)P(B|A) P(AB)=P(B)P(A|B)
ベイズの定理
P(A|B)=P(B|A)P(A)P(B) BA確率=AB確率×A確率B確率
ベイズの基本公式
P(H|D)=P(D|H)P(H)P(D)
  • ベイズの定理のAやBの解釈を変える。
    • A → 原因や仮定(Hypothesis)
    • B → 結果やデータ(Data)
  • ベイズの基本公式は、原因から結果をたどるように変換してくれる。
  • 左辺P(H|D)は、「データDが得られたときの原因がHである」条件付き確率
ベイズの展開公式

データDは原因H1, H2, ... Hn のどれか1つから生まれると仮定する。 このときデータDが得られたとき、その原因Hiである確率P(Hi|D)は、

P(Hi|D)=P(D|Hi)P(Hi)P(D|H1)P(H1)+P(D|H2)P(H2)++P(D|Hn)P(Hn)

事後確率=尤度×事前確率

P(Hi|D) 事後確率
Posterior Probability
データDが原因Hiから得られた確率
P(D|Hi) 尤度
(ゆうど)
likelihood
原因HiのもとでデータDが得られる確率
P(Hi) 事前確率
Prior Probability
データDを得る前の原因Hiの確からしさ
ホテルのアナロジー

国際ホテルの部屋 H1, H2, ... Hn に泊まっている客を任意に選ぶ。 選ばれた客が日本人である事象を D とする。


事後確率 P(Hi|D) 「日本人が選ばれたとき、彼が部屋Hiから来た」確率
尤度 P(D|Hi) 「部屋Hiの中で、日本人が選ばれる」確率
事前確率 P(Hi) 一人が選ばれる前の「部屋Hiの選ばれやすさ」
ベイズ理論の計算の3ステップ
  1. モデル化し、それから尤度を算出
  2. 事前確率を設定
  3. ベイズの展開公式を用いて事後確率を算出
壺の例題
H1取り出した玉が壺1からのものである
H2取り出した玉が壺2からのものである
H3取り出した玉が壺3からのものである
R 取り出した玉が赤(Red)である



事後確率
P(H1|R)取り出した玉が赤のとき、それが壺1から来た確率
P(H2|R)取り出した玉が赤のとき、それが壺2から来た確率
P(H3|R)取り出した玉が赤のとき、それが壺3から来た確率これを求めたい
尤度
P(R|H1)壺1から取り出された玉が赤である確率1/3
P(R|H2)壺2から取り出された玉が赤である確率2/3
P(R|H3)壺3から取り出された玉が赤である確率3/3
事前確率
P(H1)壺1が選ばれる確率3/6
P(H2)壺2が選ばれる確率2/6
P(H3)壺3が選ばれる確率1/6


P(Hi|D)=P(D|Hi)P(Hi)P(D|H1)P(H1)+P(D|H2)P(H2)++P(D|Hn)P(Hn)

P(H3|D)=P(R|H3)P(H3)P(R|H1)P(H1)+P(R|H2)P(H2)+P(R|H3)P(H3)

P(H3|D)=33×16(13×36)+(23×26)+(33×16)=310

理由不十分の原則

「何も情報がなければ確率は同等」という発想。

前の例題では事前確率(それぞれの壺の選ばれやすさ=3 : 2 : 1)が与えられていたが、与えられていない場合は「理由不十分の原則」に従い、以下のようになる。

事前確率
P(H1)壺1が選ばれる確率1/3
P(H2)壺2が選ばれる確率1/3
P(H3)壺3が選ばれる確率1/3
ベイズ更新

1回目のデータ解析で得られた事後確率を、2回めのデータ解析の際の新たな事前確率として利用すること。

例題. 「真珠 → 真珠 → ガラス」の場合、箱がA社製である確率は?


尤度
真珠 P(S|HA)3/4
P(S|HB)1/4
ガラスP(G|HA)1/4
P(G|HB)3/4
1回目の解析
事前確率(理由不十分の原理より)
P(HA)1/2
P(HB)1/2
事後確率
P(HA|S)34×12(34×12)+(14×12)=34
P(HB|S)14×12(34×12)+(14×12)=14
2回目の解析
事前確率 (1回目の事後確率より)
P(HA)3/4
P(HB)1/4
事後確率
P(HA|S)34×34(34×34)+(14×14)=910
P(HB|S)14×14(34×34)+(14×14)=110
3回目の解析
事前確率 (2回目の事後確率より)
P(HA)9/10
P(HB)1/10
事後確率
P(HA|S)14×910(14×910)+(34×110)=912=75%
P(HB|S)34×110(14×910)+(34×110)=312=25%

事後確率の変動と「信念」の揺らぎとが、よく似通っている。ベイズの論理が人間心理をよく表現する、と言われれる所以。

ベイズ更新による逐次合理性

データが同じであれば解析順序に依らないことが保証されている。 前の例題では「真珠 → 真珠 → ガラス」であったが、「真珠 → ガラス → 真珠」でも「ガラス → 真珠 → 真珠」でも結果は同じになる。

検査の問題
  • 病気にかかっている人が検査Tを受ける  → 98%の確率で病気であると「正」判定される。
  • 病気にかかっていない人が検査Tを受ける →  5%の確率で病気であると「誤」判定される。
  • 人全体でその病気にかかっている人 =  3%
  • 人全体でその病気にかかっていない人= 97%
  • 無作為に抽出した1人に検査Tを受けさせ、病気であると判定された場合、この人が実際に病気にかかっている確率は?
  • つまり求めたいのは、事後確率 P(病人|陽性) 。
尤度
P(D|H1) = P(陽性|病人)0.98
P(D|H2) = P(陽性|健康)0.05
事前確率
P(H1) = P(病人)0.03
P(H2) = P(健康)0.97
事後確率
P(H1|D) = P(病人|陽性)
P(H2|D) = P(健康|陽性)


P(病人|陽性)=P(陽性|病人) P(病人)P(陽性|病人) P(病人)P(陽性|健康) P(健康)

0.98×0.030.98×0.03+0.05×0.97=37.7%

基準率の無視

人は尤度に目を奪われ事前確率に疎くなってしまう。

ナイーブベイズフィルター

「文書やメールの中の単語はすべて独立」という苦しい仮定(ナイーブな仮定)の基、文書やメールをフィルタリングする方法。

確率分布のベイズ推定

中の見えない1つの壺。
赤玉と白玉が合計3つ入っている。
「無作為に取り出し、元に戻す」を2回行なった。
すると、2回続けて赤玉が出た。
壺の中の赤玉の個数の確率分布は?

3種類の壺があると仮定する。

  • H1 = 赤玉が1個入った壺
  • H2 = 赤玉が2個入った壺
  • H3 = 赤玉が3個入った壺
つまり、尤度は
  • P(R|H1) = 1/3
  • P(R|H2) = 2/3
  • P(R|H3) = 3/3
である。

「理由不十分の原理」より事前確率を
  • P(H1) = 1/3
  • P(H2) = 1/3
  • P(H3) = 1/3
とし、1回目の解析を行なう。

1回目は赤玉が出たので、「ベイズの展開公式」より、その事後確率は
  • P(H1|R) = 1/6
  • P(H2|R) = 1/3
  • P(H3|R) = 1/2
となる。

次に、2回めの解析を行なう。

尤度は変わらない。

事前確率は、1回めの事後確率を使用する。
  • P(H1) = 1/6
  • P(H2) = 1/3
  • P(H3) = 1/2

2回目も赤玉が出たが、「ベイズの展開公式」より、その事後確率は
  • P(H1|R) = 1/14
  • P(H2|R) = 2/7
  • P(H3|R) = 9/14
となる。

2回目の事後確率より、壺の中の赤玉の期待値
  • (1 * 1/14) + (2 * 2/7) + (3 * 9/14) = 2.57 [個]
となる。

また、原因H3の事後確率が最大であることから、壺の中の赤玉の個数のMAP推定値
  • 3 [個]
となる。

MAP推定

事後確率が最大な原因を真の原因と推定する方法。
Maximum ap posteriori

ベイジアンネットワーク
「泥棒と警報機」の例題

以下の振動に反応する警報機(Alarm)がある。

  • 泥棒(Burglar)
  • 地震(Earthquake)


警報機(Alarm)が作動すると、以下のどちらか、または両方に通報される。
  • 警察(Police)
  • 警備会社(Security)


問1.警報機(Alarm)が作動したとき、原因が泥棒(Burglar)である確率 P(B|A) は?

問2.警備会社(Secutiry)に通報が来たとき、原因が泥棒(Burglar)である確率 P(B|S) は?

問1.警報機(Alarm)が作動したとき、原因が泥棒(Burglar)である確率 P(B|A) は?

ベイズの定理より
P(B|A)=P(A|B)P(B)P(A)

上式の

  • P(A|B)・・・泥棒が入ったときに警報機が鳴る確率
  • P(B)・・・泥棒が入る確率
  • P(A)・・・警報機が鳴る確率
をそれぞれ求める。

公式より
P(A|B)=P(A|B,E)P(E)+P(A|B,E¯)P(E¯) (カンマは同時確率∩の意味)

表より
P(A|B)=0.95 * 0.02 + 0.94 * 0.98 = 0.9402

表より
P(B) = 0.01

P(A)=P(ABE)+P(ABE)+P(ABE)+P(ABE¯)

「確率の乗法定理」とか「BとEが独立である事実〜P(B∩E)=P(B)P(E)」とか表より
P(A) = 0.0092166

以上より、
P(B|A) = 10.2%

ベイズ統計学のための準備
確率分布
一様分布
確率密度関数 f(x)=1b-a   (axb)
平均値 μ=a+b2
分散 σ2=(a-b)212

ベルヌーイ分布
確率密度関数
平均値 μ=p
分散 σ2=p(1-p)

正規分布
確率密度関数 f(x)=12πσe-(x-μ)22σ2
平均値 μ
分散 σ2
ベータ分布
確率密度関数 f(x)=kxp-1(1-x)q-1
(kは定数、p,qは正の定数、0<x<1)
平均値 μ=pp+q
分散 σ2=pq(p+q)2(p+q+1)
モード M=p-1p+q+1

ベイズ統計学
従来の統計学 母数(平均や分散)は定数。
その値が問題になる。
ベイズ統計学 母数(平均や分散)は確率変数。
その分布が問題になる。

母数をθiとすると、
P(θi|D)=P(D|θi)P(θi)P(D|θ1)P(θ1)+P(D|θ2)P(θ2)++P(D|θn)P(θn)

P(θi|D) 事後確率 データDが得られたとき、それが母数θiの確率分布から得られた確率
P(D|θi) 尤度 母数θiの確率分布のもとで、データDが得られる確率
P(θi) 事前確率 データDを得る前の母数θiの生起確率

分母はデータDを得るときの確率P(D)である。
k=1P(D)
とすると、
P(θi|D)=k P(D|θi)P(θi)

母数を離散的ではなく連続的であると捉えると、

離散的 連続的
事後確率 P(θi|D) 事後分布 π(θ)
尤度 P(D|θi) 尤度 f(D|θ)
事前確率 P(θi) 事前分布 π(θ|D)

ベイズ統計学の基本公式が得られる。
π(θ|D)=kf(D|θ)π(θ)



π(θ|D) 事後分布 データDが得られたとき、それが母数θiの確率分布から得られた確率
kf(D|θ) 尤度 母数θiの確率分布のもとで、データDが得られる確率
π(θ) 事前分布 データDを得る前の母数θiの生起確率

ベイズ統計学の具体例
例①

内容量xは正規分布に従う。
分布はである。
製品1つを抽出したら、内容量xは101グラムであった。
この工場から作られる製品内容量の「平均値μの確率分布」(μの確率密度関数)は?

【答】
「ベイズ統計学の基本公式」に代入する。
π(θ|D)=kf(D|θ)π(θ)

π(μ|x=101)=kf(x=100|μ)π(μ)

π(μ|x=101) 事後分布 内容量x=101グラムが得られたとき、それが平均値μの確率分布から得られた確率
f(x=101|μ) 尤度 平均値μの確率分布(正規分布)のもとで、内容量x=101グラムが得られる確率
=12πe-(x-μ)22=12πe-(101-μ)22
π(μ) 事前分布 内容量x=101グラムを得る前の平均値μの生起確率
「理由不十分の原則」より、一様分布を仮定する。
=1

以上より事後分布は、
π(μ|x=101)=12πe-(101-μ)22

尤度 平均値μの正規分布(分散12)(確率密度関数)において、101が得られる確率。
×
事前分布 なにも情報がない状態なので、一様分布を仮定する。
||
事後分布 事前分布が一様分布なので、形は尤度と同じ。
x軸はμ。
平均値μの確率分布。
平均値μは101である確率が最も大きい。
例② データがベルヌーイ分布に従うとき

表の出る確率がθであるコインを投げた。
1回目・・・表
2回目・・・表
3回目・・・表
4回目・・・裏
「表が出る確率θ」の確率分布(事後分布)は?


【答】
■尤度(母数θである確率分布において、表が出る確率)

f(表|θ) = θ
f(裏|θ) = 1 - θ
(↑ベルヌーイ分布)

■1回目の事前分布(コインを投げる前の「表の出る確率θ」がどんな値になるかの確率)

「理由不十分の原則」より
π0(θ) = 1
(↑一様分布)

■1回目の事後分布

ベイズ統計学の基本公式より、
π(θ|D) = kf(D|θ)π(θ)

1回目は表だから、
π1(θ|表) = k1f(表|θ)π(θ)

尤度・事前分布に具体的な値を代入すると、
π1(θ|表) = k1θ
確率の総和は1になるので(規格化条件)、
01π1(θ|)dθ=01k1θdθ=1
k1 = 2
よって1回目の事後分布は
π1(θ|表) = 2θ


■2回目の事前分布

1回目の事後分布である。
π1(θ|表) = 2θ

■2回目の事後分布

ベイズ統計学の基本公式より、
π(θ|D) = kf(D|θ)π(θ)

1回目は表だから、
π2(θ|表) = k2f(表|θ)π(θ)

尤度・事前分布に具体的な値を代入すると、
π2(θ|表) = k2 × θ × 2θ
π2(θ|表) = 2k2θ2

確率の総和は1になるので(規格化条件)、
k2 = 3/2

π2(θ|表) = 3θ2


■3回目の事前分布

2回目の事後分布である。
π2(θ|表) = 3θ2

■3回目の事後分布

ベイズ統計学の基本公式より、
π(θ|D) = kf(D|θ)π(θ)

3回目は表だから、
π3(θ|表) = k3f(表|θ)π(θ)

尤度・事前分布に具体的な値を代入すると、
π3(θ|表) = k3 × θ × 3θ2
π3(θ|表) = 3k3θ3

確率の総和は1になるので(規格化条件)、k3が求まり、
π3(θ|表) = 4θ3


■4回目の事前分布

3回目の事後分布である。
π3(θ|表) = 4θ3

■4回目の事後分布

ベイズ統計学の基本公式より、
π(θ|D) = kf(D|θ)π(θ)

4回目は裏だから、
π4(θ|裏) = k4f(裏|θ)π(θ)

尤度・事前分布に具体的な値を代入すると、
π4(θ|裏) = k4 × (1 - θ) × 4θ3
π4(θ|裏) = 20θ3(1 - θ)

事後分布を最大にするθは、
θ = 3/4 = 0.75

MAP推定より、「表の出る確率θ」の推定値は
3/4 である。

4回投げて3回表だから当たり前か。


■まとめ

1回目の事前分布 π0(θ) = 1
1回目の事後分布
2回目の事前分布
π1(θ|表) = 2θ
2回目の事後分布
3回目の事前分布
π2(θ|表) = 3θ2
3回目の事後分布
4回目の事前分布
π3(θ|表) = 4θ3
4回目の事後分布 π4(θ|裏) = 20θ3(1 - θ)


【別解】
尤度をまとめれば一発で事後確率が求まる。

■尤度
f(表表表裏|θ) = θ3(1-θ)

■事後確率
π(θ|表表表裏) = k × f(表表表裏|θ) × π(θ)
= k × θ3(1-θ) × 1
= 20θ3(1-θ)

例③ データが正規分布に従うとき

内容量xグラムは正規分布に従い、分散は12
製品を3つ調べた。
1回目・・・ 99グラム
2回目・・・101グラム
3回目・・・103グラム
内容量xの「平均値μの確率分布」は?


【答】
■尤度
まとめて求める。
f(90,101,103|μ) = 略(正規分布になる)

■事前分布
とりあえず、なだらかな正規分布を仮定する。

■事後分布
略 (正規分布になる)

自然な共役分布

ある分布に従うデータに対して、事前分布に特定の分布を指定すると、事後分布が事前分布と同じになる関係を「自然な共役分布の関係」という。

データの分布 事前分布 事後分布
ベルヌーイ分布 ベータ分布 ベータ分布
正規分布 正規分布 正規分布
正規分布 逆ガンマ分布 逆ガンマ分布
ポアソン分布 ガンマ分布 ガンマ分布
史上最強図解 これならわかる!ベイズ統計学
涌井 良幸 涌井 貞美
ナツメ社
売り上げランキング: 33,414