ベイズの定理
いま、ベイズの定理が熱い。古典的確率論の一つの定理であるが、現在、検索エンジン
でよく利用される Google の高いヒット率を支えたり、Intel や Microsoft
におけるアプリ
ケーション開発の数学的基礎として注目を集めているらしい。
どのような形でベイズの定理が応用されるのか、大いに興味があるが、浅学の身で想像
の域を越えない。ベイズの定理自身は驚くほど単純で、ある方は定理そのものは覚えなく
てもいいと断言するくらい、自ら直ぐに導ける程度のものである。
ここでは、このベイズの定理について、いくつかの話題を眺めてみようと思う。
「5回に1回の割合で帽子を忘れるくせのあるK君が、正月に A、B、C 3軒を順に年始
回りをして家に帰ったとき、帽子を忘れてきたことに気がついた。2軒目の家 B に忘れて
きた確率を求めよ。」
これは、以前、早稲田大学で出題された入試問題である。
(平成26年2月9日付けで、よおすけさんから、1976年に文学部が出題したものとご教示いただきました。
よおすけさんに感謝します。)
「帽子を忘れたこと」に現在気づき、その原因となる過去の事実「Bで忘れたこと」の確率
を問うもので、当時は、とてもセンセーショナルな問題であった。
果たして何人の受験生が条件つき確率の問題ととらえ、正しく答えられたのか、大いに
興味があるところである。(正直に告白すると、この問題を初めて見たとき、それまで経験
してきた確率の問題とは異なる雰囲気に、ある種の戸惑いを感じたことを覚えている。)
このような問題に対しては、ベイズの定理が活躍する。
確率の計算で、事象 A が起こったという条件のもとに考える事象 B の確率は、A
のもと
での B が起こる条件つき確率といわれ、記号で PA(B) と書かれる。
(P(B|A)という書き方もあるが、記号的に好きではないので、ここでは用いない。)
この条件つき確率というのは、新たな起こりうる全ての場合を事象 A とし、そのうちの
B
の起こる事象 A∩B の割合を求めるものである。
よって、
が成り立つ。
このページで話題とするベイズの定理は、これとは逆に、PB(A) という確率を求めるた
めの公式である。
すなわち、A という原因で B が起こったときに、その原因の起こる確率を求めようとする
ものである。
そこで、P(A) を原因 A の存在確率(事前確率)、PB(A) を原因の確率(事後確率)と
もいう。
また、PB(A) には、次のような解釈もできる。
何も手持ちの情報がない状態では、Aのおこる確率は、P(A)であるが、結果として、Bが
起こった以上、Aのおこる確率を再評価する必要がある。その確率が、PB(A) である。
いま、事象 B は、互いに排反な事象 A1、A2、・・・、An のどれかが起こったときに、初め
て起こるものとする。ただし、P(A1)+P(A2)+・・・+P(An)=1 とする。
このとき、
が成り立つ。 これを、ベイズの定理(1764年)という。
(トーマス・ベイズ(1710〜1761)は、イギリスの確率論研究家で、彼の最も重要な論文
Essay Toward Solving a Problem in the Doctorine of Chances
は、死後3年たった1764年になって初めて出版された。)
上記は、何やら難しそうな形をしているが、結局のところ、
と書いた方が覚えやすいかもしれない。この式に、
を代入すれば、ベイズの定理が成り立つことは、ほとんど明らかであろう。
冒頭の早稲田大学の問題は、次のように解かれる。
帽子を忘れるという事象を、E とすると、求める確率は、PE(B) である。
このとき、
P(E)=P(A)+P(B)+P(C)
=1/5+(4/5)×(1/5)+(4/5)×(4/5)×(1/5)=61/125 で、
P(E∩B)=P(B)=(4/5)×(1/5)=4/25
よって、 PE(B)=20/61 となる。
(追記) この問題について、当HPの掲示板「出会いの泉」に、HN「kaze」さんから質問の
書き込みがあった。(平成23年5月13日付け)
はじめまして。上記の問題を見たとき、「Aで忘れる確率が1/5、Bで忘れるのは、Aで忘れ
ず、Bで忘れている確率」と思い、
P(E∩B)=P(B)=(4/5)×(1/5)=4/25 (16%)
と考えたのですが、間違っているでしょうか?
単純に忘れる確率が、20%なのに、Bに忘れる確率が、 PE(B)=20/61 (32.8%) と上
がってしまう理由がわかりません。
この「kaze」さんの質問に対して、当HPがいつもお世話になっているHN「らすかる」さんが
答えられた。(平成23年5月13日付け)
もし問題が、
「5回に1回の割合で帽子を忘れるくせのあるK君が、正月に、A、B、C 3軒を順に年始回
りをして家に帰ったとき、2軒目の家 B に忘れてくる確率を求めよ。」
だとすると、4/25(16%)が正解になりますが、この16%というのは、「どの家にも帽子を忘
れてこない場合」がある場合です。
つまり、 (1) Aに忘れる→20% (2) Bに忘れる→16% (3) Cに忘れる→12.8%
そして、 (4) 忘れない→51.2%
となりますね。しかし問題は、「帽子を忘れた場合」という条件がついていますから、(4)はあ
り得ず、(1)〜(3)の合計が100%となるように、すべて定数倍しなければいけないわけです。
(1) : (2) : (3) = 25 : 20 : 16 ですから、(2)は 20/61 となりますね。
(コメント) 帽子をかぶって家を出て年始回りを終えて家に帰っても、帽子のことに無頓着
で、帽子をかぶっているのかいないのか全く不明な場合は、「kaze」さんの計算で
いいのですが、問題では家に帰って頭に手をやって帽子がないことに気づいてし
まったんですね!それで、家に帰って帽子がないという前提で、Bで帽子を忘れた
ことを再評価することが必要になります。忘れたという事実が確定している以上、B
で忘れた確率も増加します。
(参考 → 関連話題「嘘つきの真実」)
ベイズの定理により、ある試行の結果において、ある事象が起こったことが分かったとき、
それに先行する事象の確率を評価することが可能になった。ただ、実際問題として、事前
確率 P(Ak) が不明という場合も少なくない。その場合は、全ての事前確率が等しいとみな
して計算することが多いらしいが、数学的な態度からはあやしいといわざるを得ない。
医学系の入試問題に、「ある病気の検査で陽性になった場合、どの程度心配すべきか」
という類のものが、よく確率分野の問題として出題される。
日本では、ある疾病 M に罹患している割合は、千分の50 と推定されている。この疾病
に罹患しているかどうかを知る検査 T は不完全で、Mに罹患している人は、80
%の割合
で陽性反応が出るが、Mに罹患していない人でも 15 %の割合で陽性反応が出てしまう。
いま、ある人がこの検査を受けて、陽性反応が出た。果たして、この人が疾病 M に罹患
している割合は如何ほどになるであろうか?
(解) E : 陽性反応が出る事象 、M : 疾病 M に罹患している事象 とすると、
求める確率は、 PE(M) である。ここで、
P(E)=P(M∩E)+P(Mc∩E)
=(50/1000)(80/100)+(950/1000)(15/100)=18250/100000
P(M∩E)=4000/100000
したがって、 PE(M)=4000/18250≒0.219 となり、疾病 M に罹患している確率は、
22%位となる。 (終)
陽性反応が出ても、疾病 M に罹患している確率が、22%位にしかならないということは、
本人にとってはかなり微妙な数値で、検査自体があまり意味がないものと判断されるだろう。
(追記) 平成28年12月31日付け
上記の類題をあげておこう。
日本では、ある疾病 M に罹患している割合は、1万分の1と推定されている。この疾病に
罹患しているかどうかを知る検査 T では、Mに罹患している人が陽性と判定される割合も、
Mに罹患していない人を陰性と判定される割合も、ともに99 %であるという。
いま、ある人がこの検査を受けて、陽性反応が出た。果たして、この人が疾病 M に罹患
している割合は如何ほどになるであろうか?
(解) E : 陽性反応が出る事象 、M : 疾病 M に罹患している事象 とすると、
求める確率は、 PE(M) である。ここで、
P(E)=P(M∩E)+P(Mc∩E)
=(1/10000)(99/100)+(9999/10000)(1/100)=989901/1000000
P(M∩E)=99/1000000
したがって、 PE(M)=99/989901≒0.0001 となり、疾病 M に罹患している確率は、
0.01%位となる。 (終)
(コメント) 検査精度が高いので、陽性と判定されても気にすることはないのかな?
上記では、1回だけの検査で判断しているが、このような検査を繰り返してみることは一
般に行われるところである。
ある工場で、製品が規格内である確率が、0、9であるとする。製品を検査するとき、規格
内の製品は、確率0.95で合格と判定され、規格外の製品は、確率0.15で合格と判定さ
れるという。いま、一つの製品が、この検査で2度合格と判定されたとき、この製品が規格
内の製品である確率を求めよ。
(解) E : 1回の検査で合格と判定される事象、M : 製品が規格内である事象 とする。
また、各回の検査は互いに独立事象であると仮定することができる。
2回の検査で、事象 E が2回起こる事象を、E2 で表すとき、求める確率は、 PE2(M)
である。ここで、
P(E2)=P(M∩E2)+P(Mc∩E2)
=(0.9)(0.95)2+(0.1)(0.15)2=3258/4000
P(M∩E2)=3249/4000
したがって、 PE2(M)=3249/3258≒0.997237569 となる。 (終)
このことから、上記の検査で2度合格した製品を「規格品」として失敗するのは、1万個
の製品のうち28個程度ということになる。
これは、1回の検査で判断する場合(PE(M)≒0.982758621)に比べて、格段の信憑
性の上昇である。
因みに、3度の検査で合格した製品が規格品である確率は、0.99956281
4度の検査で合格した製品が規格品である確率は、0.999930945
このように、精度が低い検査方法でも繰り返しという操作を重ねれば、ある程度の精度が
維持できることが分かる。
(追記) 次は、岐阜薬科大学(2015)の入試問題である。「原因の確率」を問う条件付き
確率の問題としては有名であろう。このような問題は、今後も出題される可能性が非
常に高い。無条件に期待値を出題することができなくなったためだ。問題文で期待値
の定義を与え、解かせることは可能のようで、実際にそのような形で出題した大学も
見受けられる。今、司法試験問題漏洩で何かと話題の明治大学だ。
(平成27年9月12日付け)
ある病気Xにかかっている人が4%いる集団Aがある。病気Xを診断する検査で、病気Xにか
かっている人が正しく陽性と判断される確率は、80 %である。また、この検査で病気Xにかか
っていない人が誤って陽性と判断される確率は、10 %である。
(1) 集団Aのある人がこの検査を受けたところ、陽性と判断された。この人が病気Xにかか
っている確率はいくらか。
(2) 集団Aのある人がこの検査を受けたところ、陰性と判断された。この人が実際には病気
Xにかかっている確率はいくらか。
(解) Y:陽性と判断される事象とすると、題意より、
P(X)=0.04、PX(Y)=0.8、PX~(Y)=0.1
なので、 P(Y)=P(X∩Y)+P(X~∩Y)=0.04×0.8+0.96×0.1=0.128
(1) 求める確率は、 PY(X)=P(X∩Y)/P(Y)=0.032/0.128=1/4
(2) 求める確率は、
PY~(X)=P(X∩Y~)/P(Y~)
={P(X)−P(X∩Y)}/P(Y~)=0.008/0.872=1/109 (終)
最近、新納浩幸 著 「数理統計学の基礎」(森北出版)を眺めていたら、面白い問題が
あった。
区別のつかない3つの袋の中に、それぞれ 赤・赤、赤・白、白・白 の2つの球が入っ
ている。
いま、1つの袋を選び、その中から1つの球を取りだしたところ、赤球であった。残りのも
う一つの球が白球である確率を求めよ。
確率の計算に不慣れな場合、もう1個は赤球、白球のどちらかしかないから確率は1/2
と答えがちである。しかしながら、これは、誤りである。
この問題に対して、ベイズの定理は明解に答えてくれる。
Aの袋には、赤・赤、Bの袋には、赤・白、Cの袋には、白・白 の球が入っているものとし、
R:赤球である事象、B:Bの袋である事象 とする。
最初に赤球を取りだし、残りが白球であるということは、Bの袋を選ぶということなので、
求める確率は、PR(B)である。このとき、
PR(B)=P(B∩R)/P(R)
=P(B∩R)/(P(A∩R)+P(B∩R)+P(C∩R))
=(1/3)・(1/2)/((1/3)・1+(1/3)・(1/2)+(1/3)・0)=1/3
となる。
確率が1/2と答えられた方は、多分、残りの赤球、白球が対等で、同様に確からしいと
考えてのことだろう。
しかしながら、実は、残りの赤球、白球は対等の関係にはなっていない。「赤・赤」が曲者
で、「赤1・赤2」と考えれば、残りの球の可能性は、「赤1、赤2、白」となるので、「残りの球
が白である確率は1/3である」ということが理解される。
この問題に対して、新納浩幸 氏は、3つの誤解があると説明している。
(第1の誤解) 赤球を取りだしたということは、最初に選んだ袋は、AまたはBの袋。
残りの球が白ということは、Bの袋を選ぶということ。よって、確率は、1/2
(最初に取りだした球が赤ということから、Aの袋を選んだ可能性の方がBの袋を選んだ可
能性より高い。よって、A、Bを選ぶということは対等の関係にはなっていない。)
(第2の誤解) 最初に赤球、次に白球ということは、Bの袋を選んだということ。よって、確率
は、1/3
(最初に取りだした球が赤で、残りの球も赤という確率は、上記の考え方だと、Aの袋を選
ぶ確率の1/3となるが、実際は、2/3である。)
(第3の誤解) Aの袋(赤1、赤2)、Bの袋(赤3、白1)、Cの袋(白2、白3)とすると、Bの
袋を選ぶということは、赤1、赤2、赤3 から赤3 を選ぶことに等しいので、確率は、1/3
(Aの袋(赤1、赤2、赤3)、Bの袋(赤4、白1)、Cの袋(白2、白3)とする。上記の考え方
だと、求める確率は1/4となるが、実際は、1/3である。)
アメリカのクイズ番組に次のような問題が出されたことがあるということを同僚の方に伺
った。後で調べると、どうも、モンティ・ホール司会のゲームショー「Let's make a deal」
で出題された問題(1990年)らしい。
区別のつかない3つの箱があり、その中に1個だけ、当たりくじの入っている箱がある。
まず、解答者に箱を選んでもらう。司会者は、どの箱に当たりくじが入っているかを知って
いるので、残った2つの箱から当たりくじの入っていない箱を1個だけ取り除く。
そこで、司会者は解答者にたたみかけるように、「選んだ箱を変えるチャンスを1度だけ
あげます!どうしますか?」(日本のテレビだったら、「ファイナルアンサ〜?」とでもいうの
であろうか)
果たして、解答者は箱を変えた方がいいのであろうか?それとも、そのままの方がいい
のであろうか?
この問題も一見すると、箱は2つしかなく、どちらかに当たりくじが入っているので、どちら
を選ぼうとも確率は半々と錯覚しがちである。ある著名な数学者も間違えてしまったらしい。
アメリカのクイズ問題は上記で考えた問題とよく似ている。すなわち、解答者が箱を選ぶ
ということを、「赤球」を選んだという風に考える。(もちろん、白球としてもよい。)そうすると、
司会者が外すべき箱は、白・白の袋に該当し、白球がはずれということになる。
すると、上記の計算から分かるように、選んだ箱に当たりくじが入っている確率は、1/3で、
残っているもう一つの箱が当たる確率が2/3になるので、ここは、当然箱を変えた方がよい
ことになる。
「司会者が必ず当たりくじの入っていない箱を取り除く」というのがポイントで、今選んだ
箱に当たりくじが入っていなければ、司会者は必ず当たりくじの入っている方の箱を残す
ということである。このことからも、箱を変えた方がよいことは了解されるだろう。
このモンティ・ホール問題について、科学雑誌「Newton」(2008年4月号)に特集記事
人はなぜ確率に弱いのか? 直感と計算の「ズレ」にせまる
があり、今野紀雄先生(横浜国立大学)の説明図がとても分かりやすかった。
司会者が箱を取り除く前 | 司会者が箱を取り除いた後 | |
上図を眺めていると、箱を変えた方がよいということが直観的に明らかですね!
(追記) 平成29年8月29日付け
また、別な理解の仕方もある。瀬山士郎先生の「数学よもやま話」を参考にさせていただ
いた。
解答者が1つの箱を選び、司会者が2つの箱を選んだものと考えるのである。このとき、解
答者の当たる確率は1/3で、司会者の当たる確率は2/3である。司会者にとって、当たりで
ない箱がどちらかであることは分かっているので、その箱が手元にあろうが捨ててしまおうが
確率には影響がない。
従って、解答者の当たる確率は1/3、司会者の当たる確率は2/3なので、箱を取りかえた
方がよいことが分かる。
この「3」という数字がこのカラクリにおいて実に巧妙である。箱の個数を10個にしてみる
と、「3」の持つ不思議さが実感できる。
解答者は1つの箱を無作為に選ぶので、当たる確率は、1/10である。司会者は9つの箱
を得るので、司会者が当たる確率は、9/10である。この中から、当たりでない8個の箱を取
り去っても依然として司会者が当たる確率は、9/10である。
従って、解答者は当然箱を司会者のものと交換した方が断然当たる確率は9倍にアップ
する。
この問題と同様の問題が、
「平成教育委員会 2010 !! 新春ウル寅授業SP !! 」(フジTV系 1/3 18:30〜21:09)
の特別授業の第2問に出題された。
3つのお年玉袋があり、そのうちの一つだけにお年玉が入っている。ある人がそのうちの
一つを選んだところ、残りの二つのうちの一つでお年玉が入っていない袋を、何故か教えら
れた。このとき、先ほど選んだ袋を換えてもいいよと言われたとき、換えた方がいいのか悪
いのか、どちらだろうか?
お年玉袋を換えないで当たるということは、もともとお年玉が入っている袋を選んだわけで、
その確率は1/3である。それに対して、お年玉袋を換えて当たるということは最初に選んだ
お年玉袋ははずれで、その確率は2/3になる。このことから、お年玉袋を換えた方が当たり
の確率は大きくなる。
(コメント) 換えない場合と換える場合の確率を比較するところがポイントですね!番組中
のたけし先生の説明がとても分かりやすかったです!
上記のような場面設定では箱を変えた方が有利であるが、例えば、テストの○×の問題
で、分からない問題には適当に○×をつける(多分このような人が多いと思う?)場合、意
外と最初のインスピレーションが正しかったりなんかする。変に考え直して、解答を書き換
えると、「バツ」になる場合が多いように感じる。これは、道案内する適切な司会者がいな
いからだろうか?それとも確率は単なる机上の空論なのであろうか?
次のような問題も興味深い。
Aさんには、2人の子供がいる。あるとき町でAさんにあったら、息子さんと一緒だった。
Aさんのもう一人の子供が男の子である確率を求めよ。
この問題に対して、ベイズの定理は明解に答えてくれる。
Aさんの子供を出生順に並べて、
X:男・男である事象、Y:男・女である事象、Z:女・男である事象、W:女・女である事象
とする。また、M:男の子である事象 とする。
町で出会って、子供の一人が男の子であることが分かって、もう一人の子供も男の子で
あるということは、事象Xが起こるということなので、求める確率は、PM(X)である。
このとき、
PM(X)=P(X∩M)/P(M)
=P(X∩M)/(P(X∩M)+P(Y∩M)+P(Z∩M)+P(W∩M))
=(1/4)・1/((1/4)・1+(1/4)・(1/2)+(1/4)・(1/2)+(1/4)・0)=1/2
この問題に対して、ともすると、求める確率は、1/3 であると答える人がいるかもしれな
い。しかし、それは、誤りである。
X、Y、Z、Wの4通りあり、それらは同様に確からしいとして、Wを除いた
X、Y、Zの3つ
からXを選ぶ確率として、1/3 とするのだろうが、実は、Aさんに息子さんがいるという情
報を得た段階で、X、Y、Z、Wの4通りが同様に確からしいとは言えなくなってしまうのだ。
実際に、PM(X)=1/2、PM(Y)=1/4、PM(Z)=1/4、PM(W)=0 である。
このように、原因の存在確率 P(X)、P(Y)、P(Z)、P(W) は、Mという結果により、
再評価され、原因の確率 PM(X)、PM(Y)、PM(Z)、PM(W) が定まる。
(追記) 上記と同趣旨の問題をGAIさんよりご投稿いただいた。(平成28年10月14日付け)
家には2人の子供がいます。「少なくとも一人は男の子です。」
さて、もう一人が女の子である確率P1は?
更に同様に、「上の子は男の子です。」。さて、もう一人が女の子である確率P2は?
家には3人の子供がいます。「少なくとも一人は男の子です。」
女の子がいる確率P3は?
また、「一番上は男の子です。」。一番下が女の子である確率P4は?
DD++さんからのコメントです。(平成28年10月14日付け)
ヒトの出生比 105:100=21:20 を厳密に正しいと仮定します。
家には2人の子供がいます。「少なくとも一人は男の子です。」
さて、もう一人が女の子である確率P1は?
少なくとも一人が男の子である確率は、 1-(20/41)2
男の子と女の子が一人ずつである確率は、 20/41×21/41×2
よって、 P1 = 20/41×21/41×2/{1-(20/41)2} = 40/61
更に同様に、「上の子は男の子です。」。さて、もう一人が女の子である確率P2は?
P2 = 20/41
家には3人の子供がいます。「少なくとも一人は男の子です。」
女の子がいる確率P3は?
少なくとも一人が男の子である確率は、 1-(20/41)3
男の子と女の子が両方いる確率は、 (20/41)2×21/41×3+(21/41)2×20/41×3
よって、 P3 = {(20/41)2×21/41×3+(21/41)2×20/41×3/{1-(20/41)3} = 820/967
また、「一番上は男の子です。」。一番下が女の子である確率P4は?
P4 = 820/1261
甲南大学の入試問題で次の問題も興味深い。
本当のことを言う確率が80%の人が3人いる。1枚の硬貨を投げたところ、3人とも「表が
出た」と証言した。本当に表が出た確率を求めよ。
(解) 表が出る事象をA、3人とも「表が出た」と証言する事象をBとすると、求める確率は、
PB(A)である。ここで、 P(A)=1/2、PA(B)=(80/100)3=64/125 なので、
P(B)=(1/2)(64/125)+(1/2)(20/100)3=65/250
よって、 PB(A)=(1/2)(64/125)÷65/250=64/65 (終)
産業医科大学(2016)の入試問題も、GAI さんの問題の類題である。3囚人問題と同じ
系列の有名問題らしい。
ちょうど3人の子供がいる家庭を考える。3人の子供が
(男,男,男)、(男,男,女)、(男,女,男)、(男,女,女)、(女,男,男)、(女,男,女)、
(女,女,男)、(女,女,女)
である確率は各々1/8であるとする。この家庭を訪問したところ1人の女の子が顔を出した
として、残りの2人の子供がどちらも男の子である確率を求めよ。
(解) X:男2人+女である事象、W:女の子である事象 とすると、
PW(X)
=P(X∩W)/P(W)
=(3/8)・(1/3)/((3/8)・(1/3)+(3/8)・(2/3)+(1/8)・1)=1/4 (終)
(コメント) 答えは合っているかな?答えが、3/7とならないところがポイントなのだろう。
(追記) 「ベイズの定理と感覚との齟齬」と題して、HN「AKG」さんよりご投稿いただきました。
(令和元年5月3日付け)
統計学を勉強している中で、ベイズの定理に出会いました。これまで確率に対して事前確
率と事後確率という認識がなく、ホウホウと楽しく読んでいたのですが、以下の例題をよんで
眉間にシワが寄りました。
例 題 表と裏の面が赤か青で塗られている3枚のカードA、B、Cがあり、それぞれのカード
の面の色は次のようになっている。
カードA:両面とも青色で塗られている
カードB:片面が赤色、もう片面が青色で塗られている
カードC:両面とも赤色で塗られている。
このカード3枚を袋に入れてよく混ぜて、目をつぶったまま1枚を取り出し、机の上に置い
て目を開けるとカードは赤色だった。
このカードをひっくり返した時、ひっくり返した面が赤色である確率を求めよ。
(統計web様より抜粋)
ベイズの定理に沿って解くと、確率は、2/3であることは分かります。しかし、「表が赤、か
つ、裏が赤」なのは、カードCのみで起きる事象であり、確率は、1/3であるとも思います。
このモヤモヤをどう解決したらよいか、どなたか知恵を貸していただけないでしょうか?
(コメント) 2枚の硬貨を投げるとき、表が1枚出る確率が1/2となる感覚と似ているかも。
表2枚、表裏、裏2枚から求める確率は、1/ 3とするのは誤りで、「表裏」は、表裏
と裏表の2つの場合を考えなければならないので、求める確率は、2/4=1/2
同様にして、与えられたカードの色の出方は、(見えた色,裏の色)の対で考えて、
(青1,青2)、(青2,青1)、(赤,青)、(青,赤)、(赤1,赤2)、(赤2,赤1)
の6通りで考えなければならない。そのうち、見えた色が赤なのは、3通りあり、その中で、
裏の色も赤なのは2通りなので、求める確率は、2/3となり、特段に変わった感覚でもない
ような気がします。
らすかるさんからのコメントです。(令和元年5月3日付け)
ありうるのは、
(1) カードAを引いて表(青)が見えるように置いた
(2) カードAを引いて裏(青)が見えるように置いた
(3) カードBを引いて表(赤)が見えるように置いた
(4) カードBを引いて裏(青)が見えるように置いた
(5) カードCを引いて表(赤)が見えるように置いた
(6) カードCを引いて裏(赤)が見えるように置いた
の6通りであり、この6通りの確率が等しいのは感覚的に問題ないですよね。このうち見えた
のが赤色なのは(3)(5)(6)の3つの場合で、(6通りが等確率なので、(3)(5)(6)の3通りも当然
等確率)そのうちひっくり返して赤になるのは(5)(6)の2通りですから、裏も赤である確率は、
2/3になりますね。
# 次のように考えると、もっと直感的に理解しやすいかも知れません。
カードAかカードCを引く確率は2/3なので、「ひっくり返して色が変わらない確率」は、2/3
よって最初青の場合に裏も青の確率は2/3、赤の場合に裏も赤の確率は2/3
カルピスさんからのコメントです。(令和元年5月4日付け)
横から、素人が、チョッカイ出してスミマセン。ただのボヤキです。
実際にやってみたら、どういう結果になるのかな?300回中、約200回そうなれば・・・
いや、3000回中、約2000回、30000回中、約20000回、・・・・
数を増やすほど、限りなく2/3に近付いていくのかな?実際に、そうならなかったら、ベイ
ズさん、嘘つき。
(追記) 令和2年3月15日付け
令和2年初頭から新型コロナウイルスが世界中に蔓延し、世界保健機構(WHO)がパン
デミックと認定した。庶民の生活にも多大な影響を与え、経済活動でも株価の低下などで
混乱が起こっている。学校も一斉休校で、子供たちの教育を受ける権利を脅かしている。今
年7月に東京オリンピックを控え、どのような対応になるのか大いに注目するところである。
PCR検査は、新型コロナウイルスに感染しているかどうかを検査するもので、症状により
検査結果が分かるまで日数を要する。また、陰性と診断されても再検査すると陽性になった
りと、私自身、その検査の信頼度が怪しく思える。
検査自体100%の信頼度があることは期待できないが、次のような問題を設定し、考えて
みた。
日本では、ある疾病 M に罹患している割合は、10万分の1 と推定されている。この疾病
に罹患しているかどうかを知る検査 T は、Mに罹患している人は、99.99%の割合で陽性
反応が出るが、Mに罹患していない人でも 0.01%の割合で陽性反応が出てしまうという。
いま、ある人がこの検査を受けて、陽性反応が出た。果たして、この人が疾病 M に罹患
している割合は如何ほどになるであろうか?
(解) E : 陽性反応が出る事象 、M : 疾病 M に罹患している事象 とすると、
求める確率は、 PE(M) である。ここで、
P(E)=P(M∩E)+P(Mc∩E)
=(1/100000)(99.99/100)+(99999/100000)(0.01/100)
=19998/1000000000
P(M∩E)=9999/1000000000
したがって、 PE(M)=9999/19998=0.5 となり、疾病 M に罹患している確率は、
50%となる。 (終)
陽性反応が出ても、疾病 M に罹患している確率が、50%程度にしかならないということ
は、罹患している割合が非常に少数というところからの帰結である。罹患している割合が千
分の1まで増加すると、上記の確率は、90.92%となり、罹患しているという事実を重く受
け止めなければならなくなるであろう。
(追記) 「コロナ下において」と題して、GAIさんからご投稿いただきました。
(令和2年12月27日付け)
PCR検査での感度は、感染者を陽性と判定できる確率であり、特異度は非感染者を陰性
と判定できる確率である。
PCR検査の感度は最大70%とされており、感染者の30%は検査で陰性と判定される。
そこで、「病気なのに陰性と判定してしまう確率」を3/10、「病気でないのに陽性と判定して
しまう確率」を1/1000 (100%の特異度はあり得ない)と設定しておく。
現在、統計ではコロナ感染者総数は、約21万人、日本の総人口は約1億2千万人なので、
国民一人当たり7/4000の確率でこのコロナに罹患している設定をとる。
さて、この数値を元に、
(Type1):あなたが検査で陰性と判定されたとき、本当に病気に罹患していない確率P(1)
(Type2):あなたが検査で陽性と判定されたとき、本当に病気に罹患している確率P(2)
はそれぞれどれほどか?
(解) E : 陰性反応が出る事象 、F : 陽性反応が出る事象 、M : 疾病 M に罹患してい
る事象とすると、求める確率は、P(1)=PE(Mc) 、P(2)=PF(M) である。ここで、
P(E)=P(M∩E)+P(Mc∩E)
=(7/4000)(3/10)+(3993/4000)(999/1000)=3991107/4000000
P(Mc∩E)=3989007/4000000
したがって、 P(1)=PE(Mc)=3989007/3991107=0.9994738・・・ となり、疾
病 M に罹患していない確率は、およそ99.9%となる。
また、
P(F)=P(M∩F)+P(Mc∩F)
=(7/4000)(7/10)+(3993/4000)(1/1000)=8893/4000000
P(M∩F)=4900/4000000
したがって、 P(2)=PF(M)=4900/8893=0.5509951・・・ となり、疾病 M に罹
患している確率は、およそ55.1%となる。 (終)
(コメント) 検査で陰性だったら、ほぼ感染していないと言っていいのに対して、陽性の場合
は、感染している確率は半々で、感染していないのに陽性としてしまっているんです
かね!毎日発表される陽性者数も、話半分ということかな?
病院などで医師から新型コロナ感染の疑いと判断されたときは、PCR検査は無料で受け
られる。しかし、無症状の人が心配だからと受ける場合は全額自己負担で2〜4万円ほど
かかるらしい。もっとも格安の民間検査センターもあって、2000円(税別)ほどで受けられ
るようだ。
GAIさんからのコメントです。(令和2年12月27日付け)
自分も上記のように算出していました。陽性と判定されていても、強制的にホテル住まいを
強要されている非罹患者の人が意外と多く含まれているかもしれませんね。
GAIさんからのコメントです。(令和2年12月28日付け)
上記で指摘された:
あなたが検査で陽性と判定されたとき、本当に病気に罹患している確率P(2)は、
0.5509951・・・
に私も違和感を覚えた原因は、現在は判明している統計上のPCR陽性者数を21万と設定し
ていることにあると思ったので、ここを未だ判明していない総感染者数をr人とし、国民一人
当たり罹患確率を r/120000000 で計算させ、その条件付き確率をRCR検査の信頼度7/10
に一致させる事で計算したら、r=398671.0963・・・(人)のデータになった。
これって、推定の意味を正しく反映するのかな?
(追記) HN「たこ焼き」さんからのご投稿です。(令和3年2月3日付け)
Webサイト「明日は未来だ!」の幼女の白いボールと箱の問題についてですが、答えが2/3
になることには納得しました。しかし答えが1/2だと言う方がいてその人が主張を曲げません。
どのような説明をしたら、うまく2/3が答えであると理解してもらうことが可能でしょうか。
(コメント) 次のような説明で如何でしょうか?
起こり得る場合は、
1. (黒)+(白)→(黒)
2. (黒)+(白)→(白)
3. (白)+(白)’→(白)
4. (白)+(白)’→(白)’
の4通りあって、同様に確からしい。そのうち、取り出したボールが白なのは、2.3.4.の
3通り。この中でもともと白が入っていたのは、3.4.の2通り。
よって、求める確率は、2/3となる。
(追記) HN「エセ理系」さんからのご出題です。(令和3年1月23日付け)
問題 男女各50人が参加する婚活パーティーがあった。なぜかそのうちの1名が最初にい
なくなった。そのあと、女性3名が帰っていった。最初にいなくなった1名が男性である
確率を求めよ。
(解) A:最初に帰ったのは男である事象、
B:最初に帰った人のあと帰ったのが女3人である事象
とすると、求める確率は、PB(A)=P(A∩B)/P(B)
P(B)=P(A∩B)+P(Ac∩B)=(1/2)50C3/99C3+(1/2)49C3/99C3
P(A∩B)=(1/2)50C3/99C3
よって、PB(A)=50/(50+47)=50/97 (終)
(追記) ベイズ更新の話題をHN「春」さんよりいただいた。(令和3年5月19日付け)
ベイズ更新とは、新しく得られた情報を用いて、事前確率を合理的に変化させることをい
う。このベイズ更新によって、経験的に「そうだね!」と思えるような確率に近づいていくので、
重宝される考え方である。
ベイズ更新についての問題です。
見分けのつかない袋が3つある。袋1には赤玉と白玉が1:1の割合で、袋2には3:1
の割合で、袋3には1:2で入っている。
1つの袋を無作為に選び、その中から1つ玉を取り出したところ、赤玉だった。その
後、取り出した玉を元の袋に戻してよくかき混ぜ、その袋から1つ玉を取り出すという
作業を2回繰り返した。2回目も3回目も取り出した玉の色は赤だった。
このとき、(1) 2回目 および (2) 3回目の玉の取り出し終了時点での袋1の事後確
率を求めよ。
説明上、赤玉をR、白玉をWとし、袋1、袋2、袋3をそれぞれA、B、Cとおく。
求める確率は、 PR(A) である。1回目、2回目、3回目について、それぞれ確率を求め
ていこう。
(1回目)
PR(A)=P(A∩R)/P(R)=(1/3)(1/2)/((1/3)(1/2)+(1/3)(3/4)+(1/3)(1/3))=6/19
(2回目)
PR(A)=P(A∩R)/P(R)=(6/19)(1/2)/((6/19)(1/2)+(13/38)(3/4)+(13/38)(1/3))=72/241
(3回目)
PR(A)=P(A∩R)/P(R)=(72/241)(1/2)/((72/241)(1/2)+(169/482)(3/4)+(169/482)(1/3))
=864/3061
赤、赤、赤と3回続くと、事後確率(次の回の事前確率)が
1/3(=0.333・・・)→6/19(=0.315・・・)→72/241(=0.298・・・)→864/3061(=0.282・・・)
と推移していくのですね。袋1より袋2の方が赤玉を含む割合が多いので、赤、赤、赤と3回
続くと、それが袋1のものである可能性が低くなるのでしょうかね?
(追記) 令和6年7月14日付け
問題 A、Bの2人が、ある事象に対して真実を言う確率が、それぞれ 2/3、3/4 である
という。1つのさいころを投げたとき、2人とも「1の目が出た」と言ったとき、本当に「1
の目が出た」確率を求めよ。
この問題も典型的な条件付き確率の問題である。
(解) E:1の目が出る事象 、F:1の目が出たと証言する事象 とおくと、求める確率は、
PF(E) である。すなわち、 PF(E)=P(E∩F)/P(F)
ここで、
P(F)=P(E∩F)+P(E~∩F)=(1/6)(2/3)(3/4)+(5/6)(1/3)(1/4)=11/72
なので、 PF(E)=(1/12)÷(11/72)=6/11 (終)
(コメント) 「1の目が出た」と聞いて、実際に1の目が出る確率が、6/11(≒0.54・・・)
とは、微妙ですね!
以下、工事中!
(参考文献:御園生善尚 他著 統計学大要 (養賢堂)
田代嘉宏 著 確率と統計 (裳華房)
岡安 實 著 確率・統計 (旺文社)
渡部隆一 著 確率 (共立出版)
渡辺信三 著 ベイズの公式 (数研出版)
グネジェンコ・ヒンチン 著 渋谷政昭・渡辺 毅 訳 確率論入門 (東京図書)
新納浩幸 著 「数理統計学の基礎」(森北出版))