有意水準
平成20年11月10日、米国のウォール街で最も有名な日本人として名高かった伊藤 清
さんが亡くなられた。確率微分方程式(伊藤の公式)を考案し、数学以外の様々な分野に応
用され、確率論の世界的権威であられた。ノーベル賞に値する業績をあげられたはずなの
に、何故かノーベル賞にはとうとう選ばれることはなかった。
(伊藤の公式を応用された方がノーベル経済学賞を受賞したのに...。)
平成20年11月14日付けで、当HPの掲示板「出会いの泉」に、HN「雅」さんという方から
次のような書き込みがあった。
統計処理の問題 : 「あるホルモンの血清レベルが、
健康な100人で、95±1.8 (平均値±SEM)、
癌患者100人で、110±2.5 (平均値±SEM)
であった。(SEM:標準相対誤差) このとき、
(1) それぞれの95%CI(信頼区間)を求めよ。
(2) 健康な人と癌患者の 95%CI は重ならないので、二つの集団でホルモンレベルが
異なることは明らかである。
従って、ある人のホルモンレベルを測定し、癌患者の 95%CI の下限より大きけれ
ば、その人は、95%以上の確率で癌であると診断し、健康な人の 95%CI
の上限よ
り小さければ、95%以上の確率で癌ではないと診断できると考えた。
この考えが誤りであることを分かりやすく述べよ。
(ヒント:健康な人の何%が、癌患者の 95%CI の下限以上の値を持つか考えてみよ。
また、癌患者のうち何%が健康な人の 95%CI の上限以下の値を持つかも考え
てみよ。
サンプルの標準偏差=母集団の標準偏差*(N/(N-1))1/2、 Nはデータ数
であることを利用せよ。)」
特に、(2)について詳しい解説をお願いしたい。
雅さんによれば、(1)の解は、
健康なグループに関して、
平均 95、SEM 1.8、t95は、1.9842169、95%CI
は、
91.42840958〜98.57159042
癌患者のグループに関して、
平均 110、SEM 2.5、t95は、1.9842169、95%CI
は、
105.0394577〜114.9605423
になるとのこと。
今まで本格的な統計の問題は考えたことがなかったが、何か面白そうな問題なので、少し
考えてみようと思う。