・確率2                                なつ氏

 あけましておめでとうございます。

 センター試験のような選択肢問題に正解する確率を考えたいと思います(消去法なども加
味した確率)。このとき、与えられた選択肢に対する答えの個数は明記されているものとしま
す。

 理解度を x (0≦x≦1)で定義したとき、n個の選択肢がある問題で答えがk個(n≧k)あると
きの正解する確率を f(x) (0≦f(x)≦1)で定義します。このとき、f(1)=1 になります。

(1) n=5、k=1 のとき、f(x)を求めよ。
(2) n=5、k=2 のとき、f(x)を求めよ。
(3) k=1 のとき、n を用いて f(x) を求めよ。
(4) k=2 のとき、n を用いて f(x) を求めよ。
(5) n、k を用いて f(x) を求めよ。

 美しい導き方があればご教授いただきたいです。項目応答理論は一旦置いておいてくだ
さい。


 DD++さんからのコメントです。(令和2年1月8日付け)

 ここなんですが、例えば、n=5、k=1 で、理解度 0.7 という状況は、どういう状況なんですか
ね?


 なつさんからのコメントです。(令和2年1月8日付け)

 理解度をそもそも 0〜1 で定義することに無理があるにはあるのですが、理解度 0.7 の
場合、選択肢1つについての正誤が確率0.7で判別できる、と考えてくださればいいです。


 DD++さんからのコメントです。(令和2年1月8日付け)

 誤った判断を下してしまう確率は、0 扱いでいいってことですかね。ぱっと見の印象、k=1は
なんとかなりそうですが、k≧2は大変そうだ……。


 なつさんからのコメントです。(令和2年1月8日付け)

 そういうことになります。なので、現実味はあまりないかもですね…(笑)。現実的には、項
目反応理論に基づいてロジスティック曲線で近似するようです。

 k=2 まではなんとかなります。意外と法則性のある式になるので、何かしら意味があるの
かなぁと思っていますが分かっていません…。


 DD++さんからのコメントです。(令和2年1月10日付け)

 とりあえず、k=1 についてだけ。

(1) n=5、k=1 のとき、

 まず、

・正しい選択肢について判断できて正解する確率がx

 正しい選択肢について判断がつかなかった場合、その条件のもとで、
・誤りの選択肢が4つともわかる確率が x^4
・誤りの選択肢が3つわかって二択を当てる確率が C[4,3]*x^3*(1-x)*(1/2) = 2x^3(1-x)
・誤りの選択肢が2つわかって三択を当てる確率が C[4,2]*x^2*(1-x)^2*(1/3) = 2x^2(1-x)^2
・誤りの選択肢が1つわかって四択を当てる確率が C[4,1]*x*(1-x)^3*(1/4) = x(1-x)^3
・誤りの選択肢が4つともわからず五択を当てる確率が (1-x)^4*(1/5) = (1/5)(1-x)^4

 これらを合計すると、 (1/5)(1+x+x^2+x^3+x^4)

よって、問題に正解できる確率は、

 f(x) = x + (1-x)*(1/5)(1+x+x^2+x^3+x^4) = 1/5 + x - (1/5)x^5

(3) nは一般、k=1 のとき、

 まず、
・正しい選択肢について判断できて正解する確率がx

 正しい選択肢について判断がつかなかった場合、その条件のもとで、
・誤りの選択肢がm個わかって残りの択一を正解する確率が
   C[n-1,m]*x^m*(1-x)^(n-1-m)*(1/(n-m))
 これをm=0からn-1までで総和をとります。

 二項展開の恒等式 Σ[m=0..n-1] C[n-1,m]*x^m*{(1-x)t}^(n-1-m) = {x+(1-x)t}^(n-1)
の両辺を ∫[0..1] dt で積分すると、

 Σ[m=0..n-1] C[n-1,m]*x^m*(1-x)^(n-1-m)*(1/(n-m)) = (1/n)(1-x^n)/(1-x)

となり、求めたい和の値がわかりました。

よって、問題に正解できる確率は、

 f(x) = x + (1-x)* (1/n)(1-x^n)/(1-x) = 1/n + x - (1/n)x^n

 続いて k=2 についても、ちょっと計算は面倒でしたがなんとか。

(2) n=5、k=2 のとき、

 まず、
・正しい選択肢について2つとも判断できて正解する確率がx^2

 正しい選択肢について1つしか判断がつかなかった場合、その条件のもとで、
・誤りの選択肢が3つともわかる確率が x^3
・誤りの選択肢が2つわかって二択を当てる確率が C[3,2]*x^2*(1-x)*(1/2) = (3/2)*x^2(1-x)
・誤りの選択肢が1つわかって三択を当てる確率が C[3,1]*x*(1-x)^2*(1/3) = x(1-x)^2
・誤りの選択肢が3つともわからず四択を当てる確率が (1-x)^3*(1/4) = (1/4)(1-x)^3

 これらを合計すると、 (1/4)(1+x+x^2+x^3)

 正しい選択肢について1つも判断がつかなかった場合、その条件のもとで、
・誤りの選択肢が3つともわかる確率が x^3
・誤りの選択肢が2つわかって3つ中2つを当てる確率が
    C[3,2]*x^2*(1-x)*(1/C[3,2]) = x^2(1-x)
・誤りの選択肢が1つわかって4つ中2つを当てる確率が
    C[3,1]*x*(1-x)^2*(1/C[4,2]) = (1/2)x(1-x)^2
・誤りの選択肢が3つともわからず5つ中2つを当てる確率が
    (1-x)^3*(1/C[5,2]) = (1/10)(1-x)^3

 これらを合計すると、 (1/10)(1+2x+3x^2+4x^3)

 よって、問題に正解できる確率は、

 f(x) = x^2 + C[2,1]*x*(1-x)*(1/4)(1+x+x^2+x^3) + (1-x)^2* (1/10)(1+2x+3x^2+4x^3)
   = 1/10 + (1/2)x +x^2 - (1/2)x^4 - (1/10)x^5

(4) nは一般、k=2 のとき、

 まず、
・正しい選択肢について判断できて正解する確率がx^2

 正しい選択肢について1つしか判断がつかなかった場合、その条件のもとで、
・誤りの選択肢がm個わかって残りのn-1-m個から1個を正解する確率が、
   C[n-2,m]*x^m*(1-x)^(n-2-m)*(1/(n-1-m))
 これをm=0からn-2までで総和をとります。

 二項展開の恒等式 Σ[m=0..n-2] C[n-2,m]*x^m*{(1-x)t}^(n-2-m) = {x+(1-x)t}^(n-2)
の両辺を ∫[0..1] dt で積分すると、

  Σ[m=0..n-2] C[n-2,m]*x^m*(1-x)^(n-2-m)*(1/(n-1-m)) = (1/(n-1))(1-x^(n-1))/(1-x)

となり、求めたい和の値がわかりました。

 正しい選択肢について1つも判断がつかなかった場合、その条件のもとで、
・誤りの選択肢がm個わかって残りのn-m個から2個を正解する確率が
   C[n-2,m]*x^m*(1-x)^(n-2-m)*(1/C[n-m,2])
 これをm=0からn-2までで総和をとります。

 二項展開の恒等式 Σ[m=0..n-2] C[n-2,m]*x^m*{(1-x)t}^(n-2-m) = {x+(1-x)t}^(n-2)
の両辺を ∫[0..s] dt で積分すると、

  Σ[m=0..n-2] C[n-2,m]*x^m*(1-x)^(n-2-m)*s^(n-1-m)*(1/(n-1-m))
 = (1/(n-1))({x+(1-x)s}^(n-1)-x^(n-1))/(1-x)

 さらに、両辺を ∫[0..1] ds で積分すると、

  Σ[m=0..n-2] C[n-2,m]*x^m*(1-x)^(n-2-m)*s^(n-1-m)*(1/(n-m)(n-1-m))
 = (1/(n(n-1)))(1-x^n)/(1-x)^2-(1/(n-1))x^(n-1)/(1-x)

となり、この2倍が求めたい和の値です。(括弧が多すぎて見にくい……)

 よって、問題に正解できる確率は、

f(x) = x^2 + C[2,1]*x*(1-x)*(1/(n-1))(1-x^(n-1))/(1-x)
                + (1-x)^2*{(1/(n(n-1)))(1-x^n)/(1-x)^2-(1/(n-1))x^(n-1)/(1-x)}*2
= x^2 + (2/(n-1))*x*(1-x^(n-1)) + (2/(n(n-1)))(1-x^n)-(2/(n-1))x^(n-1)*(1-x)}
= 2/(n(n-1)) + (2/(n-1))*x + x^2 - (2/(n-1))*x^(n-1) - (2/(n(n-1)))*x^n


 この感じだと、(5) n も k も一般 の答えは、

  x^k + (1/C[n,k])*{(1-x^n)+n(x-x^(n-1))+……+C[n,k-1](x^(k-1)-x^(n-k+1))}

あたりになるんでしょうか?試しに、n=5、k=3 を代入すると、

 x^3 + (1/10)*{(1-x^5)+5(x-x^4)+10(x^2-x^3)} = 1/10 + (1/2)x +x^2 - (1/2)x^4 - (1/10)x^5

で、(2)の答えに一致します。
(3つの正しい選択肢を見つけることと2つの誤った選択肢を見つけることは等価)

 また、試しに、n=5、k=4 を代入すると、

x^4 + (1/5)*{(1-x^5)+5(x-x^4)+10(x^2-x^3)+10((x^3-x^2)} = 1/5 + x - (1/5)x^5

で(1)の答えに一致します。
(4つの正しい選択肢を見つけることと1つの誤った選択肢を見つけることは等価)

ですから多分これで結果はあってそうですが、あとはそれをどう求めるか……。


 なつさんからのコメントです。(令和2年1月10日付け)

 4)までは、こちらで計算したものと全く同じ結果です。実は、(5)は同じような予測が立てら
れているものの、私も数学的に証明が出来ていない状況です...。帰納法が上手くいかず、
頭を抱えていますw

 nを無限大にとばすと、f(x)=x^k に収束することも面白いですよね〜。

 余談ですが、仮に5つの選択肢から2つを選ぶようなテストを受ける場合、正解率は
f(x)=1/5 + x - (1/5)x^5 となり、テストが6割以上の得点で合格とするとき、f(x)が0.6以上と
なるのは、xが約 0.4 以上のときとなります。

 この理論で考えると、テストで6割以上をとるのに、理解度は4割ほどで十分であることに
なりますw。グラフを描くとなかなか面白いです。


 at さんからのコメントです。(令和2年1月13日付け)

 DD++さんの

 正しい選択肢について1つも判断がつかなかった場合、その条件のもとで、
・誤りの選択肢がm個わかって残りのn-m個から2個を正解する確率が
   C[n-2,m]*x^m*(1-x)^(n-2-m)*(1/C[n-m,2])
 これをm=0からn-2までで総和をとります。


の中の、C[n-2,m]*x^m*(1-x)^(n-2-m)*(1/C[n-m,2]) の部分についてですが、

C[n-2,m]*(1/C[n-m,2]) は C[n,m]*(1/C[n,2]) と変形できます。

 よって、

Σ[m=0..n-2] C[n-2,m]*x^m*(1-x)^(n-2-m)*(1/C[n-m,2])
=Σ[m=0..n-2] C[n,m]*x^m*(1-x)^(n-2-m)*(1/C[n,2])
=(1/C[n,2])*((1-x)^(n-2))*Σ[m=0..n-2] C[n,m]*(x/(1-x))^m
=(1/C[n,2])*((1-x)^(n-2))*((1+x/(1-x))^n-C[n,n-1]*(x/(1-x))^(n-1)-C[n,n]*(x/(1-x))^n)
=(2/(n*(n-1)))*(1-x^n)/(1-x)^2-(2/(n-1))*x^(n-1)/(1-x)

となります。一般には次のようにできると思います。

 理解度を x (0≦x≦1)で定義したとき、n個の選択肢がある問題で答えが k 個 (n≧k)ある
ときの正解する確率を f(x,n,k) とすると、

f(x,n,k)
=Σ[p=0..k]C[k,p]x^p*(1-x)^(k-p)*(Σ[m=0..n-k]*C[n-k,m]x^m*(1-x)^(n-k-m)*(1/C[n-p-m,k-p]))
=Σ[p=0..k]C[k,p]x^p*(1-x)^(k-p)*(1-x)^(n-k)*(Σ[m=0..n-k]C[n-p,m]*(x/(1-x))^m*(1/C[n-p,k-p])).

 これをさらに変形して行けば、確かに、

  f(x,n,k) = x^k + (1/C[n,k])*{(1-x^n)+n*(x-x^(n-1))+……+C[n,k-1]*(x^(k-1)-x^(n-k+1))}

となります。


 DD++さんからのコメントです。(令和2年1月14日付け)

 C[n-2,m]*(1/C[n-m,2]) は C[n,m]*(1/C[n,2]) と変形できます。

 atさん、よくこの変形に気づきましたね。すごいです。続きの計算も追ってみます。


  以下、工事中!



                         投稿一覧に戻る