希薄化の修正(Correction for Attenuation)
1種類の測定データに対して、その特徴を分析する場合、平均値、中央値、最頻値などの
代表値や分散、標準偏差などの散布度を求めて、論ずる場合が多い。しかし、数学の成績
と理科の成績とか身長と体重などのように、1つの個体について、2種類の測定データを考
察しなければならない場合もある。
2種類の変量同士の関係を論ずるとき、相関係数というものを計算して提示する場合が多
い。相関係数は、次の式で求められる。
rxy=(1/N)Σ((xk−mx)/σx)((yk−my)/σy)
但し、Nはデータ数、mx、my は平均、σx、σy は標準偏差
特に、(1/N)Σ(xk−mx)(yk−my)は共分散とも言われる。
定義より、相関係数は、 −1以上1以下の数である。
また、適当な h、k、x0、y0 を定めて、u=(x−x0)/h、v=(y−y0)/k と変換すると、
rxy は、 rxy=(1/(Nσuσv))Σ((ukvk−Nmumv) と変形される。
相関係数は通常、この簡便法により比較的簡単に求めることができる。
Microsoftの表計算ソフトExcelには、「CORREL」という統計関数が用意されていて、相関係
数の計算はできるが、人生1回ぐらいは手計算で求めてみることも大切なことでしょう。
(例) 相関係数の計算
x | y | u | v | u2 | uv | v2 |
30 | 30 | -2 | -1 | 4 | 2 | 1 |
40 | 20 | -1 | -2 | 1 | 2 | 4 |
50 | 40 | 0 | 0 | 0 | 0 | 0 |
60 | 60 | 1 | 1 | 1 | 2 | 4 |
70 | 50 | 2 | 2 | 4 | 3 | 1 |
総和 | 0 | 0 | 10 | 9 | 10 |
但し、x0=50、y0=40、h=k=10
左表より、mu=mv=0 で、σu=σv=
なので、 rxy=0.9 となる。
(注) 標準偏差の2乗(分散)は、(2乗の平均)−(平均の2乗) で求められる。
相関係数は、計算で求まる1つの数学的量であるが、この値が、実際どんな意味を持つのか、
注意深い吟味が必要である。その際に大切なことは、相関図(散布図)がどうなっているかとい
うことである。相関図を見ない限り、相関係数が意味あるものかどうか判断することは、非常に
難しい。
相関図を見るポイントは次の2点である。
(1)極端な値がないかどうか
極端な値があると、相関係数の値に大きく影響してくる。
(2)相関図が直線的か、曲線的か
相関係数は、変量間の直線的な関係を前提にしている。
相関係数を扱うとき、陥りやすい誤解もある。
例えば、理科の勉強時間と数学の成績に相関が認められるとき、理科をたくさん勉強すれば、
数学の成績が上がるというように、個人間の相関を、あたかも個人内の相関としてしまいがち
である。個人間相関が正でも、個人内相関は負ということもありえる。
ある2つの変量に因果関係があれば、その2つの変量には相関が現れる。しかし、因果関係
がなくても、高い相関が現れることもある。相関係数は、両者の関係を表しているだけで、因果
関係を表しているわけではないということに注意する必要がある。
また、信頼性の低い測定方法で得られたデータ同士で相関を取ると、実際の相関係数よりも
低い値が生じるという現象もある。これを、希薄化という。相関係数を確かなものとするために、
この希薄化の問題については、次のような「希薄化の修正公式」が知られている。
従って、希薄化の修正のためには、各変量の信頼係数を知らなければならない。それでは、
信頼係数は、どうやって求めるのだろうか。但し、この場合、信頼係数は、どのような事に関す
る信頼性なのかはっきりさせて、使わなくてはならない。ここでいう信頼係数とは、テストにお
ける回答の安定性をさし、それを数値化したものとする。これは、次のような推定により得られ
る。
(1)再テスト法・・・一定期間において再テストし、相関係数を信頼係数とする。
(2)折半法・・・・・・1つのテストを折半し、2つのテストとみなして相関係数をとり、それを信頼
係数とする。
(3)α係数・・・・・・考えうる折半法全てに関して信頼係数を求め、それを平均化したもの。
(同じ尺度内で同じ反応を示せば、α係数は1となり、他と違う反応を示せ
ば、α係数は低下する)
信頼係数は、集団に依存する数値であるので、その都度対象の集団内での信頼係数を算出
しなければならない。
希薄化の修正について、整理してみようとしたつもりであるが、まだまだ内容的には不十分である。希薄化の修正に
ついてご存知の方、是非お教えください。実際の使用例とか、問題点とか・・・・・・。(塾長)
(参考文献: 御園生善尚 他著 統計学大要(養賢堂)
菅 民郎 著 パソコン統計処理 上 (技術評論社)
The Research Manual(Heinle & Heinle)
World of ”kou”! (村山 航(東大大学院教育学研究科)氏のHP))