偏差値の正体 マニア編

入門編では、学力偏差値の概念的な説明でとどめました。

これは、学力偏差値の算出に統計的な手法を用いているため、
『正規分布』や『標準偏差』だけでも一つのテーマになってしまうからです。

今回は、詳しく知りたい方のためにマニアックに行こうと思います。

1.正規分布

平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布」
と定義されています

下記のグラフでは、その平均を μ, 分散を σ2  とする4つの正規分布が表されています。
山の形が異なるのは、分布の分散が異なっていることを示しています。

seikibunpu

 

2.標準偏差

N
個のデータ x1, x2, …, xN からなる母集団を考えるとき、

その母集団の相加平均(母平均)は、次のとおりに定義されます。

m = \frac{1}{N} \sum_{i=1}^{N}x_i

このとき、母平均 m を使って次式で得られる量を分散(または母分散)と定義すします。

\sigma^2 = \frac{1}{N} \sum_{i=1}^{N}(x_i - m)^2

この分散の正の平方根 σ を、母集団の標準偏差と定義します。

分散はデータの散らばり具合を表す量ですが、
元のデータを2乗しているので、元のデータや平均値と直接比較することができません。
平方根をとって標準偏差にすると、平均値と同じ単位になるので比較ができるようになります。

3.実際の学力偏差値の求め方

学力偏差値の公式は、入門編で記した下記の式です。

学力偏差値 = 50 + (得点-平均点)/(標準偏差)×10

理論的には、標準偏差の求め方も分かったわけですから、
1学年分の生徒のデータがあれば、全員の学力偏差値を弾き出すことが可能です。

でも、実際には標準偏差を手計算で求めるのは大変です。
学校の先生が集計をする際には、EXCELの関数を使えば簡単に出来ます。

標準偏差の算出には、STDEVP関数を使用します。
STDEVP関数の範囲指定で、対象となる全生徒の得点を指定するだけです。

平均点の算出には、AVERAGE関数ですね。

これで、パーツは揃いました。1000人分のデータでも一発で出来ますよ。