生駒 忍

記事一覧

平均・分散・標準偏差・平均偏差の加法性

プロ心理学のすゝめというブログがあります。「某大学院で心理学を学ぶ学生達が旧態依然とした心理学界への不満を吐き出すブログです。」とあり、タイトルも含めて、なかなか挑戦的であると思う方もいるでしょう。もう1年近く、更新が止まっていたのですが、きのう、ひさしぶりに新記事が出ました。右近という人による、分散とは何か (その1)と題した記事です。

ここで主題になっている、分散の加法性は、表面的にはむずかしいお話ではないのですが、意外に知られていないように思います。ですので、こうして、少しずつでも啓蒙してもらえるのは、ありがたいことです。少なくとも、記事になったことで知る人が減ることはありません。ですが、自分のアタマで考えよう(ちきりん著、ダイヤモンド社)ではありませんが、言われていることをそのまま信じてしまう人には、あぶないかもしれません。

平均は、加法性が常に成り立ちます。5教科のテスト得点がクラス全員分あったら、個人ごとに5教科の合計を求め、その平均を求めても、各教科の平均を求め、それを合計しても、同じになるということです。ですが、分散は、ずっとナイーブです。

例示のために、適当な仮想データをつくってみました。「い」~「る」の11名の、国語と算数のテスト成績という設定です。

   国語 算数
い  80  91
ろ  75  88
は  45  70
に  65  82
ほ  95  100
へ  85  94
と  50  73
ち  90  97
り  70  85
ぬ  60  79
る  55  76

国語の平均は70、算数の平均は85になり、「プロ心理学のすゝめ」にある例とまったく同じ値です。分散は、国語が250、算数が90ということで、こちらは少しずれますが、この後で暗算をしやすい値に調整してつくりました。

11名それぞれについて、2科目の合計を出して、その平均を求めると、155になります。加法性が当てはまっています。そこで、次にその分散を求めてみると、640となり、250+90=340とはかけ離れた値になってしまいます。加法性の不成立は明らかです。

では、標準偏差ではどうでしょうか。分散の正の平方根をとればいいので、どれも暗算ですぐ出せます。250=5*5*10、90=3*3*10ですので、国語の標準偏差は5√10、算数の標準偏差は3√10です。もうお気づきですね。合計の標準偏差は8√10となって、つまりこのデータでは、分散はだめでも、標準偏差には加法性が現れているのです。

せっかくですので、別の考え方によるばらつきの統計量である、平均偏差も取りあげましょう。「プロ心理学のすゝめ」には、「残念なことに心理学の統計の授業においては「偏差の絶対値を取るのは面倒だから2乗にしちゃった(=´∀`)」と説明されることは多い。」とありますが、そのめんどうなやり方をとって、平均との差の絶対値を平均したものが、平均偏差です。計算すると、国語が150/11、算数が90/11、そして合計が240/11となります。標準偏差だけでなく、平均偏差にも、加法性が当てはまる結果となりました。「簡単に言えば、「分散は足し算 (加法) できる」ということである。」と書いてあったのは、分散「は」とあるように、ほかにはない加法性があることが、分散の優位性をもたらしているという意味をこめているのでしょう。ですが、ご覧のとおり、分散の加法性が否定された上に、同じデータで平均偏差の加法性は認められることがあるのです。

もちろん、分散の加法性は実在しないというわけではありません。もう種を見ぬいた方も多いと思いますが、今回の仮想データは、分散の加法性の成立条件からはほど遠くなるようにつくりました。平均では常に成り立ちますが、分散の場合は、加法性が成り立つための条件があります。そして、心理学が興味をもつような調査データですと、その条件が厳密に満たされることはなかなかないと思います。