心理統計学: いかさまコインを見抜けるか？ - Dear Someone. -社会心理学概論-

さとみ「ねえ、この前のテストさぁ、A先生のクラスの平均点は64点だったのに、私のクラスは62点だったんだってー！」

きょうこ「ええ？じゃあ、君のクラスのB先生ってダメじゃん！」

さとみ「そうそう！今思えばあいつの授業、マジでわかりにくかったんだよね、あーあ、私もA先生が良かった！」

きょうこ「やっぱり、B先生なんかより、A先生の方がすごいね」

　今回は社会心理学で行われる実験の結果を分析する際によく用いられる「心理統計学」の基本的な考え方についてお話ししたいと思います。今回は、「考え方」のみに触れるつもりですので、複雑な数式などは省略しますが、「統計学」のおもしろさに少しでも興味を持ってくだされば嬉しいです。

　さて、冒頭の例は日常でよく見られる光景だと思います。きょうこさんは「A先生のクラスの平均点がB先生のクラスよりも2点高い」という結果から「A先生の方がすごい」という結論を導きだしています。この「Xならば、Yである」の「X」「Y」の関係を「因果関係」と言いますが、このように直感から因果関係を導く方法を「ヒューリスティックス」と呼んでいます((1。しかし、テストの点数が高いのは本当にA先生のおかげなのでしょうか。

　ここでもう一つ例を挙げてみましょう。ここに、裏表のある1枚のメダルを持った男がいるとします。あなたはその男に勝負を仕掛けられたとしましょう。男は、

「もしコインを10回投げて、裏が出たら10円を僕があなたに渡し、表が出たら5円をあなたが僕に渡すことにしよう」

　と、言ってくるのです。あなたはもちろんこの勝負に乗るはずです。しかし、結果は全て「裏」。あなたは100円をその男に渡す羽目になってしまいました。あなたはこの結果に「何か作為があったのではないか」と抗議しますが、男は「一回も表が出ないことだって確率がとても低くてもあり得る」と言って聞いてもくれません。さてあなたは、もうその男からお金を取り戻せないのでしょうか。

　ここで一旦、全部「裏」が出る確率を求めてみましょう。コインは「表」「裏」と出る確率はそれぞれ50％になります。それを10回行うので1/2の10乗になりますので約0.097%になります。これは、1000回このゲームを行って1回出るかでないかの確率になります。この確率では、「とても低くてもあり得る」と本当に言うことができるのかは疑問です。

　そこで用いられるのが「有意」という考え方です。例えば「確率」とはその出来事が「偶然起こり得る割合」を指しますが、「偶然とは言い難いような結果」が出てくるようなことを、「統計学的に有意である」という結論の出し方をします。その「どのくらい珍しいことだと偶然とは言い難いか」を示す基準を「有意水準」と言います。心理学ではその「有意水準」を、５％か１％にすることが伝統的に多いです。

　さて、話をもとに戻しますと、「コインがすべて裏になる確率」は0.097％でした。つまり、「有意水準」を5％にしても1％にしても、その確率は有意水準よりも下になります。つまり、「コインがすべて裏になること」は、「統計学的に有意」な結果が出た、ということになります。つまり、そのコインには、統計学的に「何かしら作為があった」と言えます。ですのであなたはお金を無事取り戻すことができました。

　引き続き、さきのきょうこさんの話に戻しましょう。心理学ではしばしば、「平均値差の検定」というのを行います。「検定」とは先ほどのコインの例でいうと、「そのコインに作為があったかどうかを統計学的に判断すること」を言います。「平均値差の検定」とは、「その二つの群の平均値差に、統計学的な有意差は見られるのか」を判定するということになります。

　例えば、今回のような小さな差である場合、もしかしたらたまたま調子の悪い人が何人かいて平均値を下げてしまったのかもしれません。つまり、「その確率によっては平均値が同じ」である可能性もあったわけです。「A先生がすごい」から平均値がB先生と比べて高かったと言うためには、本当にその平均値差に「有意な差があったかどうか」を調べる必要があります。では、実際にやってみましょう。

　まず、検定をするときに「帰無仮説」というものを立てます。「帰無仮説」の「帰無」とはつまり、「棄却したい仮説」ということになります。今回の場合は、「A先生のクラスの平均点も、Bさんのクラスの平均点も同じである」というのが帰無仮説となります。そして、今回支持したい仮説は「A先生のクラスの平均点の方がB先生のクラスの平均点よりも高い」というものです。これを、帰無仮説に対して「対立仮説」と呼びます。通常は「A先生のクラスの平均点も、Bさんのクラスの平均点も同じだった場合、今回のテストの結果が起こり得る確率は（有意水準である）５％以下であるため、この仮説を棄却した方が良い」というような考え方をします。そして、この「帰無仮説」が棄却されれば、「対立仮説」を採択できる、というわけです。

　次に、「分布」というものを説明します。「分布」とは例えばテストなど行った場合における各生徒の点数と人数の値が集まったものを表します。統計学では、「母集団（調べたい集団:注が下にあります）」の分布を、「正規分布」と仮定して検定を進めていきます（数式は複雑で覚える必要はないのですが、数学的に導き出されています）。そして、この正規分布は「平均値」と「分散（分布がどれくらい広がっているか）」の値で形が決まります。

　ここで、定期テスト点数の分布は通常「正規分布」の形になると想定して作られています（実は「偏差値」という考え方は、正規分布になっているという前提での数値ですが、その説明はまたの機会に…）。後ここでは便宜的に二つのクラスでは、「A先生のクラスもB先生のクラスも共に45人で、分散の値が14」だと仮定します。従って今回は「（対応のない）等分散性を持った二つの群の平均値差の検定」ということになります。

　この「平均値差の検定」においては「t検定（スチューデント検定ともいう）」というものを使います。等分散性を持った２群の平均値差の「検定統計量（検定に使用する統計量で、数式は複雑なので割愛）」が「t分布（これも数式が複雑なので割愛）」という分布になることが知られています((2。「t検定」はこの「t分布」を用いて行います((3。ここでは検定統計量t=2.535と出たとしましょう。このtが有意水準αよりも高ければ、「帰無仮説」が棄却されることになります。

　さて、いよいよ検定に移ります。ここで対立仮説は「A先生のクラスの方がB先生のクラスよりも高い平均点を取っている」ということですので、今回は片側検定を行います((4。1クラスの人数が45人の「t分布」での5％の有意水準αの値は、α≒1.561となります。従って、α<tとなるので、「帰無仮説」は棄却され、「対立仮説」が採択されました。すなわち、「A先生のクラスの平均点は、B先生のクラスの平均点よりも高い」ことが統計学的に示されたことになります（p値による検定が通常行われますが割愛します((5）。

　もちろん、だからといって「A先生のおかげ」とするのはまだ先の話なのですが、一応は「A先生のクラスが優れていた」ことは分かりました。しかし、これはまだ「確率が高い」ことがわかっただけで、「因果関係」を説明するにはもう少し詳細な吟味が必要となります。その際には、因子分析や共分散構造分析などといった分析方法があったりします。しかし、今回はこのように、「統計学的に有意であること」を示すことによって、その研究の「妥当性」を留保できることが理解できれば大丈夫です。

　以上が、心理統計学の本当に基礎的な考え方になります。統計学は本当に難しくて、私も本当に苦労しています。他にも面白い検定方法や、分析にもたくさんの種類があるので後々また紹介できればいいなと思っています。今回の記事でわかりにくかったところがあれば是非コメントしてください。修正を重ねていきたいと思っています。

さとみ「B先生、今回のテストの点数の平均点が、統計学的にA先生のクラスの平均点よりも低かったんですけど！！教え方が悪かったんじゃないですかね！！！」

B先生「そりゃあお前らのクラスの頭のいいやつらがみんなインフルエンザで休んだからな」

------------------脚注

1. 「ヒューリスティックス」とは例えば「あの店は行列ができているから、美味しいはずだ」と言ったように、科学的な根拠もなしに直感で判断することを言います（詳しくは後ほど解説します）。それに対して、数学的に導き出すことを「アルゴリズム」と言います。コンピューターはアルゴリズムによって結果を導いています。

2. 「知られています」とか「そうなっています」ばかりでごめんなさい。しかし、数式や照明が複雑すぎて、説明しようとすると恐らくブログ20日分はかかるのではないでしょうか。興味がある人は、「統計学」の参考書をのぞいてみてください。僕は…そこそこ楽しかったです。うける。

3. 普通は、標本の数をいれるだけで、検定統計量が出るような計算ソフトを使います。或いは、教科書であれば巻末に表で調べられるようになっています。いずれにしても心理学では自分で計算しなければいけない、なんてことにはならないので安心してください。

4. ここでは、対立仮説の種類によって検定の仕方が変わってきます。例えば、「平均値差がある」という仮説を検証したい場合は両側検定、「AよりもBのが高い」或いは「BよりもAの方が高い」のように比較したい場合は片側検定を取ります。それによって「有意水準」の範囲が変わってきます。

5. p値とは、簡単に言えば「帰無仮説に従った場合、サンプルが示した結果が出る確率」のことである。通常はエクセルなどの計算ソフトを使うことが多いです。今回は、p<0.007なので、有意水準が5％であっても1％であっても「帰無仮説」は棄却されます。

専門用語の説明（説明したもの以外）

・相関関係: 「因果関係」とは違い、「Xであるときに、Yである傾向にある」といった関係性を示す用語である。「相関係数」rは、YがXにどれくらい相関しているかという程度を-1から1の値で表す。

・独立変数: 「Xならば、Yである」といったときのXのこと。Xの値によってYが決定するため「説明変数」ともいう。

・従属変数: Yのこと。「目的変数」ともいう。

・母数: 「記述統計学」では、調べる対象の平均値、分散、標準偏差などが母数となる。これに対し「推定統計学」では、調べる対象があまりにも大きすぎるため、無作為に標本（サンプル）を抽出して調べる手法を取るが、このときに標本のデータと区別して、母平均、母分散などという。ちなみに、標本のデータは、標本分散、標本平均という。パラメータともいう。

・妥当性: 調べた結果が正しい程度を表す言葉。例えば、テストの内容がまだ習ってない範囲を含んでいたりすると、頭の良い人でも点数を取れないため分散が低くなります。そうなると、平均値差の検定をしたときに、帰無仮説を棄却する確率が高くなってしまいます。従って、妥当性を留保できなくなってしまいます。