統計的仮説検定の考え方(1)
さて、前エントリーでは、ある人がワインの味を見極める能力を持つか否かの判定をどうやって行うかに関する問題を提出しました。
これを考察するために必要なのが統計的仮説検定の考え方です。
統計的仮説検定は、その名のとおり、統計学的な手法を用いて、いま検証したい仮説が正しいかどうかをテスト(検定)する方法のことを指します。
統計的仮説検定では、主張したい仮説の確からしさを考えるために、少しばかり迂遠な手段を用います。
仮説「◯◯さんは、ワインの味の判別能力を持つ」を主張したいときに、それを直接示そうとするのではなく、まず、それを否定する仮説「◯◯さんは、ワインの味の判別能力を持たない」を立てます。この仮説を帰無仮説と呼びます。一方、示したい仮説を対立仮説と呼びます。
ついで、帰無仮説のもとで当該の事象(例:◯◯さんが、X種類のワインの種類をすべて当てた)が起こる確率を算出します。
そして、この確率が十分に小さいとき、「◯◯さんはワインの味の判別能力がない」という帰無仮定を捨てるのです。これにより、消極的な形でもともと示したかった対立仮説(「◯◯さんはワインの味の判別能力を持つ」)を採用するのです。
なぜこのようなまどろっこしい方法をとるのかについては次回のエントリーで解説をしようと思います。
ーーーーーーーーーーーーーーーーーーー
上記とほぼ同じ内容を以下に箇条書きでまとめました。
統計的仮説検定では、以下の手順に則って、仮説の確からしさを検証します。
1)帰無仮説の設定
(◯◯さんに)ワインの味の判別能力があることを示したい場合、
その示したい仮説そのものを検証するのではなく、まず、
ワインの味の判別能力は「ない」という仮説を立てます。
これを帰無仮説(null hypothesis)と呼びます。
(逆に、いまここで示したい仮説「◯◯さんにはワインの味の判別能力がある」を
対立仮説(alternative hypothesis)と呼びます)
2)帰無仮説のもとでの確率の計算
帰無仮説が正しいという仮定のもとで、実験や観察で得られたデータが生じる確率を計算します。
3)帰無仮説を棄却するかどうかの判定
2)で得られた確率がある基準より小さいとき、元々の帰無仮説が正しいと考えると非常にまれな現象が起こったことになり、帰無仮説を捨てることになります。
この基準のことを「有意水準(危険率)」、帰無仮説を捨てることを「棄却する」といいます。
有意水準(危険率)は、5%や1%に設定されることが慣習になっています。
つまり、帰無仮説を前提としたときに、目の前で起きた事象が20回に1回や100回に1回のまれな出来事であったら、はじめに立てた前提を捨ててしまおう、というわけです。
そして、帰無仮説を棄却することによって、いわば消極的な形で対立仮説を採用するのです。
以上が統計的仮説検定の大まかな流れです。
なお、本エントリーでは簡単に論じましたが、統計的仮説検定については様々な議論がされていますので、ぜひ然るべき参考書を手にとって内容を確認してください。