検定とは? イメージで語ってみる

スポンサーリンク

これまでの自分の統計学の検定では、なんとなく理解した気のままで、実際に行うと何からすれば良いのか戸惑い、毎回調べながらそれとなくこなしてきました。そろそろ検定を理解して行わなければいけないと感じ始めたので(かなり遅いですが・・・)、大学生のとき依頼閉じたままになっている統計学の教科書を引っ張り出し、一から勉強し、少しずつメモ書きしていきたいと思います。


検定を理解する上でひしひしと感じたのは、検定ってそもそも何をすることなのかを理解していないと作業ゲーに陥ってしまうなと。どうしても目に入るのが、t値とかp値とかの有名どころで、水戸黄門の紋所のように丁重に扱っておけば取りあえず使えるからいいやと海辺のみでたむろい遠くを眺めてるような状態でした。そういう自分も、あなたと自分の努力の差は有意差ですからね(ドヤッ)っと、日常生活で検定をガンガン振りまけるように、検定とはなんぞやですかというところを考えてみます。



これを読んだら

  • 検定が何をすることかのイメージが湧く
  • 検定で使われている大体の言葉の意味がわかる
  • 自分でも検定できるんじゃねえと思う勇者もいる



ちょっとした小話


小話

ある店の店主が、店の前に今週からポスターを貼ったら、各曜日を先週と比較して平均100人のお客さんが増加したよと言っています。声高にすごい効果だ!!と。


そのように店主は言っているわけですが、このポスターを貼るということにほんとうに効果があったのかは気になるところですよね。実は、好景気で毎週平均100人増加している状態だったかもしれませんし、これまでは一桁の増加者数しか記録したことがなかったかもしれません。ただ増加したという点だけを捉えてしまうと、ポスターがすごく効くという話になり、フォトショを使ってポスターに映る店主を二重にしてなど、断末魔の叫びがどこからか聞こえてきそうな方向に進みかねません。


そこで、この100人という観測値が数値的な裏付けのもと、異常に良かったと言えたらいいですよ。お気づきの方もいらっしゃると思いますが、その目的を叶えるのが検定です。検定では、観測された値が比較値(母平均・母分散)に対して数値的に差があるかを調べることです。ここで母平均・母分散が出てきましたが、大事な概念なので先に説明します。


母集団と標本 〜 父ではないのですね・・・〜


先程の店主の例で言うと、毎週の平均増減人数を記録すると、+100, +50, -40.... などのように観測データが得られますよね。この観測データの集まりのことを標本と呼びます。なので、標本の平均は標本平均、分散は標本分散と呼びます。なぜこのようにわざわざ標本と呼ぶかというと、この観測データは本来影に隠れている膨大なデータの一部でしかないということを意識しなければいけないからです。2,3個のデータだけで平均を出してもその後に観測されたデータはその平均からは大きく外れることが多々あります。2,3個のデータから作った平均は影に隠れた膨大なデータの真の平均ではないからです。この膨大なデータの事をまさしく母集団と呼び、母集団の平均を母平均、分散を母分散と呼びます。


母平均がわかれば、観測されるデータの多くはその付近に集まるので、今後どのようなデータが観測されるかも予測できるわけです。観測されるデータは母集団の中にあるものであり、母から生まれたということですね。だから父ではないと。。。


f:id:dskomei:20180309213921p:plain:w400


検定のプロセス


検定でやりたいことは、観測値と比較値(主に母平均)に特大の差があるならば観測値はすごいよねということです。店主の例では、施策に効果がないとするとお客さんの増減は平均0人となり、これを母平均として、観測値と比較します。ここで比較する前に、観測値と比較値には差がないという仮説を立てます。この仮説が大事で、両者に差がないとすると、観測値にまぁ誤差があっても比較値付近の値でしょということになり、比較値の確率分布で観測値が起こる確率を出したときに、その確率が低いと両者に差がないとした仮説が嘘になります。ということは、差があるわけだからすごいやろと。なんかふっかけられている感がありますね。


f:id:dskomei:20180309215619p:plain:w250 f:id:dskomei:20180309211651p:plain:w250




帰無仮説と対立仮説


このとき、差がないとした仮説のことを帰無仮説と呼びます。帰無仮説は文字通り無に帰される仮説ということのようです。検定では、観測された値って過去と比べてすごいよねと言いたいときによく使われ、それは帰無仮説が間違いだった(帰無仮説は棄却される)ということになります。つまり、棄却したい仮説ということで帰無仮説となります。それに対して、差があるとする仮説のことは対立仮説と呼びます。こちらが本命です。対立仮説を言いたいがために帰無仮説を立てて捨てるという面倒臭いことをするわけです。

 

有意水準とp値


先ほどまでは滅多に起こらないことが起きたら帰無仮説は棄却されると言いましたが、滅多に起こらないことってどれくらいの確率のことでしょうかね。天気予報で50%の確率で雨と言われただけで、嬉しがる野球部員もいますが(雨が降れば休みになるため)、80%以上にならないと落ち込む部員もいます。実は、検定においては絶対にこうじゃないといけないという数値はなく、慣例的に5%とされています。つまり、5%しか起こらない仮説は捨ててしまえということです。このように、基準とした値のことを有意水準と呼び、帰無仮説が起こる確率のことをp値と呼びます。p値が有意水準より低いならば帰無仮説は棄却されるというよく聞く言葉になって来ましたね。


検定を学ぶ上で確立分布からさかのぼる必要性を感じていましたが、この本一冊で確率分布から検定まで抑えられました。ポイントの部分では例題が添えられているので、理論だけではなく使い方も同時に学習できます。



入門 統計学 −検定から多変量解析・実験計画法まで−


終わりに


今回は検定ってなんなの?をイメージで理解するために書いてみました。ただ、実際に例題を用いて確率分布を見ながら一連の処理をしてみないと、使える状態にはならないと思います。なので、次回は正規分布、t分布を描きながら実際に検定をし、理解を進めたいと思います。