[R]正規性の検定

東京の8月の最高気温が期間によって差があるか検定をしようと思ったのですが、まずは分布が正規分布に従っているかを検定しないといけないらしい。

ということで、ヒストグラムと正規確率紙を並べて見るべく、こんなスクリプトを書いてみた。

上のスクリプトを動かすと、こんな感じの絵が描ける。
・・・確率紙があからさまに直線上に並んでいない、曲がっている。
150812-215619
本当に正規分布ではないのか確認するために「Kolmogorov-Smirnov(コロモゴロフ・スミノフ)検定」を行うことにする。Rで「ks.test(引数)」と入力すれば良いのであります。

ということで、コロモゴロフ・スミノフ検定を実行します。

するとこんな結果が帰ってきました

手っ取り早く言うと、4行目のp-valueがとっても小さいということ(p < 0.05) なので「データ(2000~2014年の8月の東京の最高気温)が正規分布をなす」という帰無仮説が棄却される事になります。 ということで、一般的によく使われているt検定は使えなさそうということが分かりました。 なのでノンパラメトリック検定で、東京の平均気温が年代によって変わるのかを確かめることになりそうです。 続く・・・のか?


参考:Rでt検定 2(帯広畜産大学 増田豊 研究室のWebサイト)