休日の東京に大雪が降る謎 part2
東京に大雪が降るのは週末と祝日に限られることなので、さっそく検証してみましょう。とは言っても祝日の計算は面倒なので、ここでは祝日を除いた土日に積雪量がどれくらいあったかを調べてみることにします。
祝日の日付は法改正で変わります。七曜と天候ですら関連性がないところに、人為的に決められる(決められた)祝日と天候が関係するとは思えないのですが…。
日付を曜日に変換
曜日毎の積雪量を集計するには、まず日付を曜日に変換する必要があります。rpnプログラムのweekdayを使って変換しましょう。使い方は簡単で8桁の日付を引き渡せば、日曜日の0から土曜日の6までに変換してくれます。
6
2000年1月1日は6なので土曜日ですね。ファイルにある日付を一気に曜日に変換するには次の一行でOKです。
これで、snow.txtにある日付を曜日変換して、week.txtファイルに格納しています。week.txtの内容を見てみましょう。
1
2
3
:
(中略)
:
6
0
1
曜日が順番に並んでいることが分かります。次にsnow.txtとweek.txtを横結合して、積雪が1cm以上あった曜日だけをピックします。データはsnowweek.txtファイルに格納します。
ファイルの内容を確認しましょう。1カラム目が積雪で2カラム目が曜日です。
4 2
3 3
11 4
:
(中略)
:
27 6
10 0
4 1
曜日毎に積雪のあった日を集計
では、rpnプログラムのfreqを使って、曜日毎に積雪のあった日の数をカウントします。例のごとく、1行でOKです。
2 10
3 5
4 4
5 11
6 15
0 14
1 14
全ての曜日で積雪が観測されているようですね。では、このデータをグラフ表示にしてみましょう。
^y 15 *
* *
|
|
10・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・*・・・・・・・ 平均
| *
|
|
|
5
| *
| *
|
| x
|o 6
+-----1------2-----3------4------5----->
日 月 火 水 木 金 土
横軸が曜日で縦軸が積雪のあった日の合計です。確かに週末に積雪のあった日は多いですが、土日以外も積もっています。差はありますが、劇的なくらいに週末だけという感じではありません。
それでは、東京で大雪の基準である5cm以上の積雪に条件を絞るとどうなるでしょうか。もっとはっきりと違いが出るでしょうか。グラフ化して確認してみます。
>xyp -x,6 -y,15 -s1,5 -n -m <tmp | npd
^y 15
|
|
|
10
| *
|
*
|
5
|・・・・・*・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 平均
| *
| *
| x
|o * * 6
+-----1------2-----3------4------5----->
日 月 火 水 木 金 土
やはり、平日にも積雪はあります。実際のデータを見てみましょう。
4 3
5 4
6 10
0 8
1 5
2 1
3 1
土曜日が10回(日)、日曜日が8回(日)、月曜日が5回(日)、金曜日が4回(日)、木曜日が3回(日)、火曜日が1回(日)、水曜日が1回(日)です。
平日はほとんど0回で、週末だけに積雪があるようにはなりませんでしたが、土曜と日曜で全32中、18回ありますから、56%の集中度です。
曜日と積雪の関係を統計的に検証
このばらつきを統計的に差があるかどうか適合度検定で調べてみます。まず、積雪が観測された日の平均を計算します。帰無仮説は「積雪が観測された日の回数は曜日に関係なく均一である」になります。
3
平均は3なので、実際の積雪と組にして、適合度検定を行ないます。
29
検定統計量は29になりました。有意水準を5%と考えて確率を計算します。
6.3e-05
積雪が観測された日が曜日によって、このようにばらつく確率は約0.0063%なので有意差があると言えます。つまり、帰無仮説は棄却されて「積雪が観測された日の回数は曜日によって異なる」になります。
話題に挙がったように大雪が週末「だけ」とは言えないような気がしますが、統計的には曜日と積雪との関係を認めてもいいような感じです。少なくとも積雪観測日は曜日によって偏りがあることは事実のようです。
もちろん、祝日の計算を端折っていますので、大雪を記録した上記の月曜から金曜までの集計が全て祝日だった可能性はあります。
最後に、今回の検証では大雪(5cm以上の積雪)の回数は日数とイコールとして集計していますが、大雪の回数については微妙な言い回しがあります。例えば、日曜日に雪が降って積雪10cm、雪が融けずに次の月曜日も積雪7cm、火曜日には3cmになった場合、これを1回の大雪とカウントしている可能性があります。そうなると当然、結果が異なってきます。
なんでも東京都心では平日に比べて、休日の気温差が0.2℃程度低いそうです。近年その差が顕著になってきているとか。多分、昼夜の人口の違いや企業活動の違いが曜日によって異なることが原因なのでしょう。ただ、仮にそうだとすると1990年から2010年に掛けて、積雪量が減ってきているのが矛盾しています。
番外編:ホワイトクリスマスの確率
クリスマスといえば雪の降るホワイトクリスマスがロマンティックです。そこで、東京でクリスマスの日に積雪があったかを調べてみましょう。積雪があったからといって降雪があったかは不明ですが、細かいことは気にせずに。
1224 0
1224 0
1224 0
:
1224 0
1224 0
1224 0
>rpn x 10000 % x <snow.txt | rpn 1224 1224 -c lookup >tmp
>rpn x 1 30 -c lookup <tmp
残念。0回(日)です。クリスマスイブに雪景色は見られないようです。舞い降りる雪を見るのが関の山かもしれません。
そこで、今度は積雪ではなく降雪の有無で調べてみます。雪が積もらなくても雪が降ったかどうかの記録はあります。そのデータがファイルの"fall.txt"にあるとします。データの構成はsnow.txtと同じですが、降ったか降らなかったを0/1で表してあります。
>rpn x 1224 1224 -c lookup <tmp
やはり、同じ結果です。25年の間、東京でクリスマスイブに雪を見ることはできなかったようです。
バレンタインデーに積雪がある確率
では、バレンタインデーはどうでしょう。2月なら東京でも冬真っ盛りですから、期待が持てます。果たして、雪は積もっているのでしょうか。
>rpn x 1 30 -c lookup <tmp
12 214
2 214
18 214
25年間で僅かに3回だけ、積雪がありました。確率は12%で、大体8年に一度の出来事です。
穢れのない、いつもと違う真っ白な世界のバレンタインデーは統計的にも希です。そんな日に気になる異性にチョコレートを渡せたら、ホントに恋が叶うかもしれませんね。
rpnプログラムを実行するには、rpn試用版かrpn標準版が必要です(バージョンの違いはこちら)。
pasteは講座サポートで公開されています。rownumはカンタン分析パッケージに同梱されています。lookup, nlookupはユーティリティーパッケージに同梱されています。freqはrpnマイスターパッケージに同梱されています。weekdayはカレンダー・システムパッケージに同梱されています。integralはビジネス統計(推定編)に同梱されています。tstfit, prob-chiはビジネス統計(検定編)に同梱されています。xypとnpdはrpnの姉妹ソフトウェアです。詳しくはプロダクトを参照ください。