ロト6当選金額の期待値 part2
当選金額と見込当選金額の統計量比較
では、それぞれの基本統計量を計算してみましょう(詳しくはビジネス統計(基礎編)を参照ください)。
デ ー タ 43 43
最 小 値 86000 85500
最 大 値 213700 190000
範 囲 127700 104500
合 計 値(Σ) 6.1416e+06 5.7e+06
平 均 値(μ) 142828 132558
分 散 値(σ2) 9.73743e+08 6.88223e+08
標準偏差(σ) 31204.9 26234
分 散 値(s2) 9.96927e+08 7.0461e+08
標準偏差(s) 31574.2 26544.5
歪度(a3≒0) 0.225571 0.247109
尖度(a4≒3) 2.47111 2.23847
変動係数(ν) 0.221064 0.200248
当選金額を合計した場合の平均は142828円、見込当選金額を合計した場合の平均は132558円で、10270円の差があります。誤差百分率は7.2%ありますが、統計量的にはどちらもとても似通っているように見えます。
当選金額と見込当選金額の分布比較と検定
では、当選金額と見込当選金額を同じグラフにして、分布を見てみましょう。「*」が当選金額の合計で、「+」が見込金額の合計です。
^y 300000
|
|
|
- * *
| * +* * + *
| + + + + + + + * + * *
|+ + * * + + * * +* +
| + + + * + + + ++ +* + +++ +
- + ++ ++ + + + +
| + + + +
|
|
| x
|o a 43
+------------|-------------|-------------|-------------|--->
2つの分布に違いがあると見てよいのでしょうか。似ている気もしますが、微妙に違う気もします。見た目で判断するわけにはいきませんし、どうしたらよいでしょうか。
そこで、分布の違いがあるかどうかを適合度検定してみることにします(詳しくはビジネス統計(検定編)を参照ください)。つまり、統計的に有意な差があると言えるかどうかを検定します。
84240.6
統計検定量は84240で、余裕で有意差が出ています。つまり、マークシートの数字の選び方には何らかの恣意性が働いており、当選番号に対する当選金額は同じではないことを意味しています。すると、見込当選金額の合計よりも当選金額の合計が多くなる数字を選べば、他の人よりも期待値が高くなるということになります。具体的にはグラフのa地点のような数字になります。
少しでも期待値の高い番号で夢を掴む
どの数字が当選番号になるかは全くの無作為なので、数字を当てることはできません。しかし、数字の選び方には偏りが生じているため、当選したときの金額の期待値を高くする番号の選び方なら可能です。
どんな選び方でも当選番号となる確率は同じなのですから、誰でも1等、2等、3等といった高額当選になる可能性はあります。そのチャンスにプラスして、4等の当選金額を少しでも嵩上げできるような番号を選ぶことで、他の人よりも有利な条件でロト6を楽しむことができそうです。
本ウェブサイトの応用コーナーのロト6で億万長者になるの記事に、期待値の高い上位の数字から6つを選び出して表示するプログラムを無料公開しています。興味がある方は閲覧ください。
>rpn -c loto6
6 5 42 3 36 2
==========================================
本ウェブサイトの実戦コーナー(統計アラカルト)にロト6当選番号のオカルトがあります。関連記事なので興味のある人は閲覧ください。
番外編:当選金額と当選口数の関係
上記の抽選100回分のデータに対応する4等当選金額と当選口数のデータが手に入ったので相関係数を計算してみました。データはファイルの4p.datに格納されているとします。
12413 6900
8426 11500
9450 14100
8675 14100
16473 7800
:
最初の数字が口数で後の数字が当選金額ですね。相関係数は以下のrpn式で計算できます。
-0.781846
計算結果は-0.78でかなり高い負の相関値です。つまり、当選口数が少なければ当選金額が高くなる傾向があることは確かということですね。単回帰式はrpn式で出てきます。(詳しくはビジネス統計(単回帰編)を参照ください)。
y=-0.266362x+16907.7
口数が1つ増えるたびに約27銭安くなる計算です。ついでに、口数と当選金額の基本統計量を計算しておきましょう。
デ ー タ 100 100
最 小 値 8426 4800
最 大 値 54200 19500
範 囲 45774 14700
合 計 値(Σ) 2.50474e+06 1.0236e+06
平 均 値(μ) 25047.4 10236
分 散 値(σ2) 7.66887e+07 8.9009e+06
標準偏差(σ) 8757.21 2983.44
分 散 値(s2) 7.74633e+07 8.99081e+06
標準偏差(s) 8801.33 2998.47
歪度(a3≒0) 0.714325 0.728636
尖度(a4≒3) 3.87718 3.38539
変動係数(ν) 0.351387 0.292934
1列目が口数、2列目が当選金額の統計量です。値を見ると4等の口数平均は25047.4口です。従って、「y=-0.266362x+16907.7」のxに25047.4口を代入する平均の当選金額が算出できます。計算すると10236円です。見込当選金額よりも高めになっていますね。
最後に当選金額の度数分布を幹葉表示で示します。
4 | 8
5 | 35
6 | 0334788999
7 | 02235677899
8 | 011122244555556
9 | 001122678889999
10 | 222458
11 | 000135556677
12 | 01222355678
13 | 135599
14 | 00112
15 |
16 | 167
17 | 1
18 |
19 | 05
なだらかな釣鐘上の形状をしています。次に口数の幹葉表示です。縦に長いので編集しています。
8 | 46 24 | 00244889 40 | 6
9 | 4 25 | 1556688 41 |
10 | 23 26 | 269 42 | 1
11 | 27 | 013349 43 | 5
12 | 4 28 | 123488 44 | 9
13 | 89 29 | 5 45 |
14 | 28 30 | 118 46 |
15 | 39 31 | 19 47 |
16 | 134 32 | 2 48 |
17 | 223889 33 | 0227 49 |
18 | 13467 34 | 37 50 |
19 | 556689 35 | 51 | 7
20 | 03479 36 | 4459 52 |
21 | 047 37 | 0 53 |
22 | 6 38 | 54 | 2
23 | 2349 39 | 2
口数の場合は相当にばらけています。キャリーオーバーがあるときやニュースか何かあるいは季節(ボーナスシーズン等)によって、ロト6の参加者はかなり変動するようですね。
本ウェブサイトの実戦コーナー(統計アラカルト)にロト6当選番号のオカルトが関連記事としてあります。また、応用コーナーのロト6で億万長者になるにも記事があります。興味のある人は閲覧ください。
rpnプログラムを実行するには、rpn試用版かrpn標準版が必要です(バージョンの違いはこちら)。
pasteは講座サポートで公開されています。statinfo, stemleafはrpnマイスターパッケージに同梱されています。tstfitはビジネス統計(検定編)に同梱されています。r, exprはビジネス統計(単回帰編)に同梱されています。xypとnpdはrpnの姉妹ソフトウェアです。詳しくはプロダクトを参照ください。