「移動平均」から一部抜粋
…残念ながら、誤差変動、周期変動、傾向変動は同時に現れることが多く、複雑な実測データになるのが普通です。特に周期変動は少々扱いが厄介なので、先に誤差変動と傾向変動の取り扱いから説明します。
まず、以下のデータを見てください。説明変量のx値が0~19の時における目的変量yの値の対応表です。x値を月、y値を売上と仮定すると売上推移表ですし、x値を年、y値を新規採用数とすると採用人数推移表になります。要は、このデータはx値が時系列でy値がデータ列になるトレンドデータだということです。
x値: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
y値: 3 1 5 12 13 10 24 24 19 12 7 6 4 2 8 8 5 14 15 18
さて、何か規則性を見いだすことはできるでしょうか。じっと、データ列を眺めていても動向は把握できそうもないので、とりあえず、グラフにして…
「加重移動平均」から一部抜粋
…これで、ファイルの"data0200.txt"に移動期間を3にしたデータが格納されたので、グラフ化してみます。
| *
- *
| *
|
- *
| *
| * * *
- *
| * * *
| * * *
- * *
| * x
|o 19
+---------|----------|---------|------->
グラフを見てみると移動平均のグラフと非常に似ているように見えますが、移動平均と加重移動平均の計算結果は微妙に異なります。以下に期間が5の移動平均と加重移動平均を比較して示します。
=== ======== ========
1 3 2.5
2 6 5.75
3 10 10.5
:
「指数平滑」から一部抜粋
…実は、スムージングには移動平均や加重移動平均以外にもいくつかの技法が存在します。その1つに指数平滑と呼ばれる方法があります。在庫数予測のために作られた計算方法なのですが、直近のデータに減衰率という定数を掛けて次のデータを予測するというものです。計算対象を全て同じ重要さで評価する移動平均とは異なり、指数平滑は直近のデータであればあるほど重要さを増すことができます(重要さは減衰率で調整可)。従って、予測という意味では移動平均や加重移動平均より積極的です。
以下に指数平滑の数式を示します。とても単純な数式なのですが、驚くほどの予測精度を上げることもある興味深い数式…
「正弦波」から一部抜粋
…以下はテキストグラフで描いたサインカーブのグラフですが、横軸を時間、縦軸を売上とでも考えてみてください。時間が経つにつれて売上がアップダウンする様子と対比させることができます。
| ** ^ * ** **
| * | * * **
| * | * * *
|* |振 ** ** *
* |幅 * * *
* | * * ** 4π
*------|------*--------------*--------------*-------------*>
|o | * * ** **x
|<-----|------周期---------><------------周期------------>
| | ** ** * *
| | ** ** * *
| | ** ** * *
| v ****** *****
|-1
現実の売上は、このように綺麗に推移することはありませんが、周期性が存在するのであればサインカーブを短期的な予測に利用することはできそうです。例えば、一年間の売上を…
「回帰式」から一部抜粋
…元データそのままから回帰式を導出するよりも一旦、移動平均を計算してから導出した方がよりよい場合があることを示しました。このように、スムージングの技法を使えば目で見ても傾向変動や周期変動を捉えやすくなりますが、最小自乗法に基づく回帰式にもよい影響を与えることになります。
もちろん逆のパターンもあります。誤差変動のあまり感じられないトレンドデータをスムージングしても悪影響となって、相関係数も逆に低くなってしまうことがあります。本文では直線の回帰式をスムージングしましたが、以下の問題を解くことで曲線の回帰式とスムージングの効果についても理解を深めて…
「自己相関」から一部抜粋
…ファイルの"data0622.txt"にスムージングしたデータが格納されたので、グラフ化します。
|
-
|
|
-
| ② * * ⑤
| * * * * *
-* * ** ④ *
| * * * *
| * ③ * * *
- ① * *
| x
|o 23
+------------------|------------------|>
スムージングの威力ですね。かなり特徴が分かるようになりました。24ヶ月の間に減って(①)、増えて(②)、減って(③)、増えて(④)、減って(⑤)という周期性が見えます。しかし、どのあたりを周期性があると読めばよいのか分からないので、1から14まで移動期間を変えて、自己相関係数を計算して…
「コレログラム」から一部抜粋
…ファイルの"data0705.txt"にスムージングを掛けたデータから作ったコレログラムのデータが格納されています。コレログラムを描いてみましょう。
| *
|
0.5 *
| * *
| * * * *
| * * * * 29
+-1-2-3-*4-5-6-7--8-9-10-11121314-15161718*1*2021-2*2*24*5*262728>
|o * * * x
| * *
-0.5 *
| * *
|
|
|-1
今度はとても綺麗にコレログラムが浮き出てきました。周期も13から16あたりだということが分かります。元データから直接コレログラムを作成するよりもスムージングしてからの方が周期を見つけ出すのには都合がよいようです。補足ですが、期間が3の移動平均を掛けたので2つデータが消えます。従って、コレログラムも…
「自己回帰」から一部抜粋
…スムージングやコレログラムは、グラフにプロットされたデータの流れから周期変動や傾向変動を掴み、未来を予測するのが基本スタンスです。実際のところ、様々な外的環境の変化や内部変化により、予測は外れるものであり、その意味ではスムージングで全体のデータ傾向を把握するというスタンスの方がピッタリとした数値的な予測に重きをおくよりは健全な感じがします。
しかし、10年先は分からなくてもよいから、来年がどうなるのか知りたい、来月の売上はどうなるか知りたいという欲求も棄て難いものがあるのは事実でしょう。何よりも説明する際に数値的にピッタリ出ていた方が説得力があります。「5年後の売上はこのような傾向で増えていきます」よりは「来年の売上は○○です」と言い切った方が信頼感があるように…
「最近隣法」から一部抜粋
…さて、そのような秩序のない混沌とした、いわゆるカオス的なデータから未来を予測することができるのでしょうか。もし、本当にほんの少しの秩序もルールもない混沌としたバラバラなデータだとすれば予測することは不可能です。人知の及ばないところで神が勝手に決めた数が次の実測値になるのですから、あてずっぽに適当な数を言うのと違いはありません。ここで言うところの混沌、カオスとは実際には「混沌としているように見える」データから次を予測するということです。
このカオス的に見えるトレンドデータでも、次を予測する方法があります。それが最近隣法です。詳しい理論はさておいて、簡単に説明すると…
「トレンド予測アラカルト」から一部抜粋
①販売店の売上予測
以下はある販売店の3年間の月別売上高です(単位は万円)。毎年、年末に売上が多く周期性を感じますが、来年4月の売上高を予測します。
========= ========= =========
4月 2840 4月 2888 4月 3047
5月 3378 5月 3357 5月 3578
:
…元データのグラフからも分かるように、1、2、3月の売上落ち込みが4月に回復している傾向は過去3年変わらないので、予測値の1、3、4、2を選びたいところです。さらに、より詳しく見てみると4月の回復は過去2回において1月から2月の売上の間にあるようです。次も同じパターンだと考えると1か3ということになりますね。貴方ならどの予測値を選びますか。
②電気代の予測
以下はある家庭の過去18ヶ月の電気代のデータです(単位は円)。今年の7月電気代を予測してみます。
============ ============
1月 5,582 1月 20,547
2月 9,912 2月 18,024
:
…統計的には5%以内の予測誤差だと成功と言えますので、指数平滑から自己回帰までは20%以上の予測誤差で失敗と見ていいでしょう(*2)。それに比べて、構造変化を捉えての回帰式予測精度には改善が見られます。二次曲線の回帰式予測は13.9%の誤差にまで改善されています。素晴らしいのは、一次直線の回帰式予測で、わずか0.2%の誤差しかありません。
ビジネス統計講座を受講するには、別途rpn標準版を購入する必要があります。詳しくは本ウェブサイトのプロダクトを参照ください。
本講座の記事やプログラムの正確性については最大限の注意を払っていますが、これらを利用することにより生じたいかなる損害についても、一切の責任を負えませんので、あらかじめご了承ください。
本講座は公式の証明、理論的背景の説明には注力せず、統計的な手法を利用することに重点をおいて解説しています。そのため、学術的な表現が厳密ではない部分があります。また、出典明記のないデータは現実に似せて人工的に作成したものなので、現状に即していない可能性があります。