はじめに
未来を予測することは簡単ではありません。大抵は過去や現在の延長線上に未来を思い描くのですが、現状を解析すること自体が困難です。しかし、様々な変動を含んだ過去や現在のデータから意味のあるデータ群を発見して、その関係を見つけ出すことができれば、未来への見通しが立つかもしれません。試行錯誤の結果、とても綺麗に関係を解明できれば1つの数式にまとめ上げることさえ可能かもしれません。複雑な自然現象でもそれらの努力で、沢山の物理公式が作られました。
仮に公式化できなくてもぼんやりと関係がありそうなものは統計的な処理で回帰式化することもできます。実際、ビジネス統計(単回帰編)では、2変量間の相関関係から相関度合いを数値化し、単回帰式の導出まで学びました。単回帰式で未来を予測したり現状を制御したりするわけです。
変量の1つ(説明変量)を年のような時系列として、残りの変量(目的変量)を売上や普及率とすることで、2変量間の相関関係から予測・制御します。直線で近似できないものは、曲線で近似することもできるので、単回帰式の応用で十分という気もします。
周期性を伴う予測にはトレンド分析が不可欠
しかし、単回帰式だけでは自然現象やビジネスでも頻繁に出てくる「ある事象」を説明するには力不足なのです。ある事象とは「周期性」です。例えば、複数年の月毎の降水量の推移をグラフにすると一定の周期が見られます。当然、梅雨時には雨が多いわけですから、毎年5,6月あたりは降水量は多いし、9月は少ない傾向が見られるわけです。
つまり、相関をベースにした単回帰分析が「一方が増えれば他方も増える」や「一方が増えれば他方は減る」事象を説明するのに対して、周期をベースにした分析は「一方が増える(時間)と他方が増えたり減ったりを繰り返す」事象を説明します。そして、この周期をベースにした分析をトレンド解析と言います。
トレンド分析で解析の守備範囲を広げる
本講座では、このような時間と共に目的変量が増減する時系列データ(トレンドデータとも言う)に注目して、予測や制御を試みます。トレンド解析を学ぶことで、周期を伴ったデータを扱うことが可能になります。
その周期はデータの中に隠れていて取り扱いが面倒な一面がありますが、時系列データの中から周期を抽出して、未来を予測できれば単回帰式で歯が立たない事象に対しても、料理できるナイフが手に入ります。
誤差を排除して周期性に注目することにより、何年(何ヶ月)毎に増減の波が来るのかを予測できますし、誤差と周期を排除することで、全体の上昇・下降傾向を明確に解析して説明することも可能です。つまり、トレンド解析によりデータ活用に幅が出るのです。
時系列データのトレンド解析手法を手中に
しかし、トレンド解析は計算量が多く計算手順も複雑になります。手計算や電卓では計算量に忙殺されてしまうので、rpnという電卓ソフトを使って説明していきます。これにより、予測的手法をどうやって使うかということだけに注力して、計算作業なしに結果を得ることができます。
トレンド解析は時系列データを解析する際の王道です。雑多で何の法則もなさそうに見えるデータから綺麗な周期性を浮かび上がらせることができれば、その周期を特定することで予測と制御が可能になります。事実、周期性を持つデータは単回帰式では説明力不足ですが、トレンド解析ですっきりと説明することができます。
本講座を学び終えた頃には、先月と今月の増減や昨年同月対比の増減で一喜一憂するレベルを超えて、より長いスパンでどのように増減しているのかを鳥瞰図的に把握できるようになります。
ビジネス統計講座を受講するには、別途rpn標準版を購入する必要があります。詳しくは本ウェブサイトのプロダクトを参照ください。
本講座の記事やプログラムの正確性については最大限の注意を払っていますが、これらを利用することにより生じたいかなる損害についても、一切の責任を負えませんので、あらかじめご了承ください。
本講座は公式の証明、理論的背景の説明には注力せず、統計的な手法を利用することに重点をおいて解説しています。そのため、学術的な表現が厳密ではない部分があります。また、出典明記のないデータは現実に似せて人工的に作成したものなので、現状に即していない可能性があります。