ダイジェスト | ビジネス統計(トレンド編) [講座] | 逆ポーランド電卓の実践ウェブ rpn hacks!

逆ポーランド電卓の実践ウェブ rpn hacks!

逆ポーランド電卓rpnの実践ウェブ   
rpn hacks! アールピーエヌ・ハックスサイトマップ

rpn | 講座 | ビジネス統計 | ビジネスの実戦で役立つ統計手法をしっかりと学習。

HOME > 講座 > ビジネス統計 > トレンド編 > ダイジェスト hatena yahoo buzzurl livedoor del.icio.us nifty newsing twitter facebook rss ソーシャルブックマーク

ビジネス統計(トレンド編)のダイジェスト

ビジネス統計(トレンド編)の”ダイジェスト”です。rpnを使ったビジネス統計の概要がわかるように適当な部分をピックアップしてあります。

はじめにLinkIconも一読された上で、ビジネス統計講座を受講するかどうかの判断にお使いください。また、ページ右下に試し読みLinkIconも用意してあります。納得された上での受講、お待ちしております。

「移動平均」から一部抜粋

…残念ながら、誤差変動、周期変動、傾向変動は同時に現れることが多く、複雑な実測データになるのが普通です。特に周期変動は少々扱いが厄介なので、先に誤差変動と傾向変動の取り扱いから説明します。

まず、以下のデータを見てください。説明変量のx値が0~19の時における目的変量yの値の対応表です。x値を月、y値を売上と仮定すると売上推移表ですし、x値を年、y値を新規採用数とすると採用人数推移表になります。要は、このデータはx値が時系列でy値がデータ列になるトレンドデータだということです。


  x値: 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19
  y値: 3  1  5 12 13 10 24 24 19 12  7  6  4  2  8  8  5 14 15 18


さて、何か規則性を見いだすことはできるでしょうか。じっと、データ列を眺めていても動向は把握できそうもないので、とりあえず、グラフにして…

「加重移動平均」から一部抜粋

…これで、ファイルの"data0200.txt"に移動期間を3にしたデータが格納されたので、グラフ化してみます。

  ^y 25
  |             *
  -           *
  |               *
  |
  -                                   *
  |         *
  |       *         *               *
  -     *
  |                   *         * *
  |   *                 *     *
  -                       * *
  | *                                    x
  |o                                    19
  +---------|----------|---------|------->


グラフを見てみると移動平均のグラフと非常に似ているように見えますが、移動平均と加重移動平均の計算結果は微妙に異なります。以下に期間が5の移動平均と加重移動平均を比較して示します。

  No.  data0101   data0200
  ===  ========   ========
   1   3          2.5
   2   6          5.75
   3   10         10.5
             :

「指数平滑」から一部抜粋

…実は、スムージングには移動平均や加重移動平均以外にもいくつかの技法が存在します。その1つに指数平滑と呼ばれる方法があります。在庫数予測のために作られた計算方法なのですが、直近のデータに減衰率という定数を掛けて次のデータを予測するというものです。計算対象を全て同じ重要さで評価する移動平均とは異なり、指数平滑は直近のデータであればあるほど重要さを増すことができます(重要さは減衰率で調整可)。従って、予測という意味では移動平均や加重移動平均より積極的です。

以下に指数平滑の数式を示します。とても単純な数式なのですが、驚くほどの予測精度を上げることもある興味深い数式…

「正弦波」から一部抜粋

…以下はテキストグラフで描いたサインカーブのグラフですが、横軸を時間、縦軸を売上とでも考えてみてください。時間が経つにつれて売上がアップダウンする様子と対比させることができます。

  ^y 1 *****                        *****
  |  **  ^  *                      **    **
  |  *   |   *                    *       **
  | *    |    *                  *         *
  |*     |振  **                **          *
  *      |幅   *                *            *
  *      |      *              *             **            4π
  *------|------*--------------*--------------*-------------*>
  |o     |       *            *               **           **x
  |<-----|------周期---------><------------周期------------>
  |      |        **        **                  *         *
  |      |         **      **                    *       *
  |      |          **    **                      *     *
  |      v           ******                        *****
  |-1


現実の売上は、このように綺麗に推移することはありませんが、周期性が存在するのであればサインカーブを短期的な予測に利用することはできそうです。例えば、一年間の売上を…

「回帰式」から一部抜粋

…元データそのままから回帰式を導出するよりも一旦、移動平均を計算してから導出した方がよりよい場合があることを示しました。このように、スムージングの技法を使えば目で見ても傾向変動や周期変動を捉えやすくなりますが、最小自乗法に基づく回帰式にもよい影響を与えることになります。

もちろん逆のパターンもあります。誤差変動のあまり感じられないトレンドデータをスムージングしても悪影響となって、相関係数も逆に低くなってしまうことがあります。本文では直線の回帰式をスムージングしましたが、以下の問題を解くことで曲線の回帰式とスムージングの効果についても理解を深めて…

「自己相関」から一部抜粋

…ファイルの"data0622.txt"にスムージングしたデータが格納されたので、グラフ化します。

  ^y 500
  |
  -
  |
  |
  -
  |       ②   * *                     ⑤
  |          *    * * *              *
  -*    *               **      ④     *
  |  *    * *                      *
  |    *              ③   * *    *
  - ①                        * *
  |                                      x
  |o                                    23
  +------------------|------------------|>


スムージングの威力ですね。かなり特徴が分かるようになりました。24ヶ月の間に減って(①)、増えて(②)、減って(③)、増えて(④)、減って(⑤)という周期性が見えます。しかし、どのあたりを周期性があると読めばよいのか分からないので、1から14まで移動期間を変えて、自己相関係数を計算して…

「コレログラム」から一部抜粋

…ファイルの"data0705.txt"にスムージングを掛けたデータから作ったコレログラムのデータが格納されています。コレログラムを描いてみましょう。

  *y 1
  | *
  |
  0.5 *
  |                              * *
  |     *                   *  *     *
  |                       *             * *                   *   29
  +-1-2-3-*4-5-6-7--8-9-10-11121314-15161718*1*2021-2*2*24*5*262728>
  |o                    *                        * *               x
  |          *        *
  -0.5             *
  |            * *
  |
  |
  |-1


今度はとても綺麗にコレログラムが浮き出てきました。周期も13から16あたりだということが分かります。元データから直接コレログラムを作成するよりもスムージングしてからの方が周期を見つけ出すのには都合がよいようです。補足ですが、期間が3の移動平均を掛けたので2つデータが消えます。従って、コレログラムも…

「自己回帰」から一部抜粋

…スムージングやコレログラムは、グラフにプロットされたデータの流れから周期変動や傾向変動を掴み、未来を予測するのが基本スタンスです。実際のところ、様々な外的環境の変化や内部変化により、予測は外れるものであり、その意味ではスムージングで全体のデータ傾向を把握するというスタンスの方がピッタリとした数値的な予測に重きをおくよりは健全な感じがします。

しかし、10年先は分からなくてもよいから、来年がどうなるのか知りたい、来月の売上はどうなるか知りたいという欲求も棄て難いものがあるのは事実でしょう。何よりも説明する際に数値的にピッタリ出ていた方が説得力があります。「5年後の売上はこのような傾向で増えていきます」よりは「来年の売上は○○です」と言い切った方が信頼感があるように…

「最近隣法」から一部抜粋

…さて、そのような秩序のない混沌とした、いわゆるカオス的なデータから未来を予測することができるのでしょうか。もし、本当にほんの少しの秩序もルールもない混沌としたバラバラなデータだとすれば予測することは不可能です。人知の及ばないところで神が勝手に決めた数が次の実測値になるのですから、あてずっぽに適当な数を言うのと違いはありません。ここで言うところの混沌、カオスとは実際には「混沌としているように見える」データから次を予測するということです。

このカオス的に見えるトレンドデータでも、次を予測する方法があります。それが最近隣法です。詳しい理論はさておいて、簡単に説明すると…

「トレンド予測アラカルト」から一部抜粋

①販売店の売上予測

 以下はある販売店の3年間の月別売上高です(単位は万円)。毎年、年末に売上が多く周期性を感じますが、来年4月の売上高を予測します。

  前々年度     前年度      本年度
  =========   =========   =========
   4月 2840    4月 2888    4月 3047
   5月 3378    5月 3357    5月 3578
                  :


…元データのグラフからも分かるように、1、2、3月の売上落ち込みが4月に回復している傾向は過去3年変わらないので、予測値の1、3、4、2を選びたいところです。さらに、より詳しく見てみると4月の回復は過去2回において1月から2月の売上の間にあるようです。次も同じパターンだと考えると1か3ということになりますね。貴方ならどの予測値を選びますか。

②電気代の予測

 以下はある家庭の過去18ヶ月の電気代のデータです(単位は円)。今年の7月電気代を予測してみます。

      昨年           今年
  ============   ============
   1月   5,582    1月  20,547
   2月   9,912    2月  18,024
               :


…統計的には5%以内の予測誤差だと成功と言えますので、指数平滑から自己回帰までは20%以上の予測誤差で失敗と見ていいでしょう(*2)。それに比べて、構造変化を捉えての回帰式予測精度には改善が見られます。二次曲線の回帰式予測は13.9%の誤差にまで改善されています。素晴らしいのは、一次直線の回帰式予測で、わずか0.2%の誤差しかありません。

警告ビジネス統計講座を受講するには、別途rpn標準版を購入する必要があります。詳しくは本ウェブサイトのプロダクトを参照ください。

警告本講座の記事やプログラムの正確性については最大限の注意を払っていますが、これらを利用することにより生じたいかなる損害についても、一切の責任を負えませんので、あらかじめご了承ください。

警告本講座は公式の証明、理論的背景の説明には注力せず、統計的な手法を利用することに重点をおいて解説しています。そのため、学術的な表現が厳密ではない部分があります。また、出典明記のないデータは現実に似せて人工的に作成したものなので、現状に即していない可能性があります。

統計処理パッケージ

基礎編

推定編

検定編

発展編

ビジネス統計(発展編)

  • 0) はじめに/ダイジェスト
  • 1) 残差分析
  • 2) レートシェア分析
  • 3) クラスター分析
  • 4) デンドログラム
  • 5) コレスポンデンス
  • 6) 主成分分析
  • 7) マトリクス分析アラカルト
  • 8) クラスター分析アラカルト
  • 9) コレスポンデンスアラカルト
  • 10) 主成分分析アラカルト

※本講座のトップへ

  ※0) はじめに/ダイジェストは
     無料公開されています。

試し読み版  

警告文字で作られた図表や式が崩れることがあります(IEブラウザ)。崩れた場合は図表や式をメモ帳にコピーして閲覧ください。なお、Firefoxブラウザは問題ありません。

情報PDF版は図表や式が崩れることはありませんが、ページ区切りで改行されることがあります。連続ページの閲覧にて御了承ください。

警告rpn標準版(2kリビジョン)はダブルクォートで囲ってください。

rpn 1 2 + ⇒ rpn "1 2 +"
rpn 1 -c foo ⇒ rpn "1" -c "foo"

ダブルクォートは省略できることが多いのですが、慣れない間は囲んだほうが無難です。なお、本ウェブサイトの記事ではrpn標準版(98リビジョン)を使用しているため囲っていません。詳しくは技術サポートの「rpn TIPS」を参照ください。

注意rpnの障害情報と対策はこちら