はじめに
統計と聞くと何やら難しいものだと思われていますが、基本をしっかりと学んでいけば「統計の使い方」を理解することができます。確かに学術的に統計の基礎や応用を学ぼうとすると証明の理解などで難解になります。
しかし、統計の原理や公式の概要を理解して「統計を利用する」ことができれば、日常やビジネスにおいて、十分に活用できるのではないでしょうか。この講座では統計をツールとして使いこなすことを目的に説明していきます。
統計のはじまり
そもそも、統計は何故、必要になったのでしょうか。統計の歴史はイギリスとドイツに始まりますが、まずは集計ありきでした。国勢調査にあるように全てのデータを集めて算術的にカウントし、合計や平均を出すことが基本でした。そこに、フランスの確率論が融合して、統計学としての位置付けを得るのです。
全てのデータを集めて統計処理を行なうこの手法は、その後に代表値や散布度・相関・回帰を加えて、記述統計学へと続いていくのですが、その流れの中において、17世紀から18世紀に掛けてガウス分布が登場します。驚くことに、大量のデータを収集すると、ほとんどの事象がガウス分布に従うのです。そこで、大量データを収集した後にガウス分布を元にデータを分析する手法が一般化しました。記述統計学の全盛です。
しかし、時代が進むとガウス分布に従わない現象も多いことが分かってきたこと、大量のデータを集めることがコスト的にも技術的にも難しいことが多いことなどから、新しい統計学への期待が高まりました。そして、ようやく現在、大量のデータを収集せずに少数のサンプルから全体の特徴を捉えようとする推測統計学へと辿り着いたのです。
傾向を知るには統計しかない
ところで、目の前に数字の書かれたカードが山積みになっているとします。この大量のカードに書かれた数字が全体としてどのような傾向や特徴を持つのかをいかにして知ることができるのでしょうか。
「全ての数を記録する」「特徴のある数字だけ記録する」「同じ数をカウントしてみる」「全部を合計してみる」「ある範囲の数だけを集めてみる」「グラフ化してみる」…。改めて考えると大量データの全体的な特徴を捉えることは意外に難しいと感じます。全ての数字を暗記して何かの神がかり的な発想とひらめきによって全体を理解するということもあり得るかもしれませんが、一般的には何かの(数値的な)指標に頼った方がよさそうです。
その指標を出してくれるものが統計です。統計は数の集団からその集団の特徴を掴むための数値指標を出してくれます。平均もその1つです。大胆にもデータ全体の数値を全て合計し、データの個数で割った値を集団の代表値として捉えます。
100個の数字でも100万個の数字でも平均すればたった1つの数字に集約されて全体の特徴を表すことになります。もちろん、平均だけでは全体の特徴を正確に表し、理解することはできません。平均の他に、分散や標準偏差、度数分布などの知識がないと全体を捉えることはできません。
手っ取り早く「使える統計」を
そうなると、やはり学術的な書籍や地道な計算が必要なのでしょうか。本講座ではこれらの基本的な統計学手法を学ぶ道のりを最短にするため、rpnという電卓ソフトを使って説明していきます。これにより、統計的手法をどうやって使うかということだけに注力して、計算作業なしに結果を得ることができます。
本講座をしっかりと学び終わった頃には、記述統計的な手法を使いこなしている自分に気づくことでしょう。
ビジネス統計講座を受講するには、別途rpn標準版を購入する必要があります。詳しくは本ウェブサイトのプロダクトを参照ください。
本講座の記事やプログラムの正確性については最大限の注意を払っていますが、これらを利用することにより生じたいかなる損害についても、一切の責任を負えませんので、あらかじめご了承ください。
本講座は公式の証明、理論的背景の説明には注力せず、統計的な手法を利用することに重点をおいて解説しています。そのため、学術的な表現が厳密ではない部分があります。また、出典明記のないデータは現実に似せて人工的に作成したものなので、現状に即していない可能性があります。