“学びたい”を刺激するメディア。

2023.05.23

column

もう「誤差ですよね?」なんて言わせない! 情報に「正確性」と「説得力」を持たせる統計指標の基礎の基礎

もう「誤差ですよね?」なんて言わせない! 情報に「正確性」と「説得力」を持たせる統計指標の基礎の基礎

社の方針会議、企画のプレゼンなどに用いられると正確性と説得力が増す統計指標。「統計では~」といった言葉から始まる話は、現代社会において信憑性が高い傾向にあります。

ただ、そんな統計指標を「苦手」と感じる人は多いのではないでしょうか。また統計学の活用イメージが湧きにくいゆえに「必要だと思うけど、どう使えば良いかわからない」といった疑問を抱く人も少なくないはず。

そんな統計指標について基礎から学べるのが「『それ誤差ですよね?』と言わせない統計指標」という授業。講師を務めるのはExcelで統計学を教える研修講師の米谷学先生です。

目次

  • 基本統計量の特徴を理解しよう!
  • Excelで基本統計量を出力する方法

 

 

基本統計量の特徴を理解しよう!

統計学を用いて情報に正確性と説得力を持たせるには、それぞれの指標の特徴を覚えることが大切。米谷先生は、統計学の中でもよく用いられる「基本統計量」について解説をします。

 

「基本統計量」とは、データの特徴を端的に表す際に用いられるものの総称。「合計」「代表値」「ばらつき(標準偏差)」「分布の形」などがそれらに当てはまります。

 

ちなみに「代表値」も「平均値」「中央値」「最頻値」といった3つの指標の総称。この中で先生がまず覚えてほしいと述べたのが「代表値」でした。

 

 

 

1つ目「平均値」とは文字通り、あるデータの平均を示した値のこと。ビジネスシーンでも、飲み会の時などで「割り勘」という言葉を耳にしますが、この割り勘こそが統計学でいう平均値となります。

 

2つ目「中央値」とは、データを順番に並べたときにちょうど中央に位置する値のことです。数値のばらつきが多く平均値が出しにくい場合に用いられることが多いのだそう。

 

3つ目「最頻値」は、データの中でもっと多く見られる値のことを指します。

 

では、これら指標にはどんな特徴があるのでしょうか?先生は「平均値」を例に、以下のスライドを用いながら解説を始めます。

 

 

 

「平均値」の特徴1つ目は、データ内で突出した値に引っ張られやすいという点です。 上のスライドは、2種類のデータの平均値を出したもの。青色と茶色の丸で囲まれた値の合計と平均値が載っています。両者の違いは、1番左の値だけ茶色の方が21と大きいくらいですが、平均値は3異なっています。「平均値」は、どれか1つでもデータの値が増減すると、同じように増減するとのこと。

 

 

 

2つ目の特徴は、「平均値」は必ずしも多勢を表すものではないという点です。上のスライドは、あるイベントに参加した人の割合を示したもの。横軸を年齢、縦軸を参加人数としています。このグラフの平均値は赤い縦線の部分で32歳になるため、参加者の平均年齢は32歳であると言えますが、参加人数の割合としては少なめ。このことから、平均値は必ずしもその集団の中で多勢になるとは限らないということが分かるのです。

 

もちろん他の指標にもそれぞれ特徴があります。ビジネスシーンで用いるためには、まずこれらの特徴を把握することが大事とのこと。「それぞれの特徴が理解できれば、それぞれの特徴にあった方法でデータを分析できる」と先生は語ります。

 


Excelで基本統計量を出力する方法

続いて授業で触れられたのは、基本統計量の求め方についてです。指標ごとに計算式はあるものの、仕事中にそれらを一つずつ思い出しながら計算すると、時間がかかってしまいます。データが複数ある場合はなおさらでしょう。

 

そこで先生は、Excelを用いた基本統計量の求め方を紹介します。Excelを使えば、複数のデータの基本統計量も一気に出力できるとのこと。

 

例として用いられたのは「ページA」と「ページB」と称されたデータ。この2つのデータの基本統計量を一気に出力し、その差を分かりやすく表していきます。

 

まず、Excel内上部の「データ」タブから、右端の「データ分析」をクリック。

 

 

 

データ分析のウィンドウが出てきたら、「基本統計量」を選択して「OK」をクリック。

 

 

 

次に「入力範囲」を決めます。基本統計量を求めたいデータのセルをドラッグすると、自動で入力範囲が記入されます。

 

その下「データの方向」は、Excel内のデータが表示されている方向に合わせて変更します。スライドでは青く囲まれた部分がデータとなっており、縦方向に値が並んでいるため、「列」を選択。横に値が並んでいる場合は「行」を選択します。

 

 

 

最後に「出力オプション」の項目から基本統計量を出力したい場所を選択します。授業では「新しいワークシート」をクリックし、「ページA」と「ページB」両方の基本統計量を出力させています。短時間で複数の基本統計量を出して、その差をわかりやすく提示したい場合は、ぜひこの方法を用いてみましょう。

 

 

 

授業ではこの後、各データの基本統計量を比較したときに生まれる差が、「誤差」ではなく正確な差であると証明するための手法が紹介されます。用いられたのは「統計的仮説検定」というもの。

 

名前だけ見ると難しそうに感じますが、情報に説得力を持たせるためには理解しておいた方が良い内容です。米谷先生も具体例を交えつつ、一つずつ丁寧に解説してくださいます。統計学をビジネスシーンで用いたい人は、ぜひ受講してみましょう!

 

文=トヤカン

今回取り上げたSchooの授業はこちら!
『「それ誤差ですよね?」と言わせない統計指標』

関連記事

おすすめ記事

ペンシルからのプッシュ通知を設定しておくと、新着記事のお知らせなどをブラウザ上で受信できて便利です。

通知を受信しますか?