“学びたい”を刺激するメディア。

2022.03.06

column

「変数」「相関関係」って何? Excelで2つのデータの関係を分析する方法を解説!

「変数」「相関関係」って何? Excelで2つのデータの関係を分析する方法を解説!

データや統計が仕事に生かせるということをみなさんはご存じでしょうか。

「知っている」という人でも実際に日頃から統計学を仕事に生かせている場合は多くないのでは?

Schooの授業シリーズ『「統計学を仕事に活かす」-文系もExcelで実用できる統計-』は、「7日間集中講義!Excel統計学入門(オーム社)」「ビジネスマンのためのデータ分析&活用術(フォレスト出版)」など“仕事で実際に使える”統計学のスキルをやさしく教える著書で知られる米谷学先生を講師と迎え、タイトルの通り7日間で、Excelで習得できる統計分析について学べる授業です。

今回取り扱うのは第2回『「相関関係」を使って、なんとなくで売上要因を決めない』。2つのデータをExcelで分析して、マーケティングや営業などに活用する方法を学んでいきましょう!

目次

  • 広告効果を、データを使って探る方法は?
  • データの「変数」、そして「相関関係」とは?
  • 散布図から広告宣伝費と売上高の相関関係を読み取ろう

 

 

広告効果を、データを使って探る方法は?

 

 

さて、授業の冒頭では早速先生からリアルタイム受講生へ問いが出されます。

 

・Google AdsenseやFacebook広告などを使って、あなたのサービスの広告を出しました。このとき広告の効果を探る方法は?

 

●知りたいポイント●
・広告費をかければかけるほどより売れるのか?
・予算までお金を書けたらいくら売れそうか?

 

リーチ数、エンゲージメント、広告からの流入者数……などなど的確な回答が寄せられます。「一回だけではそれがまぐれかどうかわからないですよね?」と先生。そこで、注目したいのが「広告費と売り上げの関連」についての指標です。

 

この授業では、2つのデータの相関関係をExcelで可視化する方法をレクチャーしていきます。

 


データの「変数」、そして「相関関係」とは?

「データの「変数」とは」というテーマで先生が呼び出したのが、以下のExcelシートの画像を添付したスライド。

 

 

 

年月、給料手当、広告宣伝費、旅費交通費……といった経理上のデータが列、降順の年月データが行に格納されています。「この(列の項目の)ひとつひとつを「変数」と呼びます」と米谷先生。例えば「売上高と広告宣伝費の関連を探る」といった場合のように、2つの変数を対象に分析する場合は「2変数の分析をする」というように考えます。

 

もちろん1変数のみを分析の対象とする場合もあり、それには例えば以下のようなケースが挙げられます。

 

・基本統計量を求める(代表値など1つの変数について1つの値で特徴を探る)
・グラフで表す
→分布を探る
→外れ値の有無を探る
→→外れ値が存在する原因を考える

 

「基本統計量」とは平均、標準誤差、最頻値などデータの基本的な特徴を表す値のこと。「外れ値」はデータの中で全体の傾向から極端に外れた特徴を示す値を意味します。グラフにすることで分布や外れ値を把握しやすくなり、そこから外れ値の原因などを推論することで貴重な知見が得られる場合があります。

 

 

 

さらに、2変数のデータの分析に話を進めましょう。そこで出てくるのが「関連を探る」という手法です。例えば「広告を打った→売り上げが上がった」のように「原因にあたる項目」と「結果にあたる項目」を探ったり、「先に起こること」と「後に起こること」を考えたりすることがその例として挙げられました。

 

「売上高って、増えたり減ったりするんですよ」と米谷先生。それには理由があるはずです。2つの変数を分析することで、“増えたり減ったり”の要因が見つかるかもしれません。

 

ここで提示されたのが「広告宣伝費」と「売上高」のデータ。「『売上高』の要因に『広告宣伝費』があたる」と推論して、「一対のデータ」を分析していきます。

 

データの関連には、「一方が多い(少ない)場合はもう一方も多い(少ない)」<正の相関>や「一方が多い(少ない)ときもう一方は少ない(多い)」<負の相関>のように関連が見いだせる場合もあれば、関連がまったく見いだせない場合もあります。

 

しかし、「関連がない」と分かったこと自体が重宝すべき情報の一つともなります。

 

このように、見出される2つの変数の間の関連を「相関関係」と呼ぶのです。

 


散布図から広告宣伝費と売上高の相関関係を読み取ろう

以下に示すのが、広告宣伝費と売り上げの月次データを散布図として表したExcel上のチャート図です。

 

 

 

縦軸が売上高、横軸が広告宣伝費にあたり、全体的に右肩上がりになっている傾向が読み取れます。これはすなわち──広告宣伝費が増加すれば売上高も増加し、広告宣伝費が減少すれば売上高も減少している──正の相関があるということです。

 

ここで、散布図から読み取れるパターン例が複数示されました。

 

①強い正の相関の例
②やや強い正の相関の例
③相関がない例
④やや強い負の相関の例
⑤強い負の相関の例

 

 

 

さらに提供されるのが「相関関係をひとつの数字で表す」テクニック。「さまざまな大きさの数字に関係なく、2つの変数(数値項目)の関連度合いを表す数値を『相関係数』と呼びます」と米谷先生。

 

相関係数は必ず0を中心に「-1から+1」の範囲に収まります。そして、「-1≦相関係数<0」の場合が「負の相関」、「相関係数=0」の場合が「相関係数なし」、「0<相関係数≦1」の場合が正の相関にあたるのです。また、0から離れ-1または1に近づくほど、相関係数は“強い”正あるいは負の相関を表しているということも覚えておきましょう。

 

相関係数の読み取り方に特に統一の基準はないということですが、おおよその目安として以下を参考にしてみてください。

 

・0.8や0.9以上:強い相関がある
・0.5以上:相関がある
・0.2以上:弱い相関がある
・0.2未満:(あまり)相関関係はない

 

これは、+でも-でも同様です。先ほどの広告宣伝費と売上高の相関係数は0.9であり、そこには「強い相関がある」ことが読み取れます。

 

 

 

「ここで相関が偶然でないかを判定する方法」についてリアルタイム受講生から質問が寄せられました。先生は、「小学生や中学生の学力調査の結果と朝食をとる頻度に相関があるように見出されたが、朝食をとること自体に学力を高める効果があったわけではなかった」という過去の事例に言及。「朝食をしっかりとれるような生活習慣を整えられる家庭環境」と「学力」に真の因果関係があったという事実を紹介し、見出された「相関関係」を「ただの相関関係なのかあるいは因果関係なのか」を確認してみることの重要性を説きました。

 

授業ではさらに深く、相関係数を扱うための具体的な方法についても解説されていますので、ぜひご覧ください。

 

文=宮田文机

今回取り上げたSchooの授業はこちら!
『「相関関係」を使って、なんとなくで売上要因を決めない』

 

今日の生放送

おすすめ記事

ペンシルからのプッシュ通知を設定しておくと、新着記事のお知らせなどをブラウザ上で受信できて便利です。

通知を受信しますか?