そのアンケート結果、信じられますか？統計・調査の「罠」に気づくためのデータ・リテラシー- Schoo PENCIL

2021.09.24

そのアンケート結果、信じられますか？統計・調査の「罠」に気づくためのデータ・リテラシー

世論調査や企業によるアンケートの集計結果など、私たちの身の回りにはデータがあふれています。

あなたはその内容を鵜呑みにしてはいませんでしたか？

数値で表されているのだから安心だろうと思考停止してしまっては、思わぬところで足元をすくわれるかもしれません。データは私たちの誤解を呼んだり思い込みを助長したりすることにも利用できるのです。

そうした統計・調査に潜む「罠」を見極めるためのデータ・リテラシーを授けてくれる授業『統計・調査に潜む「罠」を見極めるためのデータ・リテラシー
』が、Schooにて開講されました。講師は霞が関、自治体勤務を経て現在は長野県立大学教授として行政学、地方自治、公共政策などについて研究している田村秀先生です。行政やマスコミを含めてデータがいい加減に使われている例がみられると田村先生は話します。

気づかぬうちに「罠」に足を取られ、間違った情報を信じたり発信したりしてしまわないよう、田村先生の講義をまずはテキストで押さえましょう！

難解な数学や統計の知識の前にデータ・リテラシーを身につけよう

△【画像クリックでSchoo授業動画へ】（会員登録で1時間無料視聴できます）

「『視聴率』『内閣支持率』『経済波及効果』『都道府県ランキング』など巷にはさまざまなデータがあふれています」と田村先生。私たちはこれらを無条件に信頼してしまいがちですが、誤解につながるケースも少なからずあるということです。

「ビッグ・データの時代」といわれる現代、難解な数学や統計の知識の前に身に着けておきたいのがデータを読み解く力──データ・リテラシーなのです。

今回テーマとなるのは「アンケート」。同じ質問を複数の人にして、結果を集計した結果です。ここで大事なのは、“誰に質問するか”ということ。対象となる集団全員に質問をするためには多大な経費と労力がかかるため、無作為抽出によるサンプリングが行われることが多いです。集団全体（母集団）から無作為にサンプル（標本）を抽出し、彼らに質問した結果を、アンケート結果として　利用する手法です。

△【画像クリックでSchoo授業動画へ】（会員登録で1時間無料視聴できます）

ちゃんとしたアンケートとして代表的なものの一つが「世論調査」。世論は、「世間一般の人が唱える論。社会大衆に共通な意見」と定義されます。すなわち、特殊な論や特定の人の意見は世論には該当しないのです。

田村先生曰く、「大事なのは『定義』にこだわること」。データについても注意深く定義にこだわることがデータ・リテラシーを鍛える第一歩になるということです。また、無作為抽出によるサンプリングを利用している以上、結果が絶対的と保証されるわけではないのも重要なポイントです。世論調査の結果はあくまで「だいたいこうだ」という目安だということを肝に銘じておきましょう。

例えばサンプル数400の調査で内閣支持率が50％という結果が得られた場合、日本人全体の内閣支持率は、95％の確率で50％プラスマイナス5％の範囲に収まります。サンプル数1600の場合はプラスマイナス2.5％、サンプル数1万の場合はプラスマイナス1％となります。

内閣支持率の調査結果にまつわる2つの問い

95％という数値は、私たちが学生時代に慣れ親しんだ「偏差値」に置き換えて考えることもできます。例えば、95％はおおよそ30から70までの範囲、99％は20から80までの葉にということになります。このように偏差値に置き換えてどの範囲まで含まれるのか考えてみることも、データ・リテラシーの向上につながるということです。

このような知識を感覚に昇華することで、データを見た際、間違いや背景に潜む意図に即座に気づけるようになるでしょう。

△【画像クリックでSchoo授業動画へ】（会員登録で1時間無料視聴できます）

それでは、ここで問題です。

2017年7月に実施された安倍政権の内閣支持率についての調査結果は「産経新聞：34.7％」「朝日新聞：38％」でした。それでは、朝日新聞の結果の方が内閣支持率は高いといえるでしょうか？
ちなみに、回答者数はどちらも千数百程度でした。

リアルタイム受講生の間で意見が分かれる中で、先生から以下の問いが追加されました。

2018年3月の調査結果は「産経新聞：45％」「朝日新聞：31％」でした。今度は、産経新聞の結果の方が内閣支持率は高いといえるでしょうか？

正解は、前者は「いえない」、後者は「いえる」です。その理由は、前述の誤差の問題にあります。無作為抽出でサンプル数が千数百の場合、誤差はおおむねプラスマイナス3％程度となります。すなわち、2つの調査の間に6％以上の差があれば高い（あるいは低い）と言えるのです。

前者の場合は3.3％しか差がありませんが、後者は14％離れていますね。その違いが、結果の表す意味の違いとなるのです。とはいえ、信頼水準95％のため、これにも例外はあります。

△【画像クリックでSchoo授業動画へ】（会員登録で1時間無料視聴できます）

ここでリアルタイム受講生から質問です。「一般的な世論調査の平均回答率は？」という質問への答えは「50～60％が多い」、「サンプル数に対する誤差はどんなアンケートにも当てはまる？」への答えは「基本的に当てはまる。ほぼ方程式のようなものなので覚えておいて損はない」というものでした。

インターネット・アンケートは世論調査とは言えない

ここで、「インターネット・アンケートは世論調査とは言えない」と田村先生。「特定の人ばかりの声を集め無作為抽出になっていない」など注意すべき点が多数存在するということです。

また、ワイドショーでよく見る「100人に聞いてみました」といったアンケートは「完全に間違いです」と先生は語ります。無作為抽出というのは、手当たり次第にという意味ではありません。無作為抽出（ランダムサンプリング）のランダムは、「誰もが対象になる確率は一緒」ということを意味します。これは対象が1000人でも10000人でも、基本的には変わりません。

世論調査を福井先生は「味見」に例えます。例えば味噌汁の味を確かめるとき、私たちは鍋全体の一部を掬い取って判断します。その際大事なのが、「かき混ぜる」ということ。そうすることで味噌と水分の割合を均一にしなければ全体の味は判断できません。同様に、サンプルが母集団から選ばれる確率を均一にしなければ、世論調査において全体の傾向は判断できないのです。

時折、無作為抽出で選ばれた対象者に追加で別の集団を加えてアンケートを実施してしまう例が見られます。これは、かき混ぜたお玉の中に別の味噌を追加するようなものであり、鍋全体の味＝母集団の結果の判断を阻害してしまう操作といえます。