QT PRO モーニングビジネススクール

QT PRO
モーニングビジネススクールWeb版

FM FUKUOKAで放送中「QT PRO モーニングビジネススクール」オンエア内容をWeb版でご覧いただけます。
ポッドキャスティングやブログで毎日のオンエア内容をチェック!

PODCASTING RSSで登録 PODCASTING iTunesで登録 電子書籍で記事を読もう! EPUB

ブログ&ポッドキャスト詳細

QT PROモーニングビジネススクール > ブログ&ポッドキャスト一覧 > アンケート調査結果の正しい使い方② (産業政策、通信政策、通信経済学/実積寿也)

アンケート調査結果の正しい使い方②

実積寿也 産業政策、通信政策、通信経済学

13/10/10

昨日は、アンケート調査を行う場合、数値データを得たいと思っている対象をきちんと選択した上で調査を実施しないと、そこから得られた数値は現状を正確に反映したものとはならないという点についてお話ししました。さらに、調査対象に含まれる対象者全員にアンケート票を配布して回答を得ることは現実的ではないので、調査対象を適切に代表する小集団を選抜して、それに含まれる人に対してのみアンケート票を送付して調査を行うことが通常であることもお話しました。今日はその続きからです。

対象グループ全員にアンケート票を配れない場合に問題となるのはどういう点でしょう。たとえば、福岡市民に今年の大濠公園の花火大会を見たかどうかという調査を行うケースを考えて見ましょう。この場合、一番困るのは、アンケート票の配布先が大濠公園周辺にあるマンション住民に偏ってしまう場合、あるいは、逆に、東区在住でかつ外出が不自由な高齢者に配布先が偏ってしまう場合です。
大濠公園周辺のマンション住民へのアンケートであれば、かなり高い確率で「今年の花火大会を見ました」という結果が返ってくることになりますし、後者の例であればそういった回答はかなり少なくなることが予想されます。いずれの場合も、福岡市民の平均値からは大きく外れている可能性が高いので適切な調査とはいえません。アンケートから得られた結果がきちんと福岡市民の平均値とみなせるようになるためには、アンケート票の配布先として選定された集団が、福岡市民の平均的な状況を代表していることが必要です。
例えば、花火大会に出かけていくのは年齢や性別に関係あるかもしれません。その場合、アンケートを配る対象集団の年齢構成や男女比はできるだけ福岡市全体のそれと同様であることが望ましいということになります。また、花火大会に出かけるか否かはお小遣いの量や友達の数、あるいは好きなテレビ番組にも影響される可能性があります。今年の花火大会は木曜日でしたが、木曜日の午後8時台にどうしても見逃せないテレビ番組がある人は花火大会をあきらめるかもしれません。つまり、アンケートによって正確な結果を得るためには、そうした細々した属性を正確に反映した配布先リストが必要になるわけです。

そのため、福岡市民全体の平均的な状況を正確に再現した配布先リストを人為的に作成するのは結構大変な作業になります。通常利用されるのが無作為抽出あるいはランダム・サンプリングと呼ばれるやり方で、分析対象グループ全体からランダムにアンケート配布先を選択するという方法です。この場合、ランダムというのは「いい加減」という意味ではなく、「対象集団に含まれるすべての個人について、アンケート票配布対象となる確率が等しくなるような方法」という意味になります。この方法を使えば、対象グループの特定の集団だけにアンケート票を送付してしまうというような状況はある程度回避することが可能です。ただし、ランダムに配布先を決めるということは、同じ目的のアンケート調査を同じ集団に対して複数回実施する場合、アンケート票の配布先は毎回違うことを意味します。そのため、アンケート調査によって計算される大濠公園花火大会への参加率は調査の度に少しずつ違った値をとることになります。つまり、ランダム・サンプリングによって得られる統計数値は、対象集団の正確な統計数値そのものではなく、常に一定の誤差を含んでいる数値であるということになります。つまり、アンケート結果で得られた平均値は誤差を含んだ一定の幅として考えなければならないということです。

ここで重要なのが、「信頼区間」という考え方になります。「アンケートから得られた福岡市民の大濠公園花火大会への参加率は○○%だ」といった単一の数値を用いる代わりに、「真の参加率が○○%から××%の間に入っている確率は95%です」という考え方をしましょうということです。
詳しい計算過程は省きますが、福岡市の人口は150万人ですから、ランダム・サンプリングで500人を抽出してアンケート調査をした場合、95%の確率で真の参加率が含まれる区間はアンケート調査から得られた平均値プラスマイナス最大4.4%の範囲ということになります。誤差の正確な範囲は推定値の水準によって異なり、例えば、アンケート調査の結果、大濠公園花火大会への参加率が25%という結果となった場合、誤差はプラスマイナス3.8%、真の参加率は21.2%以上28.8%以下の範囲にほぼ収まっているということになります。ということは、来年同じ調査を行った場合、参加率が28%という結果が得られたとしても、「今年と比べて3%増えた」と喜んではいけないということになります。それどころか、来年度の調査結果も同じような誤差を含んでいるはずですから、参加率が上昇したと確信をもって断言できるためには、33%以上の平均参加率が得られていることが必要なわけです。
経済政策や経営戦略を決定する際には、ずっと精度の高い、言い換えれば誤差が小さい推計結果が必要な場合もあります。誤差が小さければ、95%の確率で真の値が入る信頼区間も小さくできます。誤差を小さくするためには配布するアンケート票の数を増やすしかありません。先ほどの花火大会参加率の例で信頼区間の幅を半分にするには約4倍の数のアンケート票を配る必要があります。誤差をプラスマイナス1%にしようとするなら、6000枚以上のアンケート票を回収しなくてはなりません。大量のアンケート票を回収するためには大量のアンケート票を配布する必要があり、そのためには多額のコストが必要です。その意味でアンケート調査にどの程度の精度を求めるのかということ自体がひとつの重要な経営判断になってきます。

いずれにせよ、アンケートで得られた結果の解釈に際しては、誤差や信頼区間といった概念をしっかり理解する必要があります。単純に数値の増減に一喜一憂しているようでは、統計に踊らされて真実を見誤ってしまうことになります。まさに、ディズレーリがいうこところの「嘘には三種類ある。嘘と大嘘、そして統計である。」を地で行くことになりかねません。注意しましょう。

分野: 産業政策・通信経済学 |スピーカー: 実積寿也

トップページに戻る

  • RADIKO.JP
  • ビビックスマホ