QT PRO モーニングビジネススクール

QT PRO
モーニングビジネススクールWeb版

FM FUKUOKAで放送中「QT PRO モーニングビジネススクール」オンエア内容をWeb版でご覧いただけます。
ポッドキャスティングやブログで毎日のオンエア内容をチェック!

PODCASTING RSSで登録 PODCASTING iTunesで登録 電子書籍で記事を読もう! EPUB

ブログ&ポッドキャスト詳細

QT PROモーニングビジネススクール > ブログ&ポッドキャスト一覧 > サンプリング③ (ビジネス統計/寺﨑新一郎)

サンプリング③

寺﨑新一郎 ビジネス統計

16/12/16


今回はサンプリング③としてお話をします。
前回の放送では「作為抽出法」について、「便宜サンプリング」と「スノーボールサンプリング」、雪だるまサンプリングに焦点を当てて説明しました。「作為抽出法」というのは、「作為」という言葉が「自分の意思」を意味しているように、作為的に母集団から、調査する人の判断に応じて、サンプル抽出するという方法になります。特徴としては集めやすい所から集めるという事なので、あまり費用や時間はかかりません。ただ一方で、作為的に、サンプルを集めるため、サンプルが母集団を代表するとは言い難いという欠点もあります。ただ、事前調査をする場合や調査の対象者にあたるのが難しい場合には「作為抽出法」は大変有用なサンプリング手法です。

今回は、サンプリング③ということで、「無作為抽出法」について説明したいと思います。
では、そもそも「無作為抽出法」における「無作為」とはどんな意味でしょうか。
端的にいうと、ランダムに選ぶということです。実際には「無作為抽出法」は英語だと「ランダムサンプリング」の日本語訳です。つまり、「無作為抽出法」というのは、母集団からランダムにサンプルを集める方法です。もう一度復習になりますが、母集団というのは、検討しようとしている調査対象全体のことを指します。「作為抽出法」の場合には、母集団の特性を一部のサンプルから推測するということになるため、誤差が生じる場合があります。サンプリングではこうした誤差をできるだけ小さくするということが大切なので、この点で「無作為抽出法」は非常に優れているといえます。

今回は「無作為抽出法」の中でも、「単純無作為抽出法」と「層別抽出法」という2つの方法を紹介したいと思います。

まずは「単純無作為抽出法」についてみていきましょう。
この方法は母集団が比較的小さい時、例えば、福岡市東区にある高等学校で学ぶ高校生の意識調査を行うといった場合等に有効です。サンプルの選び方としては、高校生に一連の番号を割り振り、乱数表というものを使います。乱数表は、ランダムに数字が表示されている表であり、その番号に当てはまる人をサンプルとして抽出していく方法です。例えば、0から100までの乱数表を作りたい場合は、エクセルのRAND関数というものを用いれば簡単に作ることが出来ます。ちなみにRAND関数のRANDとは、ランダム化するという意味のランダマイズを意味しています。こういうものを使えば簡単な乱数表を作ることが出来ます。エクセルのこういった機能は意外と便利です。インターネットで「RAND関数」と検索にかければ、エクセルでの方法が簡単に出てきます。実際にしてみようと思われた方は、さほど手間取ることはありませんので、こういったものを参考にされてみるといいと思います。

続いて「層別抽出法」についてみていきましょう。
「層別」というのは「層に別ける」と書いて「層別」です。
漢字では地層の「層」と同じ「層」ですが、統計学では、「グループに分けること」を「層別する」というふうに言います。つまり、層別法というのは、2段階にサンプルを分けて抽出する方法です。世論調査や大規模な調査でよく利用される方法です。
例えば、世帯や個人を抽出するという場合、まず、第一段階として調査地域を地域ブロックに分けたりします。例えば、北海道や東北、関東と分けます。その後は人口規模等も、100万人以上、30万以上と分けることが出来ます。第二段階として、そこから「単純無作為抽出法」で、ランダムにサンプル抽出するという方法です。こうすると、単純無作為抽出法の精度を向上させることができるというメリットがあります。これもよく使われる方法ですが、一般的にはそれほど大規模調査を個人で行うことはほとんどないと思います。ですから、基本的には「単純無作為抽出法」が一番便利ではないでしょうか。

さて、授業等でもよく聞かれることなので、疑問に思われることだと思うのですが、サンプルはどの程度集めればよいのでしょうか。
これには一律の目安はありません。ただ、考え方はあって、意思決定の重要性が高くなるほど、つまり大事な意思決定が必要なときに分析結果が必要です。これに加え、分析に用いるデータの数が多くなっている時、分析の方法がすごく難しいときなどです。アンケート調査では、調査表を配っても戻ってこないことがよくあります。実際に会社等にアンケートを送付してみた友人がいるのですが、1000社ぐらい送っても、実際戻ってくるのは100社もないぐらいです。こういうのを完了率が低いというのですが、たくさん配布する必要があるので、そういった時ほど大きなサンプルサイズが求められます。予備調査や探索的なリサーチでは小さいサイズで結構なのですが、本調査などの検証的なリサーチの時は、大きなサンプルを求められると言えると思います。

それでは今日のまとめです。
今回はサンプリング③として「無作為抽出法」について、「単純無作為抽出法」と「層別抽出法」に焦点を当てて説明をしました。「無作為抽出法」の「無作為」とは、「ランダムに」という意味ですので、母集団、つまり調査対象者の全体からランダムにサンプルを抽出する方法になります。比較的小規模な調査を行う場合は、「単純無作為調査」が便利ですが、大規模な調査をするのであれば、サンプルを層に別けると書く、「層別抽出法」が非常に便利です。「無作為抽出法」というのは、作為抽出法に比べて費用も時間もかさむため、慎重に行う必要があります。できれば「作為抽出法」を用いて、集めやすいサンプルから集め、一度データを取って分析し、それから本調査として「無作為抽出法」による調査を出来れば、理想的でしょう。サンプリング手法を知っているか知らないかで、実務や研究開発において成果に大きく差が付くことになりますので、今日教わったことをぜひ参考にされてみてください。

分野: ビジネス統計 |スピーカー: 寺﨑新一郎

トップページに戻る

  • RADIKO.JP
  • ビビックスマホ