【統計学】母集団と標本について解説 母数、標本数、サンプルサイズ、標本抽出とは

母集団と標本

本記事では、統計学における基本的な概念である母集団標本について解説します。関連用語についても、例を基に紹介します。

母集団と標本とは?

母集団(population)とは、調査や分析の対象となるすべての要素の集まりを指します。

例えば、ある地域の全住民、製造された全ての製品、特定の時間帯に視聴している全視聴者などが母集団に該当します。

統計学においては、母集団全体を調査することが理想的ですが、時間やコストの制約から、全てを調べるのが現実的でない場合が多いです。そのため、母集団から一部を抽出して調査を行います。この抽出された一部のデータが標本(sample)です。

標本を用いることで、全体を調査することなく、母集団の特性(平均値、ばらつきなど)を効率的に推測することができます。

ある学校の生徒の成績データを例に考えていきましょう。

母集団を「学校の全生徒の成績データ」と定義します。この場合、全ての生徒の成績が母集団に含まれます。しかし、全員の成績データを集めるのは現実的に難しいため、一部の生徒の成績を調べ、そのデータを基に全生徒の成績傾向を推測します。

この一部の生徒が標本です。例えば、学校全体で1000人の生徒がいる場合、そのうち100人をランダムに選んで成績を調査することで、標本を得ることができます。この標本を使って、学校全体の成績傾向(母集団の特性)を推測します。

母数、標本数、サンプルサイズなどの関連用語

学校の成績データを例に、統計に関連する用語を解説します。

  • 母数(parameter)
    母数とは、母集団全体の特性を表す数値です。
    例えば、学校全体の生徒の平均点や、成績の分散が母数に該当します。母数は母集団全体を調査して、初めて正確に計算できます。たた、全生徒の成績を調べるのが難しい場合、標本データから母数を推測することができます。
  • 標本数(number of samples)
    標本数は、調査で抽出した標本の数を指します。
    例えば、学校の1000人の生徒から100人を選んだ場合、これが1つの標本です。もし、異なる学年ごとに標本を抽出し、1年生、2年生、3年生からそれぞれ100人ずつ選ぶ場合、標本数は3です。
  • サンプルサイズ(sample size)
    サンプルサイズとは、1つの標本に含まれる要素の数を指します。
    例えば、学校の1000人の生徒から100人を選んだ場合、サンプルサイズは100人の生徒です。サンプルサイズが大きいほど、母集団全体の特性を、より正確に推定できる傾向がありますが、調査にかかる時間やコストも増えます。適切なサンプルサイズを設定することが重要です。
  • 母平均(population mean)
    母平均は、母集団全体の平均値を指します。例えば、学校全体の生徒の平均成績が80点の場合、これが母平均です。母平均が分からない場合は、標本から得られる標本平均(sample mean)を用いて推定します。
  • 標本平均(sample mean)
    標本平均は、標本から得られたデータの平均値です。例えば、学校の1000人の生徒から100人を選んだ場合、100人の生徒の平均点が82点であれば、これが標本平均となります。

標本抽出の方法とその影響

標本抽出の方法は、統計調査の結果に大きく影響します。正確な推測を行うには、標本が母集団を適切に代表するものであることが重要です。ここでは代表的な標本抽出方法を説明します。

  • ランダムサンプリング(無作為抽出)
    母集団の中から無作為に標本を選ぶ方法です。無作為に選ぶことで、母集団の特性を偏りなく反映できます。例えば、学校全体の1000人からランダムに100人を選んで調査します。
  • 層化サンプリング(ストラティファイドサンプリング)
    母集団をいくつかの層(グループ)に分け、各層から無作為に標本を抽出します。例えば学校全体から生徒を選ぶ場合、1年生、2年生、3年生という学年ごとに生徒をグループ化し、各学年から標本を選びます。これにより、各学年の特性を均等に反映した標本を得ることができます。
  • 系統サンプリング(システマティックサンプリング)
    母集団のリストから一定の間隔で標本を抽出します。例えば、学校の生徒名簿から5人ごとに1人を選ぶ方法です。名簿がランダムでないと偏りが生じるリスクがあります。
  • クラスターサンプリング(集落抽出)
    母集団をクラスター(集団)に分け、クラスターごとに標本を抽出します。例えば、全学年から3つのクラスをランダムに選び、そのクラス内の全生徒を調査する方法です。

標本抽出の影響

標本の抽出方法は、調査結果にバイアスを生む可能性があります。例えば、特定の学年や優秀な成績の生徒だけが選ばれると、学校全体の成績傾向を正確に反映できません。適切な抽出方法を選び、母集団を正確に代表する標本を得ることが重要です。

本メディアの記事等の内容には細心の注意を払っておりますが、正確性を保証するものではありません。もし記事内に誤りや不正確な情報がございましたら、こちらのお問い合わせフォームよりご連絡ください。

当メディアは、読者の皆様からのご指摘を大切にし、内容の見直しや修正を行うことで、より有益な記事を提供していく所存です。皆様のご理解とご協力をお願いいたします。