■ TOP補論

 ▼ 乱数の発生とサンプリング

■ 乱数の利用

世論調査などで無作為に選んだ有権者にアンケートを実施することがある。このようにサンプリングには無作為に抽出することが重要である。世論調査は計算機で乱数を発生させ、そこから適当に抽出することが行われる。
 □例題1:乱数の関数 難易度:★ 目安時間:5分
 Excelで乱数を発生させるための標準関数は何か?

■ サンプリング

サンプルサイズ(sample size)とは、母集団からいくつの標本を抽出するかということである。
 □例題2:サンプリング 難易度:★ 目安時間:15分 例題集
  100個の玉(青:70個、赤:30個)で構成される母集団を作成する。そして、青:1、赤:0として抽出の実験をする。ここで、以下のような実験を行う。

 実験1 サイズ4のサンプルを10個
 実験2 サイズ16のサンプルを10個

実験の手続き

母集団をつくる(成功:1、失敗:0) [ツール(T)]-[分析ツール]の[サンプリング]を選択 [入力範囲]に母集団の範囲を選択 [標本の採取方法]はランダムにする。 出力範囲を決めて


母集団から標本を繰り返し抽出をすることで母集団の分布を標本の分布から推定する。

■ 標本分布

 □例題3:標本分布 難易度:★★★★ 目安時間:●分 例題集
  例題2のサンプルを元にして成功数を階級とした度数分布表とヒストグラムを作る。 実験をできるだけ多く繰り返し、分布がが分かりやすくなるようにする。
実験1
成功		頻度
数	比率	数	相対比率
0	0.00	****	
1	0.25	****	
2	0.50	****	
3	0.75	****	
4	1.00	****	
合計		100	1.00

実験2
成功		頻度
数	比率	数	相対比率
0	0.00	
1	0.06	
2	0.125
3	0.18	
4	1.00	
5	
6	
7	
8	
9	
10	
11	
12	
13	
14	
15	
16	

[入力範囲] ボックス サンプリングの対象となる母集団が入力されているデータ範囲のセル参照を指定します。第 1 列、第 2 列の順に、標本が抽出されます。

[出力先] オプション ボタン、ボックス

出力テーブルの左上隅のセル参照を入力します。抽出された標本は、出力範囲の 1 列に出力されます。[周期変化] をクリックすると、出力テーブルに抽出される値の個数は、入力範囲のデータの個数を周期で割った値に等しくなります。また、[ランダム] をクリックすると、出力テーブルに抽出される値の個数は、標本数に等しくなります。

[新規又は次のワークシート] オプション ボタン、ボックス

作業中のブックに新規ワークシートを挿入し、新規ワークシートのセル A1 に結果を出力します。新規ワークシートに名前を指定するには、右側のボックスに名前を入力します。

[新規ブック] オプション ボタン 新規ブックを作成し、そのブックの新規ワークシートのセル A1 に結果を出力します。

[標本の採取方法] グループ

[ランダム] をクリックし、標本を抽出する方法を指定します。

[標本数] ボックス 出力テーブルの列に抽出する値の個数を入力します。標本は、入力範囲の任意の位置から抽出されます。抽出された数値は、次に抽出を行うときも対象となります。

■ 母集団の推定

標本分布を見て、母集団の分布がどのような状態かを推論する。
この実験の結果は、母集団の成功(青が出る)比率は70%であるから、この母集団より抽出された標本の成功比率が70%に近似できればよい。
 □例題:推論 難易度:★★ 目安時間:10分 例題集
  これまでの実験結果から母集団はどのような分布であるかを推論する。標本の平均値はどうであるか?また、分散はどうであるか計算して、確認する。
2つの事象しか起こらない場合をベルヌーイ分布という。

 

last modified :2007.09.12