■ TOP補論

 ▼ 中心極限定理

■ 定理の意味

 正規分布の重要な特徴として、中心極限定理(central limit theorem)がある。これはどのような分布から観測された標本であっても、標本の数(サイズ)が十分に大きくなれば、標本平均の分布は正規分布に近づくという定理である。
 Excelによる実験で、この定理を視覚的に確認することができる。
 □例題1:乱数発生による母集団の作成 難易度:★★ 目安時間:10分  
 データの範囲が1〜100である1000個の乱数を発生させて、有限母集団(population)を作成する。この1000個のデータの平均(母集団平均)を計算する。
■必要なテクニック

 乱数を発生させるには、=RAND() を用いる。これは区間(0,1)の範囲で一様乱数を発生させる関数である。これを100倍すればよい。ただし、このままでは小数があり、四捨五入では0から100の101種類になるので、別途、処理が必要である。切り上げの関数(=roundup)を利用して、整数値とする。

■ 母集団の特性

 乱数を発生させ、擬似的に作成したデータを母集団とみなす。母集団の平均(母平均)や分散(母分散)が既知である。また、母分布は一様分布である。1000個のデータを利用して、計算を試みる。
 □例題2:標本平均の作成 難易度:★★ 目安時間:10分  
例題1の母集団から10個のデータを抽出(サンプリング)し、標本平均を作成する。その標本データの平均値を計算する。この計算を50回、200回、500回の3パターン作成する。すなわち平均のデータを50個、200個、500個集める。
■必要なテクニック

標本平均をランダムに抽出するには、分析ツールを利用する。[ツール(T)]-[分析ツール]の[サンプリング]を選択する。[入力範囲]に母集団から作成した平均の範囲を選択する。 [標本の採取方法]はランダムにする。出力範囲を決めてOKを押す。 [入力範囲] ボックスサンプリングの対象となる母集団が入力されているデータ範囲のセル参照を指定します。第 1 列、第 2 列の順に、標本が抽出されます。 [出力先] オプション ボタン、ボックス

■ 標本平均

母集団から任意の標本10個を抽出し、その標本平均値を計算する。平均の計算をいくつかのパターンで標本平均値とその分布を調査する実験を行えばよい。度数分布表からヒストグラムを描き、正規分布に近づいているかを確認する。
 □例題:度数分布表の作成 難易度:★★★★ 目安時間:●分  
  全階級を20程度にした階級値を決める。累積度数の関数は FREQUENCY( 範囲, 区間 )があるのでこれを利用するとよい。入力値に注意して各階級の度数を求めたら、相対度数(その階級の度数が全体に占める割合)を計算し、それを度数分布表に示す。
■必要なテクニック

相対度数をとる必要がある

乱数	    平均
=100*RAND() =AVERAGE(A1:A10)  
=100*RAND() =AVERAGE(A2:A11)  
=100*RAND() =AVERAGE(A3:A12)  
・・・・・・                          
・・・・・・     B50 まで(合計50)    
・・・・・・     B200 まで(合計200)
・・・・・・     B500 まで(合計500)
A509 まで
------------------------------------------------------------------------
階級値	累積度数(個)		度数(個)相対度数(%)
  5	=FREQUENCY(B1:B50,c1) ・・・ ・・・
 10	=FREQUENCY(B1:B50,c2)
 15	=FREQUENCY(B1:B50,c3)
・・・・
 95	=・・・・
100	=・・・・
合計	50				100%


■ 標本分布

度数分布表からヒストグラムを描くとサンプルサイズによる変化がわかる。
 □例題:3分布の比較 難易度:★★ 目安時間:●分  
   この手順を3パターン繰り返し、得られた3つのヒストグラムを作成・比較する。その平均値(母集団と標本)と分布状況はどのようになっているかをテキストボックスに100字程度コメントする。
■必要なテクニック

縦軸の最大値と最小値を固定した方がわかりやすい。


■ 定理の意味

 □例題:他の分布での確認 難易度:★★ 目安時間:20分  
   他の分布を使って同様な実験する。中心極限定理が成立していることを確かめる。
■必要なテクニック

last modified :2007.09.12