データ分析・上級問題チェック
問題 13 /40
正規分布に関する説明で、誤っているものはどれか。
選択 1
標準正規分布とは、平均1、分散0のデータ分布である。
選択 2
あるデータが正規分布に従うと仮定した場合、このデータを標準化すると標準正規分布表を使って確率を求めることができる。
選択 3
正規分布は平均を中心とした左右対称の釣鐘型の分布である。
選択 4
正規分布のカーブの下の面積は確率を表しており、合計値は1である。
解説
選択肢1が正解です。
標準正規分布は「平均1、分散0」ではなく、「平均0、分散1」のデータ分布を表します。
この釣鐘型のグラフが標準正規分布のグラフです。中央が平均0、左右のバラつきが分散1になっています。
x軸は確率変数で、y軸は確率密度です。確率変数は対象となるデータそのものを表しており、確率密度は値の出やすさを表しています。上のグラフであれば、確率変数「0」の確率密度が「0.4」で、最も出やすいことを表しています。曲線の内側の面積を積分で計算すると「1」になり、確率の合計「1(100%)」を表しています。
例えば人の身長やテストの点数は、通常は「平均0、分散1」になりません。ただ、データをグラフにしたときに釣鐘型になっていれば、正規分布に従っていると言えます。その場合、標準正規分布を使って確率を求めることができます。
例えばテストの平均が70点、標準偏差が10点で、テストの結果が正規分布に従っていると仮定します。このテストで80点以上が何人いるか推測する場合を考えます。
最初に、次の式でテストの点数を標準化します。標準化することで、テストの点数の分布が「平均0、分散1」の標準正規分布に従うようになります。
この式に従って「80点 - 平均70点 / 標準偏差10点」を計算すると「1」になります。この「1」を次の標準正規分布表に当てはめます。
縦の軸が小数点第1位以上、横の軸が小数点第2位以下となっています。今回の「1」は「1.000」のため、縦が「1.0」、横が「.00」となり、交差する青いセルの「0.159」が確率になります。これを百分率で表すと「15.9%」となり、80点以上の人は全体の「15.9%」になることが分かります。
グラフで表すと、右端の80点以上の領域が「15.9%」になります。
このように、標準正規分布は「正規分布のベースとなるもの」と考えると理解しやすいです。
なお、確率分布は正規分布以外にもt分布やパレート分布などがあり、対象となるデータが従っている分布に合わせて利用します。
(公式書籍 p.87-89)

この式に従って「80点 - 平均70点 / 標準偏差10点」を計算すると「1」になります。この「1」を次の標準正規分布表に当てはめます。
縦の軸が小数点第1位以上、横の軸が小数点第2位以下となっています。今回の「1」は「1.000」のため、縦が「1.0」、横が「.00」となり、交差する青いセルの「0.159」が確率になります。これを百分率で表すと「15.9%」となり、80点以上の人は全体の「15.9%」になることが分かります。
グラフで表すと、右端の80点以上の領域が「15.9%」になります。
