数学の基礎概念

☆☆☆数学の基礎概念☆☆☆
確率と統計

－確率と統計－

　確率とは、事象が実現すると期待される割合のことである。確率を現実的な経験の世界と関連付ければ、何回でも繰り返すことができる何らかの試行行為があるとする。そして、その試行行為の結果、起こり得る事象の定まった集まりを考えると、起こる事象もあれば、起こらない事象もある。この事象全体の集まりを確率事象と呼び、多くの試行行為をｎ回繰り返し、起こる事象の回数がｍ回とするならば、ｍとｎとの比、すなわちｍ／ｎ(０≦ｍ／ｎ≦１)を事象が起こる確率(算術確率)という。

　統計とは、対象となる集まりのある特性あるいは標識について、その全体としての特徴を定量的に表現することである。事象を調査して、数量で把握し、得られた数値データ(統計量)を用いて、その性質を調べ、集まりの全体の特徴を定量的に表現する。なお、一般に、集団的な事象や現象を数字で表したものは統計的データと呼ばれている。

１．確率分布
　硬貨投げには、表と裏、2つの根本事象がある。サイコロ振りには、1から6まで、6個の根本事象がある。この時、それぞれの事象に数値を割当てる。硬貨投げの表には１、裏には０を割当てる。サイコロ振りの１から６までは、数値の１から６を割当てる。この根本事象に割当てる変数は確率変数と呼ばれる。また、その数値は確率変数の実現値であり、出現確率である。

　確率変数Ｘの実現値(出現確率)ｘ₁，ｘ₂，・・・，ｘ_nが飛び飛びの値の時、Ｘは離散的確率変数と呼ばれる。Ｘの実現値が連続の時、Ｘは連続的確率変数と呼ばれる。確率変数Ｘの可能な実現値の１つ、ｊ番目の値ｘ_jをとる確率は、 Ｐ(Ｘ＝ｘ_j)＝Ｗ_j と表示する。このＷ_jは確率変数Ｘの確率関数と呼ばれる。この確率変数と出現確率との対応関係は確率分布と呼ばれる。そして、確率変数Ｘに対するＷ_jが定まっていれば、Ｘの確率分布が存在する。なお、確率関数Ｗ_jは、j番目の実現値が起こる確率であり、負になることはない。同時に、常に１以下である。したがって、 ０≦Ｗ_j≦１ が成り立つ。また、すべての実現値の集合に対して、確率関数Ｗ_jは、

Ｗ_j＝１

が成立する。

２．二項分布
　二項分布は、試行行為の結果、成功か失敗のいずれかというような２つの事象に分けて考える場合を対象とする。一般に、１回の試行で、ある事象Ａが起こる確率をｐとする。ｎ回の独立な試行を繰り返し、その事象Ａが起こる回数Ｘの結果、ある値ｘ(＝0,1,2,・・・,n)になる確率は、 Ｐ(Ｘ＝ｘ)＝_nＣ_xｐ^x(１－ｐ)^n-x，　　(ｘ＝0,1,2,・・・,n) で与えられる。この時、Ｘは二項分布Ｂ(ｎ，ｐ)に従うという。二項分布は離散確率分布である。ここで、

_nＣ_x＝

ｎ！

ｘ！(ｎ－ｘ)！

はｎ個のものから、ｘ個を組にして取り出す組合せ数である。

３．正規分布
　正規分布はガウス分布とも呼ばれ、平均値の付近にデータの分布が集積するような連続的な変数に関する確率分布である。正規分布の確率密度関数ｐ(x)は、次式で表示される。

ｐ(x)＝

１

√(２πσ)

exp(-(x-μ)²/(2σ²))

（-∞＜x＜∞）

　ここで、μは期待値(母数の平均値)、σ²は分散(標準偏差)、であり、一般的に正規分布Ｎ(μ，σ²)と表示される。特に、期待値μ＝０、分散σ²＝１、の正規分布Ｎ(０，１)は標準正規分布と呼び、その確率密度関数ｐ(x)は、次式で表示される。

ｐ(x)＝

１

√(２π)

exp((-x)²/2)

（-∞＜x＜∞）

f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\exp \!\left(-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\right)\quad (x\in \mathbb {R} )

f(x)={\frac {1}{\sqrt {2\pi }}}\exp \!\left(-{\frac {x^{2}}{2}}\right)

大数の法則
　一定の条件下で、繰り返し測定して得られる結果の平均値は、平均する値の個数を増やすことで、次第にある一定値に近づくようになる。つまり、母数のサンプル数ｎが大きければ、そのサンプル平均(標本平均)は、真の母平均に近づくようになる。

中心極限定理
　母数のサンプル数ｎが大きければ、そのサンプル平均と真の母平均の差が従う分布は、平均値０、分散σ²／ｎの正規分布に近づく。すなわち、大数の法則も中心極限定理もサンプル平均の振る舞いに関する定理であり、サンプル数を大きくするとサンプル平均が次第に真の母平均に近づくというのが大数の法則、サンプル平均と真の母平均との差がどれくらいのスピードでどのように近づくのかを明確したのが中心極限定理と云える。

４．ｔ分布
　正規分布は、母平均μと母分散σ²のみで示される。しかし、一般には、母集団から標本をサンプリングし、母平均の代わりに標本平均で代用する。この場合、この標本平均がどれほど母平均に近いかが問題となる。標本平均が正規分布を示すには、標本数が非常に多くすることが前提となる。標本数が少ない場合、一般には。正規分布を示さない。　この場合、標本平均をどのように評価すればよいのか？　母標準偏差σの代わりに、標本標準偏差 ux (=√{1/(n-1)・Σ(xi-x~)2} )を用いて、t = (x~-μ)√n/ux = (x~-μ)√(n-1)/sxとおくと、t は平均０の t = 0 に関して対称な分布になる。

　結果的に、ｔ分布の確率密度関数は、次のように表示される。

ｐ(x)＝

Γ((n+1)/2)

√(nπ)･Γ(n/2)

(1+t²/n)^-(n+1)/2

５．カイ２乗分布
　カイ二乗分布(χ2分布)は、確率分布の一種、推計統計学で最も広く利用される。ヘルメルトにより発見され、ピアソンにより命名された。独立に標準正規分布に従う k 個の確率変数 X1, …, Xk をとる。このとき、統計量の従う分布のことを自由度 k のカイ二乗分布と呼ぶ。この分布は、自由度 k に応じて、下図のような形をとる。図を見れば分かるように、どの自由度 k でも、ある一定以上 Z が大きいならば、Z が大きいほどその確率が低くなることが分かる。このことは、大まかに言えば、「正規分布でランダムで値をとったのであるから、その値を用いて高々二乗和をとった程度の数値 Z がとてつもなく大きくなる確率は少ないはずである」と解釈できる。統計的仮説検定にカイ二乗分布が用いられるのはこの性質のためである。例えば、「データが意味のないノイズ要素である可能性はたったの5%以下であるから、このデータには意味があるはずである」という解釈が行われる。普通はこれを

Z\sim \chi _{k}^{2}

と書く。カイ二乗分布は k という1個の母数をもつ。これは Xi の自由度に等しい正の整数である（場合によっては非整数自由度のカイ二乗分布も用いられる）。カイ二乗分布はガンマ分布の特殊な場合に当たる。カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、フリードマン検定などにも利用される。

６．ポアソン分布
　統計学および確率論において、ポアソン分布(Poisson distribution)は、所与の時間間隔で発生する離散的な事象を数える特定の確率変数 X を持つ離散確率分布のことである。ある離散的な事象に対して、ポアソン分布は所与の時間内での生起回数の確率を示し、指数分布は生起期間の確率を示す。数学者シメオン・ドニ・ポアソンが確率論に基づき1838年に発表した。

　定数 λ > 0 に対し、0 以上の整数を値にとる確率変数 X が

P(X=k)={\frac {\lambda ^{k}e^{-\lambda }}{k!}}

を満たすとき、確率変数 X は母数 λ のポアソン分布に従うという。ここで、e はネイピア数 (e = 2.71828…)であり、k! は k の階乗を表す。また、λ は所与の区間内で発生する事象の期待発生回数に等しい。

　ポアソン分布のグラフを下図に示す。横軸はある期間に平均して回起こる現象が実際に起こる回数k、縦軸はそのときの確率を表す。ポアソン分布は、λが大きくなると、グラフは右側へスライドし、右に裾を引いているグラフがだんだん左右対称に近づき、次第に正規分布に近づく。

７．指数分布
　指数分布(exponential distribution)は、確率論および統計学における連続確率分布の一種である。これは例えばポアソン過程——事象が連続して独立に一定の発生率で起こる過程——に従う事象の時間間隔を記述する。

　指数分布は、母数 λ > 0 に対して確率密度関数が、　

f(x;\lambda )=\left\{{\begin{array}{ll}\lambda e^{-\lambda x}&(x\geq 0)\\0&(x<0)\end{array}}\right.

で与えられる分布である^[1]。このとき、累積分布関数は

F(x;\lambda )=\left\{{\begin{array}{ll}1-e^{-\lambda x}&(x\geq 0)\\0&(x<0)\end{array}}\right.

となる^[2]。

尺度母数 $θ = 1 / λ$ を用いると、確率密度関数の等価な定義は

f(x;\theta )=\left\{{\begin{array}{ll}{\frac {1}{\theta }}e^{-{\frac {x}{\theta }}}&(x\geq 0)\\0&(x<0)\end{array}}\right.

として与えられる。

８．Ｆ分布
　Ｆ分布(Fdistribution)は、自由度がｋ₁、ｋ₂のカイ二乗分布χ₁～χ²(ｋ₁)、 χ₂～χ²(ｋ₂)が互いに独立である場合、次式から算出されるＦが従う確率分布のことである。このときＦは自由度(ｋ₁、ｋ₂)のＦ分布に従う。Ｆ分布はt分布やカイ二乗分布と同様、自由度によって形が異なるが、t分布やカイ二乗分布と異なり、2つの自由度から分布の形が決まる。

$\displaystyle F=\frac{\chi_{1}^{2} / k_{1}}{\chi_{2}^{2} / k_{2}}$

　次のグラフは、自由度を変化させた時のＦ分布の形である。自由度(df＝ｋ₁、ｋ₂)が(1, 5)、(2, 5)、(3, 5)、(10, 5)、(10, 20)の場合、Ｆ分布（黒、赤、緑、青、水色、ピンク線）で表示される。

９．最小二乗法
　得られたデータ(標本)に対して、近似的な直線方程式、 Ｙ＝ａＸ＋ｂ を当てはめる。つまり、多く(ｎ個)の離散的なデータ(標本)から、より的確な直線方程式のａとｂを求める。そこで、_ｊ番目のデータ(標本)に対して、 ｕ_ｊ＝Ｙ_ｊ－ａＸ_ｊ－ｂ を求め、その残差ｕ_ｊの絶対値の総和が最小になるように、ａとｂを決める。この場合、絶対値の総和であるから、数学的に取り扱い易い残差の二乗和を最小にする。つまり、

Ｊ＝

ｕ_ｊ²＝

(Ｙ_ｊ－ａＸ_ｊ－ｂ)²

を最小にする。このような考え方に基づくことから、この方法は最小二乗法と呼ばれる。

　一般に、関数Ｊを最小化にするには、数学的な微分の概念を用いる。この場合、関数Ｊは、ａとｂを変数とするので、それぞれについて、微分して、それらを０と置き、最小化して、未知数のａとｂを求める。

　最初に、関数Ｊを変数ａについて、微分(偏微分)する。

∂Ｊ

∂ａ

＝

∂

∂ａ

(Ｙ_ｊ－ａＸ_ｊ－ｂ)²

＝

｛－２Ｘ_ｊ(Ｙ_ｊ－ａＸ_ｊ－ｂ)｝

　次に、関数Ｊを変数ｂについて、微分(偏微分)する。

∂Ｊ

∂ｂ

＝

∂

∂ｂ

(Ｙ_ｊ－ａＸ_ｊ－ｂ)²

＝

｛－２(Ｙ_ｊ－ａＸ_ｊ－ｂ)｝ 　

　これら２つの式から、次式が得られる。

Ｘ_ｊ(Ｙ_ｊ－ａＸ_ｊ－ｂ)

＝

Ｘ_ｊＹ_ｊ－ａ

Ｘ_ｊ²－ｂ

Ｘ_ｊ

＝０

(Ｙ_ｊ－ａＸ_ｊ－ｂ)

＝

Ｙ_ｊ－ａ

Ｘ_ｊ－ｎｂ

＝０

　さらに、この２つの式を整理すれば、次の連立方程式が成立する。

ａ

Ｘ_ｊ²＋ｂ

Ｘ_ｊ

＝

Ｘ_ｊＹ_ｊ

ａ

Ｘ_ｊ＋ｎｂ

＝

Ｙ_ｊ

　ここで、Ｘ_ｊ，Ｙ_ｊはｊ番目のデータ(標本)であり、予めｎ個の離散的なデータ(標本)が与えられている。

具体的な数値による最小二乗法の適用事例

ｎ	Ｘ	Ｙ	Ｘ²	ＸＹ
1	20	9	400	180
2	30	11	900	330
3	40	15	1,600	600
4	50	20	2,500	1,000
5	60	23	3,600	1,380
	200	78	9,000	3,490

　これらを連立方程式に代入すれば、次式を得る。 ９，０００ａ＋２００ｂ＝３，４９０ ２００ａ＋５ｂ＝７８ 　これを解けば、ａ＝０．３７，ｂ＝０．３７となる。

　したがって、求めるべき最小二乗法の回帰直線として、次式を得る。 ｙ＝０．３７ｘ＋０．３７

以上　　

（２０１３年３月２４日）

戻る

☆☆☆数学の基礎概念☆☆☆ 確率と統計

☆☆☆数学の基礎概念☆☆☆
確率と統計