☆☆☆数学の基礎概念☆☆☆
確率と統計

-確率と統計-


 確率とは、事象が実現すると期待される割合のことである。確率を現実的な経験の世界と関連付ければ、何回でも繰り返すことができる何らかの試行行為があるとする。 そして、その試行行為の結果、起こり得る事象の定まった集まりを考えると、起こる事象もあれば、起こらない事象もある。 この事象全体の集まりを確率事象と呼び、多くの試行行為をn回繰り返し、起こる事象の回数がm回とするならば、mとnとの比、すなわちm/n(0≦m/n≦1)を事象が起こる確率(算術確率)という。

 統計とは、対象となる集まりのある特性あるいは標識について、その全体としての特徴を定量的に表現することである。 事象を調査して、数量で把握し、得られた数値データ(統計量)を用いて、その性質を調べ、集まりの全体の特徴を定量的に表現する。 なお、一般に、集団的な事象や現象を数字で表したものは統計的データと呼ばれている。

1.確率分布
 硬貨投げには、表と裏、2つの根本事象がある。サイコロ振りには、1から6まで、6個の根本事象がある。 この時、それぞれの事象に数値を割当てる。硬貨投げの表には1、裏には0を割当てる。サイコロ振りの1から6までは、数値の1から6を割当てる。 この根本事象に割当てる変数は確率変数と呼ばれる。また、その数値は確率変数の実現値であり、出現確率である。

 確率変数Xの実現値(出現確率)x1,x2,・・・,xnが飛び飛びの値の時、Xは離散的確率変数と呼ばれる。Xの実現値が連続の時、Xは連続的確率変数と呼ばれる。 確率変数の可能な実現値の1つ、j番目の値jをとる確率は、
P(X=xj)=Wj
と表示する。このjは確率変数Xの確率関数と呼ばれる。この確率変数と出現確率との対応関係は確率分布と呼ばれる。 そして、確率変数に対するjが定まっていれば、の確率分布が存在する。 なお、確率関数jは、j番目の実現値が起こる確率であり、負になることはない。同時に、常に1以下である。したがって、
0≦Wj≦1
が成り立つ。また、すべての実現値の集合に対して、確率関数Wjは、
j=1
が成立する。


2.二項分布
 二項分布は、試行行為の結果、成功か失敗のいずれかというような2つの事象に分けて考える場合を対象とする。 一般に、1回の試行で、ある事象Aが起こる確率をpとする。 n回の独立な試行を繰り返し、その事象Aが起こる回数Xの結果、ある値x(=0,1,2,・・・,n)になる確率は、
P(X=x)=nxx(1-p)n-x,  (x=0,1,2,・・・,n)
で与えられる。この時、Xは二項分布B(n,p)に従うという。二項分布は離散確率分布である。ここで、
nx
n!

x!(n-x)!
はn個のものから、x個を組にして取り出す組合せ数である。



3.正規分布
 正規分布はガウス分布とも呼ばれ、平均値の付近にデータの分布が集積するような連続的な変数に関する確率分布である。正規分布の確率密度関数p(x)は、次式で表示される。
p(x)=

√(2πσ)
exp(-(x-μ)2/(2σ2))
(-∞<x<∞)
 ここで、μは期待値(母数の平均値)、σ2は分散(標準偏差)、であり、一般的に正規分布N(μ,σ2)と表示される。 特に、期待値μ=0、分散σ2=1、の正規分布N(0,1)は標準正規分布と呼び、その確率密度関数p(x)は、次式で表示される。
p(x)=

√(2π)
exp((-x)2/2)
(-∞<x<∞)





大数の法則
 一定の条件下で、繰り返し測定して得られる結果の平均値は、平均する値の個数を増やすことで、次第にある一定値に近づくようになる。つまり、母数のサンプル数nが大きければ、そのサンプル平均(標本平均)は、真の母平均に近づくようになる。

中心極限定理
 母数のサンプル数nが大きければ、そのサンプル平均と真の母平均の差が従う分布は、平均値0、分散σ2/nの正規分布に近づく。すなわち、大数の法則も中心極限定理もサンプル平均の振る舞いに関する定理であり、サンプル数を大きくするとサンプル平均が次第に真の母平均に近づくというのが大数の法則、サンプル平均と真の母平均との差がどれくらいのスピードでどのように近づくのかを明確したのが中心極限定理と云える。


4.t分布
 正規分布は、母平均μと母分散σ2のみで示される。しかし、一般には、母集団から標本をサンプリングし、母平均の代わりに標本平均で代用する。この場合、この標本平均がどれほど母平均に近いかが問題となる。標本平均が正規分布を示すには、標本数が非常に多くすることが前提となる。標本数が少ない場合、一般には。正規分布を示さない。  この場合、標本平均をどのように評価すればよいのか? 母標準偏差σの代わりに、標本標準偏差 ux (=√{1/(n-1)・Σ(xi-x~)2} )を用いて、t = (x~-μ)√n/ux = (x~-μ)√(n-1)/sxとおくと、t は平均0の t = 0 に関して対称な分布になる。

 結果的に、t分布の確率密度関数は、次のように表示される。

p(x)=
Γ((n+1)/2)

√(nπ)・Γ(n/2)
(1+t2/n)-(n+1)/2



5.カイ2乗分布
 カイ二乗分布(χ2分布)は、確率分布の一種、推計統計学で最も広く利用される。ヘルメルトにより発見され、ピアソンにより命名された。 独立に標準正規分布に従う k 個の確率変数 X1, …, Xk をとる。このとき、統計量の従う分布のことを自由度 k のカイ二乗分布と呼ぶ。 この分布は、自由度 k に応じて、下図のような形をとる。 図を見れば分かるように、どの自由度 k でも、ある一定以上 Z が大きいならば、Z が大きいほどその確率が低くなることが分かる。 このことは、大まかに言えば、「正規分布でランダムで値をとったのであるから、その値を用いて高々二乗和をとった程度の数値 Z がとてつもなく大きくなる確率は少ないはずである」と解釈できる。 統計的仮説検定にカイ二乗分布が用いられるのはこの性質のためである。 例えば、「データが意味のないノイズ要素である可能性はたったの5%以下であるから、このデータには意味があるはずである」という解釈が行われる。 普通はこれを
と書く。カイ二乗分布は k という1個の母数をもつ。これは Xi の自由度に等しい正の整数である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布はガンマ分布の特殊な場合に当たる。 カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、フリードマン検定などにも利用される。


6.ポアソン分布
 統計学および確率論において、ポアソン分布(Poisson distribution)は、所与の時間間隔で発生する離散的な事象を数える特定の確率変数 X を持つ離散確率分布のことである。 ある離散的な事象に対して、ポアソン分布は所与の時間内での生起回数の確率を示し、指数分布は生起期間の確率を示す。 数学者シメオン・ドニ・ポアソンが確率論に基づき1838年に発表した。

 定数 λ > 0 に対し、0 以上の整数を値にとる確率変数 X が
を満たすとき、確率変数 X は母数 λ のポアソン分布に従うという。 ここで、e はネイピア数 (e = 2.71828…)であり、k! は k の階乗を表す。また、λ は所与の区間内で発生する事象の期待発生回数に等しい。

 ポアソン分布のグラフを下図に示す。横軸はある期間に平均して回起こる現象が実際に起こる回数k、縦軸はそのときの確率を表す。 ポアソン分布は、λが大きくなると、グラフは右側へスライドし、右に裾を引いているグラフがだんだん左右対称に近づき、次第に正規分布に近づく。


7.指数分布
 指数分布(exponential distribution)は、確率論および統計学における連続確率分布の一種である。 これは例えばポアソン過程——事象が連続して独立に一定の発生率で起こる過程——に従う事象の時間間隔を記述する。

 指数分布は、母数 λ > 0 に対して確率密度関数が、  

で与えられる分布である[1]。このとき、累積分布関数

となる[2]

尺度母数 θ = 1/λ を用いると、確率密度関数の等価な定義は

として与えられる。



8.F分布
 F分布(Fdistribution)は、自由度がk1、k2のカイ二乗分布χ1~χ2(k1)、 χ2~χ2(k2)が互いに独立である場合、次式から算出されるFが従う確率分布のことである。 このときFは自由度(k1、k2)のF分布に従う。 F分布はt分布やカイ二乗分布と同様、自由度によって形が異なるが、t分布やカイ二乗分布と異なり、2つの自由度から分布の形が決まる。

 \displaystyle F=\frac{\chi_{1}^{2} / k_{1}}{\chi_{2}^{2} / k_{2}}

 次のグラフは、自由度を変化させた時のF分布の形である。自由度(df=k1、k2)が(1, 5)、(2, 5)、(3, 5)、(10, 5)、(10, 20)の場合、 F分布(黒、赤、緑、青、水色、ピンク線)で表示される。



9.最小二乗法
 得られたデータ(標本)に対して、近似的な直線方程式、
Y=aX+b
を当てはめる。つまり、多く(n個)の離散的なデータ(標本)から、より的確な直線方程式のを求める。 そこで、番目のデータ(標本)に対して、
=Y-aX-b
を求め、その残差の絶対値の総和が最小になるように、を決める。 この場合、絶対値の総和であるから、数学的に取り扱い易い残差の二乗和を最小にする。つまり、
J= 2 (Y-aX-b)2
を最小にする。このような考え方に基づくことから、この方法は最小二乗法と呼ばれる。

 一般に、関数を最小化にするには、数学的な微分の概念を用いる。 この場合、関数は、を変数とするので、それぞれについて、微分して、それらをと置き、最小化して、未知数のを求める。

 最初に、関数を変数について、微分(偏微分)する。
∂J

∂a

∂a
(Y-aX-b)2
{-2X(Y-aX-b)}
 次に、関数を変数について、微分(偏微分)する。
∂J

∂b

∂b
(Y-aX-b)2
{-2(Y-aX-b)}  

 これら2つの式から、次式が得られる。
(Y-aX-b)
-a 2-b
=0
(Y-aX-b)
-a -nb
=0
 さらに、この2つの式を整理すれば、次の連立方程式が成立する。
2+b
+nb
 ここで、,Yはj番目のデータ(標本)であり、予めn個の離散的なデータ(標本)が与えられている。

具体的な数値による最小二乗法の適用事例
2XY
1209400180
23011900330
340151,600600
450202,5001,000
560233,6001,380
200789,0003,490

 これらを連立方程式に代入すれば、次式を得る。
9,000a+200b=3,490
200a+5b=78
 これを解けば、a=0.37,b=0.37となる。

 したがって、求めるべき最小二乗法の回帰直線として、次式を得る。
y=0.37x+0.37


以上  

(2013年3月24日)


戻る