統計学 - 連続型確率分布

提供: MochiuWiki : SUSE, EC, PCB

概要



確率密度

離散型でのサンプル数を増加させて、各区間の幅を減少させた時のヒストグラムの極限 (幅を0に近付ける) が連続型での確率密度の曲線になる。
連続型での確率密度の値は、離散型でのヒストグラムの縦軸の値に相当する。


離散型での確率関数Piの代わりに、連続型では確率密度 f(x) を用いる。

連続型での確率密度 f(x) は、abf(x)dx と積分することにより確率となる。

確率密度 f(x) 単体は、各xの値の発生確率に比例する相対値の意味である。

例えば、サイコロの目が X=1,2,3,4,5,6 ではなく、0~6の間の実数値とする場合、0~6の間の実数は無限個 (全体集合の個数 n(U)= ) となる。
つまり、0~6の間の実数Xを1つ取る時、その確率は、1n(U)=1=0 となる。
連続型では、ある実数1つを取る確率は0となる。

しかし、1x3 の実数の範囲とする時、その確率は、1x31x6=12 となる。


連続型では、離散型での確率関数Piで確率が計算できない。(実数1つの確率が連続型では必ず0のため)

連続型では、次式のように、実数の範囲の確率を積分で考える。
つまり、確率密度関数f(x)の面積で確率を考える。
P(axb)=abf(x)dx

  • 離散型では全確率関数の和 (= 1)
    i=1nPi=1
  • 連続型では実数の全範囲の積分 (= 1)
    P(x)=f(x)dx=1




累積分布関数

  • 離散型での累積分布関数
    xより小さい確率変数の実現値xiに対応する確率関数Piの和
    F(x)=xixPi
  • 連続型での累積分布関数
    F(x)=xf(t)dt


累積分布関数のグラフ

連続型での累積分布関数
F(a)=af(t)dt


累積分布関数の性質

累積分布関数F(x)は、単調に増加する。
ab ならば、F(a)F(b)

F()=0,F()=1

P(axb)=abf(x)dx=bf(x)dxaf(x)dx=F(b)F(a)


連続型確率分布の期待値

  • 離散型での期待値
    μ=E[X]=i=1nxiPi=x1P1+x2P2++xnPn
  • 連続型での期待値
    μ=E[X]=xf(x)dx



連続型確率分布の分散

  • 離散型での分散
    σ2=V[X]=i=1n(xiμ)2Pi=(x1μ)2P1+(x2μ)2P2++(xnμ)2Pn
  • 連続型での分散
    σ2=V[X]=(xμ)2f(x)dx=E[X2]E[X]E[X]


離散型確率分布および連続型確率分布の両方において、標準偏差σは σ=V[X] である。