コーシー分布
出典: フリー百科事典『ウィキペディア(Wikipedia)』
| 確率密度関数 緑線が標準コーシー分布 | |
| 分布関数 色は確率密度関数と同じ | |
| 母数 | <math>x_0\!</math> 位置(実数) <math>\gamma > 0\!</math> 尺度(実数) |
| 台 | <math>x \in (-\infty; +\infty)\!</math> |
| 確率密度関数 | <math>\frac{1}{\pi\gamma\,\left[1 + \left(\frac{x-x_0}{\gamma}\right)^2\right]} \!</math> |
| 分布関数 | <math>\frac{1}{\pi} \arctan\left(\frac{x-x_0}{\gamma}\right)+\frac{1}{2}</math> |
| 期待値 | (not defined) |
| 中央値 | <math>x_0</math> |
| 最頻値 | <math>x_0</math> |
| 分散 | (not defined) |
| 歪度 | (not defined) |
| 尖度 | (not defined) |
| エントロピー | <math>\ln(4\,\pi\,\gamma)\!</math> |
| モーメント母関数 | (not defined) |
| 特性関数 | <math>\exp(x_0\,i\,t-\gamma\, |
コーシー分布(-ぶんぷ、en:Cauchy distribution)は、連続型確率分布の一種である。分布の名称は、フランスの数学者オーギュスタン=ルイ・コーシーにちなむ。確率密度関数は以下の式で与えられる。
- <math> f(x; x_0,\gamma) = \frac{1}{\pi\gamma \left[1 + \left(\frac{x-x_0}{\gamma}\right)^2\right]} \!</math>
- <math>= { 1 \over \pi } \left[ { \gamma \over (x - x_0)^2 + \gamma^2 } \right] \!</math>
ここでx0は分布の最頻値を与える位置母数、γは半値半幅を与える尺度母数である。
この分布は、ヘンドリック・ローレンツの名を取ってローレンツ分布と呼ばれることもあり、またこれら2人の名前を合わせてコーシー-ローレンツ分布とも呼ばれる。また物理学の分野では、ブライト・ウィグナー分布という名前で知られている。この分布は強制共鳴を記述する微分方程式の解となることから、物理学では重要な存在となっている。また分光学では共鳴広がりを含む多くのメカニズムによって広げられたスペクトル線の形状を記述するために用いられる。以下では、統計学における名称であるコーシー分布を用いて説明する。
x0 = 0、γ = 1である場合、この分布は標準コーシー分布と呼ばれ、以下の確率密度関数で与えられる。
- <math> f(x; 0,1) = \frac{1}{\pi (1 + x^2)}. \!</math>
目次 |
[編集] 性質
累積分布関数は以下のようになる。
- <math>F(x; x_0,\gamma)=\frac{1}{\pi} \arctan\left(\frac{x-x_0}{\gamma}\right)+\frac{1}{2}</math>
また、逆累積分布関数は次の通りである。
- <math>F^{-1}(p; x_0,\gamma) = x_0 + \gamma\,\tan(\pi\,(p-1/2)). \!</math>
コーシー分布は、期待値や分散(あるいはより高次のモーメント)が定義されない分布の例として知られる。最頻値と中央値は常に定義され、それらはいずれもx0で与えられる。
Xをコーシー分布に従う確率変数とする。コーシー分布の特性関数は以下のように与えられる。
- <math>\phi_x(t; x_0,\gamma) = \mathrm{E}(e^{i\,X\,t}) = \exp(i\,x_0\,t-\gamma\,|t|). \!</math>
U と V を標準正規分布(期待値0、分散1の正規分布)に従う互いに独立な確率変数であるとすると、それらの比 U/V は標準コーシー分布に従う。
X1, …, Xnを標準コーシー分布に従う独立な確率変数列とすると、それらの算術平均 (X1 + … + Xn)/n は再び標準コーシー分布に従う(再生性)。この証明は、算術平均の特性関数が
- <math>\phi_{\overline{X}}(t) = \mathrm{E}\left(e^{i\,\overline{X}\,t}\right)\,\!</math>
となることから明らかである(<math>\overline{X}</math>は算術平均を表す)。この例から、中心極限定理における有限分散の仮定は必須であることがわかる。また、これは安定分布族(コーシー分布は安定分布族に含まれる)における一般化中心極限定理の例でもある。
コーシー分布は無限分解可能な分布である。
自由度1のT分布は、標準コーシー分布と一致する。
コーシー分布が属している位置尺度母数分布族は、実係数メビウス変換に関して閉じている。
[編集] 期待値が定義されない理由
確率分布が確率密度関数f(x)を持つ場合、その期待値は以下のように与えられる。
- <math>\int_{-\infty}^\infty x f(x)\,dx. \qquad\qquad (1)\!</math>
問題はこの広義積分が、
- <math>\int_0^\infty x f(x)\,dx-\int_{-\infty}^0 |{x}| f(x)\,dx.\qquad\qquad (2) \!</math>
に等しいかどうかである。(2)式の2つの項のうち、発散するのが高々1つであるならば(2)式は(1)式と一致するが、(2)式の2つの項はともに発散してしまうため、(2)式は不定である。さらに、もし(1)式をルベーグ積分とみなした場合、(1)式は(2)式の2つの項の差として定義されるため、(1)式もまた不定となってしまう。
ところが、もし(1)式を異常積分とみなした場合、(2)式は不定であり、(1)式はwell-definedとは限らない。(1)式が
- <math>\lim_{a\to\infty}\int_{-a}^a x f(x)\,dx, \!</math>
を意味すると考えることもでき、この積分の値はコーシーの主値(ここでは0)となる。しかし、(1)式は
- <math>\lim_{a\to\infty}\int_{-2a}^a x f(x)\,dx, \!</math>
を意味しているとも考えられ、この値は0にはならない。
大数の強法則など、期待値に関する確率論のさまざまな結果は、このようなケースでは成立しない。
また、コーシー分布に従う母集団から無作為抽出された標本に関する算術平均は、ただ1つの抽出による結果からは一切改善されない。これは、標本に極端に大きな(あるいは小さな)値が含まれる可能性がかなり高いからである。しかし、標本中央値(これは極端な値には影響を受けない)は中心を知るためのひとつの尺度となりうる。
[編集] 2次モーメントが無限大になる理由
期待値が定義されない限り、分散や標準偏差を考えることは不可能である。しかし、原点を中心とした2次モーメントを考えることは可能である。しかし、これもまた無限大となる。
- <math>\mathrm{E}(X^2) \propto \int_{-\infty}^{\infty} {x^2 \over 1+x^2}\,dx =\int_{-\infty}^{\infty} dx - \int_{-\infty}^{\infty} {1 \over 1+x^2}\,dx = \infty -\pi = \infty. \!</math>
[編集] 相対論的ブライト・ウィグナー分布
原子核物理学および素粒子物理学において、共鳴のエネルギー特性は相対論的ブライト・ウィグナー分布によって記述される。

