離散分布 2
離散分布」という言葉も曖昧で、概念的に難しい。離散には有限離散と可算(無限)離散があるが、ここでは有限離散を単に「離散」と呼ぶことにする。可算無限への拡張は比較的容易だと思う。
[追記]Wikipediaの 離散確率分布 - Wikipedia に事例がある。[/追記]
「離散分布」の当座の解釈は、離散空間Ω上の確率測度だとする。「離散分布の集合」という概念を考えるととたんに曖昧になる。離散分布とは何か?
- どこにも埋め込まれていない離散集合Ωを固定して、Pow(Ω)をσ代数として、可測空間としてのΩの上の分布(確率測度)の集合 Dist(Ω)
- Rの離散部分集合をDとして、D⊆R に台を持つ実数上の分布。つまり、Dist(R) の部分集合。測度の台がDに含まれる確率測度だけを考える。
- 離散集合を固定しないで、任意の離散集合(ベキ集合代数がσ代数)に対する分布の全体。確率空間の圏を考えて、その部分圏と考えると良さそう。
- R上の測度で、台が離散集合になるもの全体。
Rを舞台として考えるときはいずれにしてもDist(R)の部分集合を考えるが、Dist(R)自体の定義が難しい。ボレルσ代数上の確率測度の全体をDist(R)とするのが一番扱いやすそうだが、累積分布関数、密度関数としての定式化もある。
測度と右連続増加関数(累積分布関数)の対応は比較的に楽だが、離散分布(測度)の密度関数を作るとディラック関数が出てきてしまう。超関数の原語は「分布」だから、超関数の意味の分布を考えればいいが、それは難しい。
一方で、埋め込まれていない離散集合の場合は、ディラック関数は不要で、クロネッカーのデルタで済む。連続ならディラック、離散ならクロネッカーとなる。ディラックを避けてクロネッカーで済まそうと思うと、連続分布と離散分布を分けて、離散分布には密度関数を考えるのはやめて、確率質量関数(あるいは単に確率関数)を考えることになる。これがまた話を厄介にする。毎度、連続と離散を分けることになる。
離散→連続 の埋め込みにも、クロネッカーとディラックの問題がある。クロネッカーデルタ→ディラックデルタ と変換する方法はもちろんあるが、それだけではない。(一様)区間分布という概念が登場する。
点か区間か? 区間は正の長さを持つものに限定すると、点と区間はまったくの別物になる。点と区間の標準的な対応は:
これは点群と区間による被覆の双対性を与えるのかもしれない。
離散分布の概念のなかには、離散と連続の関係や点と領域の双対性などが含まれている。なかなかに難しい。