このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

離散分布 2

離散分布」という言葉も曖昧で、概念的に難しい。離散には有限離散と可算(無限)離散があるが、ここでは有限離散を単に「離散」と呼ぶことにする。可算無限への拡張は比較的容易だと思う。

[追記]Wikipedia離散確率分布 - Wikipedia に事例がある。[/追記]

「離散分布」の当座の解釈は、離散空間Ω上の確率測度だとする。「離散分布の集合」という概念を考えるととたんに曖昧になる。離散分布とは何か?

  1. どこにも埋め込まれていない離散集合Ωを固定して、Pow(Ω)をσ代数として、可測空間としてのΩの上の分布(確率測度)の集合 Dist(Ω)
  2. Rの離散部分集合をDとして、D⊆R に台を持つ実数上の分布。つまり、Dist(R) の部分集合。測度の台がDに含まれる確率測度だけを考える。
  3. 離散集合を固定しないで、任意の離散集合(ベキ集合代数がσ代数)に対する分布の全体。確率空間の圏を考えて、その部分圏と考えると良さそう。
  4. R上の測度で、台が離散集合になるもの全体。

Rを舞台として考えるときはいずれにしてもDist(R)の部分集合を考えるが、Dist(R)自体の定義が難しい。ボレルσ代数上の確率測度の全体をDist(R)とするのが一番扱いやすそうだが、累積分布関数、密度関数としての定式化もある。

測度と右連続増加関数(累積分布関数)の対応は比較的に楽だが、離散分布(測度)の密度関数を作るとディラック関数が出てきてしまう。超関数の原語は「分布」だから、超関数の意味の分布を考えればいいが、それは難しい。

一方で、埋め込まれていない離散集合の場合は、ディラック関数は不要で、クロネッカーのデルタで済む。連続ならディラック、離散ならクロネッカーとなる。ディラックを避けてクロネッカーで済まそうと思うと、連続分布と離散分布を分けて、離散分布には密度関数を考えるのはやめて、確率質量関数(あるいは単に確率関数)を考えることになる。これがまた話を厄介にする。毎度、連続と離散を分けることになる。

離散→連続 の埋め込みにも、クロネッカーディラックの問題がある。クロネッカーデルタ→ディラックデルタ と変換する方法はもちろんあるが、それだけではない。(一様)区間分布という概念が登場する。

  • 点密度: 一点に質量が集中した質量分布の密度関数
  • (一様)区間密度: 区間内に一様に分布した質量分布の密度関数

点か区間か? 区間は正の長さを持つものに限定すると、点と区間はまったくの別物になる。点と区間の標準的な対応は:

  • 点→区間 点を中点とする幅一定の区間を対応させる。
  • 区間→点 区間をの中点を対応させる。

これは点群と区間による被覆の双対性を与えるのかもしれない。

離散分布の概念のなかには、離散と連続の関係や点と領域の双対性などが含まれている。なかなかに難しい。