このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

離散分布

分布をR上の測度(主に有界測度、多くは確率測度)だと解釈して、離散分布は連続分布より考えにくい。

多次元まで考慮すると累積分布関数(密度関数の-∞からの積分)は使いたくない。δ関数を合理化するか、または便宜上の記号だとした上で、δ関数の線形結合で密度関数を書いたほうがいいだろう。特定の点での密度は無限大になるが、積分すれば有限だから別にかまわない。

多次元のときでもそのまま適用できるし、密度無限大がイヤなら、小さな台を持つ滑らかな関数で連続化してもよい。台が無限に広がってもいいなら、多次元正規分布で連続化してもよい。

離散分布向けの確率質量関数というのは、ほぼインチキでδ関数でさえない。質量が存在する位置での値が1で他では0というシロモノ。こんな関数を考えてもしょうがない、記号的な表現形態としか言いようがない。離散分布の点質量表記とか言えばいいだろう。

ポアソン分布の f(x) = e^(-λ)λ^x/x! なんて、普通に考えて意味分かるわきゃない。xは連続変数でx!が出てくる。ガンマ関数とか連続補完するわけじゃない。これインチキだよ。それに、某書籍(本[2])では、連続変数のグラフを描いているし。補完している旨注記があるがミスリーディング。

f(x) = e^(-λ)λ^x/x! を密度と読んでいる例もあるが、それもおかしな話で積分したら0になってしまう。文脈によって、積分の意味を変えるのだろうが、それもよろしくない。

分布は測度だという立場に立てば、仮にデルタ関数が合理化できなくても、点測度は定義できるので、一点に集中した質量(質点)も問題なく表現できる。