分布の意味 2
正規分布をはじめ「ナントカ分布」と固有名詞が付いた分布がある。これもR上の測度のこと(用法1)だが、背後に測度空間を考えることが多いので、そのときは用法2。
それで、ナントカ分布だが、固有名詞が付いていても単一の測度だとは限らない。むしろパラメータが付いた族(ファミリー)。正規分布は、平均と分散がパラメータになった族だ。
パラメータをθ、パラメータの空間をΘと書くのが伝統らしい。で、パラメータ付きの測度を m(θ) とする(これは伝統的記法じゃない)。mを考えるということは、mの値の集合として、測度の全体、有界測度の全体、確率測度の全体などを考える必要がある。
測度や測度の全体は考えにくい点もあるんで、密度関数を測度の代わりにしてもいいだろう。すると、m(θ) は、m(θ, x) と表される。xは実数上を走る変数で、θを定数αに固定したときに密度関数 m(α, -) = λx.m(α, x) を与える。
ナントカ分布は、パラメータ空間Θを適当にとった m:Θ×R→R≧0 として表現できる。さらに、ナントカ分布のナントカがイッパイあるから、それに番号を付けて、mi:Θi×R→R≧0 とする。iは番号で、番号の集合Iを走るとする。
それで結局、{mi:Θi×R→R≧0 | i∈I} が既存の分布のレパートリーということになる。統計のスキルという意味では:
- 番号の範囲Iを大きくする=たくさんのナントカ分布を知る
- mi の性質を知る。個々のナントカ分布に強くなる。
- パラメータを固定した mi(α) を調べる。
なんてのが目標になるんだろうが、「それでどうした?」感が拭えない。
おそらく、統計的な問題設定の枠組みは、測度空間 X = (X, ΣX, μ) と可測写像 f:X→R があって、fによる像測度 ν := f*(μ) を調べることになるのだろう。そんとき、既存の分布のレパートリー {mi:Θi×R→R≧0 | i∈I} から、適当な i∈I と α∈Θi を選んで、mi(α) がνと一致する、あるいはνを近似するものだ、とするのだろう、よく知らんけど。
仮にそうなら、Xとfをポンと与えられてなんとかするには、{mi:Θi×R→R≧0 | i∈I} を充実させるのは確かに必要だ。が、それだけなんかい? という気はする。それだけじゃないと思うのだが、それ以上のことはまだ知らない。