このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

分布の意味 2

正規分布をはじめ「ナントカ分布」と固有名詞が付いた分布がある。これもR上の測度のこと(用法1)だが、背後に測度空間を考えることが多いので、そのときは用法2。

それで、ナントカ分布だが、固有名詞が付いていても単一の測度だとは限らない。むしろパラメータが付いた族(ファミリー)。正規分布は、平均と分散がパラメータになった族だ。

パラメータをθ、パラメータの空間をΘと書くのが伝統らしい。で、パラメータ付きの測度を m(θ) とする(これは伝統的記法じゃない)。mを考えるということは、mの値の集合として、測度の全体、有界測度の全体、確率測度の全体などを考える必要がある。

測度や測度の全体は考えにくい点もあるんで、密度関数を測度の代わりにしてもいいだろう。すると、m(θ) は、m(θ, x) と表される。xは実数上を走る変数で、θを定数αに固定したときに密度関数 m(α, -) = λx.m(α, x) を与える。

ナントカ分布は、パラメータ空間Θを適当にとった m:Θ×RR≧0 として表現できる。さらに、ナントカ分布のナントカがイッパイあるから、それに番号を付けて、mii×RR≧0 とする。iは番号で、番号の集合Iを走るとする。

それで結局、{mii×RR≧0 | i∈I} が既存の分布のレパートリーということになる。統計のスキルという意味では:

  1. 番号の範囲Iを大きくする=たくさんのナントカ分布を知る
  2. mi の性質を知る。個々のナントカ分布に強くなる。
  3. パラメータを固定した mi(α) を調べる。

なんてのが目標になるんだろうが、「それでどうした?」感が拭えない。

おそらく、統計的な問題設定の枠組みは、測度空間 X = (X, ΣX, μ) と可測写像 f:X→R があって、fによる像測度 ν := f*(μ) を調べることになるのだろう。そんとき、既存の分布のレパートリー {mii×RR≧0 | i∈I} から、適当な i∈I と α∈Θi を選んで、mi(α) がνと一致する、あるいはνを近似するものだ、とするのだろう、よく知らんけど。

仮にそうなら、Xとfをポンと与えられてなんとかするには、{mii×RR≧0 | i∈I} を充実させるのは確かに必要だ。が、それだけなんかい? という気はする。それだけじゃないと思うのだが、それ以上のことはまだ知らない。