このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

いきなり「確率変数」と言われたらどうするか

Vが集合(実際には可測空間のはず)で、xがV上を走る変数のとき、「xは確率変数である」とか「xを確率変数とする」みたいなことになったら、どう解釈するか。

そのときは、V上の確率分布(確率測度)が存在していて、暗黙にその分布を前提にしている。可測空間V上の確率測度をPとすると、(V, P)が確率空間で、idV:V→V は明らかに可測写像。idVの代用(象徴的な表現)が変数x、と解釈する。

次の表現はどう解釈するか?

  • x:V は確率変数なので、f:V→W に対して f(x) も確率変数となる。

「x:V は確率変数」の意味は、「V上に確率測度Pがある」と解釈する。すると、fは確率空間の台Vからの可測写像なので、定義から確かに確率変数である。xがidVを意味するときは、f(x) = f なので、実は何も言ってない。強いて言えば、fの定義域に確率測度があることを再確認している。

「確率変数」と同義な表現に「分布する値」がある。これも決して明示化されない習慣だと思うが、次の表現を考える。

  • 値fはV上に分布するので、その期待値をeとする。

「値」が「関数」を意味することがしばしばある。例えば「t値」とは「t」と名付けられた関数のこと。「fはV上に分布する」は、「fはVに値を取る確率変数」と同じ。暗黙に、fの定義域が確率空間 (X, Q)だと仮定している。なお、期待値は、

  e = \int_{x\in X}f(x) Q(dx)

fによるQの前送り測度がPになっているなら、

  e = \int_{x\in X}f(x) Q(dx) = \int_{v\in V} y P(dv)

いきなり、x 〜 N(0, σ2) とかは、xが集合(可測空間)X上の変数で、X上に密度で表現可能な測度(Xの標準測度に関して絶対連続な測度)があって、その密度関数が当該の正規分密度関数になっている、と解釈する。変数xが走る"変域”が正規分布で定義される確率空間と仮定している。

「x 〜 N(0, σ2) なので、x2はχ2分布に従う」の解釈は、xの変域に正規分布による確率測度が存在し、λx.x2 で定義される可測関数でその測度を前送りすると、χ2分布による確率測度になる。

「分布」は基本的に確率測度のことだが、密度関数(p.d.f.)、累積分布関数(a.d.f)を意味することもある。

さらに非形式的な表現で、「値fは幅を持つ」。これは「値fは分布する」と同じで「fは確率変数」を意味する。「幅を持つ」は「定数ではない」ことかと思うが、定数関数は確率変数(分布はディラック測度)なので、「定数でない=確率変数」はまったく不合理だが、まーしょうがない。