改善案
多少はマシな用語法 - 檜山正幸のキマイラ飼育記 メモ編とかの延長線上の記事。
つまり、単に集合といって可測空間を意味し、単に写像/関数といってもそれは可測写像/可測関数を意味する。
確率変数は次のように書き分ける
- 確率変数(確率空間から) 域にのみ確率測度がのっている場合。
- 確率変数(確率保存) 域にも余域にも確率測度がのっていて、写像で保存される。
確率分布は確率測度と同義。結果的に確率空間ともほぼ同義。μを確率分布=確率測度、f, Fを実数値関数として、
- density(μ) -- μの密度関数
- accum(μ) -- μの累積関数
- Δ(F) -- Δ(F)(A) := ∫AFdx で定義される測度
- Γ(f) -- Γ(f)(A) := ∫Adf で定義される測度
次が成立する。
- Γ(density(μ)) = μ
- density(Γ(f))) = f
- Δ(accum(μ)) = μ
- accum(Δ(F))) = F
- F = ∫fdx
- f = dF
Iをインデックス集合として、I-母集団とは、Iでインデックスされた族 {fi:A→Vi | i∈} で、
Aは狭義の母集団(広義の母集団の母集団)、またはボディと呼ぶ。fiは母集団の確率変数(確率空間から)、変量、変数などと呼ぶ。i∈I は、変数のラベル/名前と呼ぶ。fiを変量/変数iともいう。
Iは変数インデックスだが、Iとは別に、測定インデックスKがあって、I×K上のfi,kを考える。二重インデックス(変数インデックスと測定インデックス)なのでRDBテーブルやRのデータフレームなどがこの形式。
インデキシング、ラベリング、パラメトライズなどの構造(どれも同じ)を持ち、異なるインデキシング/ラベリング/パラメトライズは異なる対象とみなすような圏様環境〈category-like environment〉のなかで計算するのだろう。