改善案:パラメトリック統計モデル
Mを次のような圏とする。
- Mはハウスドルフ位相空間の圏への構造忘却関手を持つ。
- Mは可測空間の圏への構造忘却関手を持つ。
- Mの対象のσ代数は、その位相のボレル集合族である。
- Mの対象には、標準測度と呼ばれる測度が載っている。標準測度は、有界〈有限〉である必要はない。測度無限大の可測集合があってもよい。
Mの対象を A = (A, OA, ΣA, ΛA) と書く。Aは台集合、OAは位相(開集合族)、ΣAはσ代数だが、ΣA = Borel(OA)。ΛAはΣA上の測度。
ここらへんの話は、
M上に3種のジリィ・モナドが作れるとする。ただし、相対モナドになりそう。
- G(-) : 有界〈有限〉測度からなる集合+可測構造。G:M→Meas
- G≦1(-) : 劣確率測度からなる集合+可測構造。G≦1:M→Meas
- G1(-) : 確率測度からなる集合+可測構造。G1:M→Meas
それぞれにクライスリ圏が作れる。クライスリ圏をStoch(stochasticから)とする。Stockを作るためのモナドは目的に応じて適宜選択。
Pをパラメータ領域の圏で、対象はユークリッド空間の開集合、射は適当なrに対するCr写像とする。ヘットセットModelを次のように定義する。
- Model(Θ, X) := Map(Θ, G1(X))
Model(Θ, X)に対して、
- P(Ξ, Θ)×Model(Θ, X)→Model(Ξ, X)
- Model(Θ, X)×Stoch(X, Y)→Model(Θ, Y)
が定義できるので、Model(-, -)はプロ関手(斜め圏)になる。豊饒プロ関手になってくれると嬉しいが、現状よくわからない。
とりあえず、Modelは、左からパラメータの圏が反変に作用し、右から確率核(マルコフ核)の圏が共変に作用する集合値双加群〈set-valued bimodule〉になる。
この枠内で、推定量〈推定子 | estimator〉などを定義したい。
推定子は学習関数と同じなので、なんらかのデータ空間から仮説空間=モデル空間への写像。データ空間の構成には、変量=確率変数が必要。変量の分布に対して、独立同分布族を作る。独立同分布族の値空間の直積がデータ空間。データ空間=観測空間からパラメータ空間≒モデル空間への写像が推定量。
ヘテロスパンとしての母集団を余複射とする余複圏ができるが、それと{確率 | 統計}モデルの斜め圏〈プロ関手 | 双加群〉の関係がイマイチわからん。