このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

改善案:パラメトリック統計モデル

Mを次のような圏とする。

  • Mはハウスドルフ位相空間の圏への構造忘却関手を持つ。
  • Mは可測空間の圏への構造忘却関手を持つ。
  • Mの対象のσ代数は、その位相のボレル集合族である。
  • Mの対象には、標準測度と呼ばれる測度が載っている。標準測度は、有界〈有限〉である必要はない。測度無限大の可測集合があってもよい。

Mの対象を A = (A, OA, ΣA, ΛA) と書く。Aは台集合、OAは位相(開集合族)、ΣAはσ代数だが、ΣA = Borel(OA)。ΛAはΣA上の測度。

ここらへんの話は、

M上に3種のジリィ・モナドが作れるとする。ただし、相対モナドになりそう。

  1. G(-) : 有界〈有限〉測度からなる集合+可測構造。G:MMeas
  2. G≦1(-) : 劣確率測度からなる集合+可測構造。G≦1:MMeas
  3. G1(-) : 確率測度からなる集合+可測構造。G1:MMeas

それぞれにクライスリ圏が作れる。クライスリ圏をStoch(stochasticから)とする。Stockを作るためのモナドは目的に応じて適宜選択。

Pをパラメータ領域の圏で、対象はユークリッド空間の開集合、射は適当なrに対するCr写像とする。ヘットセットModelを次のように定義する。

  • Model(Θ, X) := Map(Θ, G1(X))

Model(Θ, X)に対して、

  • P(Ξ, Θ)×Model(Θ, X)→Model(Ξ, X)
  • Model(Θ, X)×Stoch(X, Y)→Model(Θ, Y)

が定義できるので、Model(-, -)はプロ関手(斜め圏)になる。豊饒プロ関手になってくれると嬉しいが、現状よくわからない。

とりあえず、Modelは、左からパラメータの圏が反変に作用し、右から確率核(マルコフ核)の圏が共変に作用する集合値双加群〈set-valued bimodule〉になる。

この枠内で、推定量〈推定子 | estimator〉などを定義したい。

推定子は学習関数と同じなので、なんらかのデータ空間から仮説空間=モデル空間への写像。データ空間の構成には、変量=確率変数が必要。変量の分布に対して、独立同分布族を作る。独立同分布族の値空間の直積がデータ空間。データ空間=観測空間からパラメータ空間≒モデル空間への写像が推定量

ヘテロスパンとしての母集団を余複射とする余複圏ができるが、それと{確率 | 統計}モデルの斜め圏〈プロ関手 | 双加群〉の関係がイマイチわからん。