尺度の圏とプロ関手と母集団
「「確率変数」の変種:測度に縛られない確率変数 - 檜山正幸のキマイラ飼育記」と「尺度の圏論 - 檜山正幸のキマイラ飼育記 メモ編」で似たことが書いてある。共通の構造を抜き出してみる。確率モデル〈統計モデル〉に尺度の圏を組み入れるって話。
まず、「尺度=測定の結果の構造」ということで、代数/順序/位相などの構造を備えた集合の圏が尺度の圏ということになる。
尺度の種別が圏に対応し、個々の尺度(測定値の集合)が圏の対象となる。例として、
- 有限全順序尺度 -- 有限全順序集合の圏
- Rアフィン尺度 -- Rアフィン空間の圏
- 有限離散尺度 -- 有限集合の圏
- R一次元線形尺度 -- R一次元ベクトル空間の圏
- 距離尺度 -- 距離空間の圏
- 位相尺度 -- ハウスドルフ位相空間の圏
統計用語との対応
- 名義尺度@統計 → 有限集合の圏
- 順序尺度@統計 → 全順序集合の圏
- 間隔尺度@統計 → 1次元アフィン空間の圏
- 比例尺度@統計 → 1次元ベクトル空間の圏
制限を外すと、
- 一般名義尺度 → 任意の集合の圏
- 一般順序尺度 → 任意の順序集合の圏
- 一般間隔尺度 → 有限次元アフィン空間の圏
- 一般比例尺度 → 有限次元ベクトル空間の圏
「尺度の変換」は2つの意味がある。
- ひとつの尺度圏のなかの射
- 2つの尺度圏のあいだの関手
忘却関手も尺度の変換の例になる。付点アフィン空間の圏とベクトル空間の圏の1:1対応も尺度の変換となる関手。
尺度の圏Cが可測空間の圏Measへの忘却関手を持つとき、Cを可測尺度の圏と呼ぶ。
Cを可測尺度の圏として、H:Probop×C→Set というプロ関手を考える。H(A, V)∈|Set| は確率変数の集合と考える。AとVが違う圏に属するのでヘテロ確率変数と呼ぶ。この意味で、HをHetと書いて、Het:Probop×C→Set 、Het(A, V)はヘテロ射の集合、またはヘットセットと呼ぶ。
かつて、プロ関手を斜め圏〈oblique category〉と呼んだこともある。値の圏Setを一般のVにすると、豊饒プロ関手となる。ヘテロ確率変数の全体がVの対象としての構造を持つことになる。
Iを集合圏の部分圏として固定し、Iをインデックス集合の圏と呼ぶ。インデックス集合の圏Iに関するHetのスパンの圏を定義する。I∈|I| に対してI-スパンとは、{fi:A→Vi | i∈I} の形の族のこと。Iを|I|の上で動かして、すべてのI-スパンを集めると、I-スパンの集合(クラス)ができる。スパンのボディと足〈foot〉が違う圏に属するので、ヘテロスパンと呼ぶこともある。
一方、Iに対してヘテロではないホモスパンを定義できる。インデックス集合の圏Iと圏Cから構成されたホモスパンの全体をSpan(I, C)とする。ホモスパンのクラスには、余複圏の構造が入る。
ヘテロスパンにホモスパンを対応させる写像を誘導写像〈inducing map〉と呼ぶ。誘導写像が合理的な条件を満たせば、ヘテロスパンに結合が定義できて、ヘテロスパンが余複圏をなす。ヘテロスパンの余複圏は、Prob上の余複圏とほとんど同じ構造を持つ。
母集団とは、ヘテロスパンのことである。
ヘテロスパンの脚が一本のとき:
ヘテロスパンの脚が0本のとき:
- ヘテロスパンのボディが狭義の母集団=確率空間
確率空間のクラス|Prob|は、ヘテロスパンの余複圏の余複射のクラスに埋め込める。別な言い方をすると、狭義の母集団は、広義の母集団の特別なものとなる。
確率統計モデル〈確率モデル | 統計モデル〉も、ヘテロ射として定義されるだろう。クライスリ・ヘテロ射とでも呼ぶべきものだろう。
Xが可測空間とすると、X上の有界測度の全体G(X)はジリィ・モナドになる。Θを別な圏(ユークリッド開集合の圏とか)の対象として、
- Het(Θ, X) := Map(Θ, G(M))
すると、Θが含まれるパラメータ領域の圏Pと、ジリィ・モナドのクライスリ圏Kl(Meas, G)のあいだのプロ関手となるだろう。ヘットセットにもっと構造が入ると嬉しい。