標本の直感的な説明と実際のところ
まず直感的な説明のほうを書いておく。
直感的な標本は、どうやら像標本集団とその集団から得られた観測値を意味しているようだ。母集団を (Ω, P, X) とすると、像標本集団は、Ωの部分集合Aを標本点集合とするような集団(A, Q, Y)。ここで注意すべきは、測度QがPとはまったく無関係かもしれない(つうか無関係な)こと。YはXのAへの制限で、Y = X|A となっている。
像標本集団では、測度Qの由来がわからないので、抽出インデックスIを使って、抽出α:I→Ωを使った集団 (I, Q, Y) のほうが扱いやすい。Qは事前にI上に与えられた測度で、母集団測度とは関係ない。Y := α;X は母集団観測量の引き戻し。そして、α;X がI上の観測量となり、これが「観測された値」として扱う。つまり、観測された値とは、抽出により引き戻された母集団観測量。
標本データ=観測されたデータとは、適当な(I, Q, Y)におけるYのこと。
概念的なギャップが伴うのは、「全ての標本集団」を考えるところだろう。標本集団(I, Q, Y)において、IとQを固定すれば、Y:I→V(Vは値空間)により標本集団は特定される。では、「すべての標本集団」の集合とはVIかというと、それでは何も議論できない。VIは単に観測データ(値)の空間に過ぎない。
標本集団は、抽出 α:I→Ω で引き起こされるので、「全ての標本集団」はΩIと考えたほうがよい。つまり、標本集団を抽出と同一視する。母集団の基本観測量X:Ω→Vは、ΩI→VIに自然に(関手的に)持ち上がる。それが、I-標本変量X(I):ΩI→VI。
ΩIは抽出の集合だが、抽出=標本と考えると、標本の集合とも言える。VIは抽出から得られたデータの集合、これも標本と呼べる。そして、標本変量も標本(確率標本)である。
すると、標本[変量]X(n)は、標本[抽出]からなる空間から標本[データ]からなる空間への写像となる。標本[変量]X(n)の標本[点集合]は標本[抽出]からなり、標本[値集合]は標本[データ]からなる。
ブラケット内を省略すると:
- 標本は、標本からなる空間から標本からなる空間への写像となる。
- 標本の標本は標本からなり、標本は標本からなる。
ほとんど「ウラニワニハ……」の世界。
乱用のオンパレードだが、使っている乱用は:
母集団からのすべての抽出を標本点集合、すべての標本観測データからなる標本値空間として、再び集団 (ΩI, P(I), X(I):ΩI→VI) を標本集団と呼びたくなるが、そもそもΩIの要素が標本集団だったから、
- 標本集団の標本点は標本集団である。
細か(?)差異を省略すると、
- 標本の標本は標本である。
もうバカかっ!