観測値ベクトル空間とシーケンス空間
確率ベクトルは多義的だからやめて、ベクトル確率変数(ベクトル変量、ベクトル観測量)を使うことにした(ベクトル確率変数の曖昧性 - 檜山正幸のキマイラ飼育記 メモ編 参照)。
それでもまだダメで、集団に備わる基本観測量 X:Ω→V と、抽出インデックス集合Iを使った標本変量 X(I):ΩI→VI は区別すべきだ。Vがベクトル空間のとき、Xはベクトル空間となる。しかし、いつでもベクトル空間とは限らない(尺度による 尺度の圏論 - 檜山正幸のキマイラ飼育記 メモ編 参照)。
Vがなんであっても、I = {1, ..., n} としての標本変量は作れる。この標本変量を表すために、値空間がVのときに、Vnに値を取る確率変数をシーケンス変量と呼ぶ。VnはVのシーケンス空間。シーケンス空間の要素がシーケンスだが、シーケンスは、単なるタプルではなくて、n-抽出によって得られたデータをシーケンスと考える(心の問題)。
基本観測量の値空間Vがベクトル空間のとき、n-シーケンス空間Vnもベクトル空間になり、Vがユークリッド空間ならVnもユークリッド構造を入れることができる。有偏分散(biased variance)と不偏分散(unbiased variance)はシーケンス空間のユークリッド構造がないと定義できない。
シーケンス変量の定義域である確率空間は、元の確率空間(母集団)とは限らない。標本変量のときは、確率空間からして変わっている。n-抽出の全体と直積測度で作った (Ωn, P(n)) が標本変量の定義域だ。
標本変量の場合は、i番目の射影 πi:Vn→V との結合 X(n);πi を成分とは呼ばずにケースと呼ぶことにする。第iケース、i番目のケースなどと言う。
すべてケースが等しいシーケンスを定常シーケンスと呼ぶ。定常シーケンスの全体は、シーケンス空間の部分空間となる。この空間を定常空間と呼ぶことにする。定常空間⊆Vn で、定常空間V である。V=R のときは、定常空間は、(1, 1, .., 1)のスカラー倍の1次元空間となる。
観測値空間Vがユークリッド空間なら、n-シーケンス空間Vnもユークリッド空間で、定常空間の直交補空間を作れる。この直交補空間が偏差空間で、dim(V) = d のとき、偏差空間の次元 = (n - 1)d となる。偏差空間の二乗ノルムが標準偏差スカラー、二乗ノルムの二乗が(ノルム平方)が分散。ノルムよりノルム平方のほうがよく使う。
標本変量が値を取る空間がシーケンス空間で、シーケンス空間のユークリッド構造が分散の基本となる。分散は、内積、二乗ノルム、ノルム平方、2次型式、内積ベースのテンソルなどを使っている。
定常空間と偏差空間の直交性を、アフィン空間の各点で考えると、ユークリッドアフィン空間は、直交葉層構造を持つ。シーケンス空間の直交葉層構造に伴うピタゴラスの定理は、分散の計算に本質的に使う。
ンス空間の直交葉層構造に伴うピタゴラスの定理は、分散の計算に本質的に使う。