このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

観測値ベクトル空間とシーケンス空間

確率ベクトルは多義的だからやめて、ベクトル確率変数(ベクトル変量、ベクトル観測量)を使うことにした(ベクトル確率変数の曖昧性 - 檜山正幸のキマイラ飼育記 メモ編 参照)。

それでもまだダメで、集団に備わる基本観測量 X:Ω→V と、抽出インデックス集合Iを使った標本変量 X(I)I→VI は区別すべきだ。Vがベクトル空間のとき、Xはベクトル空間となる。しかし、いつでもベクトル空間とは限らない(尺度による 尺度の圏論 - 檜山正幸のキマイラ飼育記 メモ編 参照)。

Vがなんであっても、I = {1, ..., n} としての標本変量は作れる。この標本変量を表すために、値空間がVのときに、Vnに値を取る確率変数をシーケンス変量と呼ぶ。VnVのシーケンス空間。シーケンス空間の要素がシーケンスだが、シーケンスは、単なるタプルではなくて、n-抽出によって得られたデータをシーケンスと考える(心の問題)。

基本観測量の値空間Vがベクトル空間のとき、n-シーケンス空間Vnもベクトル空間になり、Vがユークリッド空間ならVnユークリッド構造を入れることができる。有偏分散(biased variance)と不偏分散(unbiased variance)はシーケンス空間のユークリッド構造がないと定義できない。

シーケンス変量の定義域である確率空間は、元の確率空間(母集団)とは限らない。標本変量のときは、確率空間からして変わっている。n-抽出の全体と直積測度で作った (Ωn, P(n)) が標本変量の定義域だ。

標本変量の場合は、i番目の射影 πi:Vn→V との結合 X(n)i を成分とは呼ばずにケースと呼ぶことにする。第iケース、i番目のケースなどと言う。

すべてケースが等しいシーケンスを定常シーケンスと呼ぶ。定常シーケンスの全体は、シーケンス空間の部分空間となる。この空間を定常空間と呼ぶことにする。定常空間⊆Vn で、定常空間\stackrel{\sim}{=}V である。V=R のときは、定常空間は、(1, 1, .., 1)のスカラー倍の1次元空間となる。

観測値空間Vがユークリッド空間なら、n-シーケンス空間Vnユークリッド空間で、定常空間の直交補空間を作れる。この直交補空間が偏差空間で、dim(V) = d のとき、偏差空間の次元 = (n - 1)d となる。偏差空間の二乗ノルムが標準偏差スカラー、二乗ノルムの二乗が(ノルム平方)が分散。ノルムよりノルム平方のほうがよく使う。

標本変量が値を取る空間がシーケンス空間で、シーケンス空間のユークリッド構造が分散の基本となる。分散は、内積、二乗ノルム、ノルム平方、2次型式、内積ベースのテンソルなどを使っている。

定常空間と偏差空間の直交性を、アフィン空間の各点で考えると、ユークリッドアフィン空間は、直交葉層構造を持つ。シーケンス空間の直交葉層構造に伴うピタゴラスの定理は、分散の計算に本質的に使う。

ンス空間の直交葉層構造に伴うピタゴラスの定理は、分散の計算に本質的に使う。