伝統的慣習的記法
カタヅケ主義者と昔風の関数、それとコミュ障 - 檜山正幸のキマイラ飼育記、慣用句、慣用記法の解釈 - 檜山正幸のキマイラ飼育記 メモ編 とか f(X), f(x) の合理的解釈 - 檜山正幸のキマイラ飼育記 メモ編、の流れ。
母集団と標本で文字を区別するという伝統がある。
母集団 | 標本 | |
---|---|---|
変量 | ? | x, y |
標準変量 | ? | z |
平均 | μ | |
標準偏差 | σ | s |
相関係数 | ρ | r |
ルールは一貫してないし、解釈も難しい。
- 標本平均は記号がない。μに対するmを使うか。
- 変量は本来、母集団上の確率変数だと思われるが、x, yなどは値の空間を走る変数として使われることが多い。母集団からの確率変数とデータ空間からの関数が峻別されない。
- 標準化は、標本変量=確率標本=nサンプリングの空間から別のベクトル空間への写像のようだが、確率変数とも解釈できる。大文字Zの意味もハッキリはしない。変換そのもの Z:Rn→Rn-1なのか、対応する確率変数(確率ベクトル、ベクトル値確率変数)なのか?
- 相関は2変数のとき。相関係数行列はRか?
慣習に合うかどうはともかく、次がいいと思う。
- x, yはサンプルデータ空間を走る変数
- z = z(x) は、変換と値の空間を走る変数の両方に使う(多義、オーバーロード)
- zはRnに値を取るが、部分空間に入るので自由度は減っている。
- Z = z(X) は、確率変数Xと標準化変換zによって作られた確率変数。これが本来の標準化変量かもしれない。
- ρ, rを考えるときは、暗黙にX, Y, x, yを考える。
- サンプルサイズnは重要な量だが、暗黙に処理される。
- 各変数の値の空間とその構造は暗黙な文脈となる。