(保存用) 檜山正幸のキマイラ飼育記メモ編

このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記メモ編」（http://d.hatena.ne.jp/m-hiyama-memo/）のデータを移行・保存したものであり、今後（2019年1月以降）更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

伝統的慣習的記法

確率統計用語法ダメ出し

カタヅケ主義者と昔風の関数、それとコミュ障 - 檜山正幸のキマイラ飼育記、慣用句、慣用記法の解釈 - 檜山正幸のキマイラ飼育記メモ編とか f(X), f(x) の合理的解釈 - 檜山正幸のキマイラ飼育記メモ編、の流れ。

母集団と標本で文字を区別するという伝統がある。

	母集団	標本
変量	?	x, y
標準変量	?	z
平均	μ
標準偏差	σ	s
相関係数	ρ	r

ルールは一貫してないし、解釈も難しい。

標本平均は記号がない。μに対するmを使うか。
変量は本来、母集団上の確率変数だと思われるが、x, yなどは値の空間を走る変数として使われることが多い。母集団からの確率変数とデータ空間からの関数が峻別されない。
標準化は、標本変量＝確率標本＝nサンプリングの空間から別のベクトル空間への写像のようだが、確率変数とも解釈できる。大文字Zの意味もハッキリはしない。変換そのもの Z:Rⁿ→R^n-1なのか、対応する確率変数（確率ベクトル、ベクトル値確率変数）なのか？
相関は2変数のとき。相関係数行列はRか？

慣習に合うかどうはともかく、次がいいと思う。

x, yはサンプルデータ空間を走る変数
z = z(x) は、変換と値の空間を走る変数の両方に使う（多義、オーバーロード）
zはRⁿに値を取るが、部分空間に入るので自由度は減っている。
Z = z(X) は、確率変数Xと標準化変換zによって作られた確率変数。これが本来の標準化変量かもしれない。
ρ, rを考えるときは、暗黙にX, Y, x, yを考える。
サンプルサイズnは重要な量だが、暗黙に処理される。
各変数の値の空間とその構造は暗黙な文脈となる。