このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

伝統的慣習的記法

カタヅケ主義者と昔風の関数、それとコミュ障 - 檜山正幸のキマイラ飼育記慣用句、慣用記法の解釈 - 檜山正幸のキマイラ飼育記 メモ編 とか f(X), f(x) の合理的解釈 - 檜山正幸のキマイラ飼育記 メモ編、の流れ。

母集団と標本で文字を区別するという伝統がある。

母集団 標本
変量 ? x, y
標準変量 ? z
平均 μ
標準偏差 σ s
相関係数 ρ r

ルールは一貫してないし、解釈も難しい。

  • 標本平均は記号がない。μに対するmを使うか。
  • 変量は本来、母集団上の確率変数だと思われるが、x, yなどは値の空間を走る変数として使われることが多い。母集団からの確率変数とデータ空間からの関数が峻別されない。
  • 標準化は、標本変量=確率標本=nサンプリングの空間から別のベクトル空間への写像のようだが、確率変数とも解釈できる。大文字Zの意味もハッキリはしない。変換そのもの Z:RnRn-1なのか、対応する確率変数(確率ベクトル、ベクトル値確率変数)なのか?
  • 相関は2変数のとき。相関係数行列はRか?

慣習に合うかどうはともかく、次がいいと思う。

  • x, yはサンプルデータ空間を走る変数
  • z = z(x) は、変換と値の空間を走る変数の両方に使う(多義、オーバーロード
  • zはRnに値を取るが、部分空間に入るので自由度は減っている。
  • Z = z(X) は、確率変数Xと標準化変換zによって作られた確率変数。これが本来の標準化変量かもしれない。
  • ρ, rを考えるときは、暗黙にX, Y, x, yを考える。
  • サンプルサイズnは重要な量だが、暗黙に処理される。
  • 各変数の値の空間とその構造は暗黙な文脈となる。