このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

オーバーバー記法はトンデモナイ

[過去に書いたものだが] 頭痛がする統計用語・記法のシリーズ、延々と。

  \bar{x} = \frac{1}{n}(x_1 + \,\ldots\, + x_n)
  \bar{X} = \frac{1}{n}(X_1 + \,\ldots\, + X_n)

大文字小文字の違いなので、この記法はよく使われる。ところが、一見類似性があるが、これはトンデモナイ記法で、まったくの別物。

小文字の   \bar{x} は、 x = (x_1\,\ldots\,  x_n) というタプルを考えれば、タプル変数xに対する関数を、一種の演算子記号(オーバーバー)で表したものと解釈できる。

  \bar{X} の解釈は面倒くさくて難しい。しかも流儀が少なくとも3つはある。

  1. 大文字Xはスカラー値確率変数とする。  \bar{X} は、確率変数Xから別な確率変数を作る複雑な仕掛け(統計変換)を表すとする。
  2. 大文字Xはベクトル値確率変数とする。  \bar{X} は、ベクトル確率変数Xを単に平均値関数に代入(実際は関数結合)したことを表す。
  3. 大文字Xは、スカラー値確率変数とベクトル値確率変数のどちらも表す。記号のオーバーロードであり、文脈ごとに解釈を変える。

さらには、確率変数XとR上の単なる変数xを混同するという悪しき習慣も併用するのだから、もう気違い沙汰だ。まっとうな理解は極めて困難。天下りの暗記か思考停止か、あるいは挫折。

大文字Xはスカラー値確率変数

確率変数Xに対して、可測空間の圏でテンソルベキを考えて、それを  X^{\otimes n}: \Omega^n \rightarrow \mathbf{R}^{n} とする。 X_{(n)} \,:= X^{\otimes n} と定義する。X(n)nRn というベクトル確率変数ができる。このX(n)スカラー確率変数Xから作ったもの。

i = 1, ..., n に対して、Xi = X(n)i とする。ここで、πiは、RnR という射影のi番目のもの。Xi を使うと、

  • X(n) = (X1, ..., Xn)

という書き方ができる。X(n)はXから作られたものだが、XとX(n)は別物!

下付きの(n)は、X|→X(n) という対応に対する演算子記号と考えることができる。mean(x) = mean((x1, ..., xn)) = mean(x1, ..., xn) として、

 \bar{X} \,:= mean(X_{(n)}) = mean \,\circ\, X_{(n)} \,:\, \Omega \rightarrow \mathbf{R}

となる。

ここでは、スカラー確率変数はX、それから作られたベクトル確率変数はX(n)、射影を取ったスカラー確率変数はXiとして区別してる。オーバーバーには、mean(X(n)) という解釈を与える。

大文字Xはベクトル値確率変数

Xi達は、n個のスカラー確率変数として、ベクトル確率変数Xを、X = (X1, ..., Xn) として定義する。この場合は、オーバーバーは、meanの演算子記号だと思ってよい。

Xはベクトル確率変数なので、スカラー確率変数としてはX1を使う。

オーバーロード

スカラー確率変数としてのXと、ベクトル確率変数としてのXをオーバーロードする。最も分かりにくいが最も使われているかも知れない。さらに、確率変数XとR上の単なる変数xを混同するという悪しき習慣も併用されると、ほとんどワケワカメ。伝統とは言え酷すぎる。