このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

どうやって合理化するか、z値の例

ホントに疲れる!

次の言明をどう解釈するか。

  • x 〜 N(μ, σ2) のとき、z 〜 N(0, 1)
  • ここで、z = (x - μx)/σx

知っている人には、見慣れた何でもない記述だろうが、解釈にはほんとに苦労した(結局は曖昧のままだが)。「それが何であるか」が定義されないままに用語と記号だけで話が進むので、言明の意味がサッパリ理解できないのだ。

で、言明の背後に何があり、どのような習慣が使われているかを推測する。

(Ω, ΣΩ, P)を確率空間とする。記号「μ」を平均(mean)の意味で使うので確率測度はPとする。確率変数(可測関数)X:Ω→Rに対して、

  • PX := X*(P) 前送り測度
  • FX := λx∈R.PX({t∈R | t ≦ x}) 測度PXの累積分布関数
  • fX := d/dx(F) 測度PXの密度関数

Xは確率変数なので、確率変数の空間(テレンス・タオ流) L∞-(Ω, ΣΩ, P) を考えると、X|→PX は、

  • P-:L∞-(Ω, ΣΩ, P) → Measure(R, ΣR)

となる。確率変数は、ボレルσ代数を備えた可測空間Rの上に確率測度を誘導する。誘導された測度がXの分布だ。ここで、Ω上の確率測度もPと表しているので、PとP-で記号の乱用(オーバーロード)をしている。

また、

  •  normalDist(\mu, \sigma^2)(x)\, := \frac{1}{\sqrt{2\pi\sigma^2}} \exp(\frac{-(x - \mu)^2}{2\sigma^2})

とする。σ2が実は単一変数なのが独特な習慣

N(μ, σ2)はnormalDist(μ, σ2)の略記だと思ってよい。N(0, 1) = normalDist(1, 0)は次のようになる。

  •  normalDist(0, 1)(x)\, := \frac{1}{\sqrt{2\pi}} \exp(\frac{-x^2}{2})

normalDistは、

  • normalDist:R×R≧0→L∞-(R, ΣR, dx)

dxはボレルσ代数上の標準ルベーグ測度を象徴的に表す記号。L∞-(R, ΣR, dx)が、R上の分布の空間Dist(R)だと思ってもいいだろう(色々と補足事項はあるが)。

さて、x 〜 N(μ, σ2) の解釈だが、確率変数XとR上の単なる変数xを混同するという悪しき習慣が使われている。なのでこれは、X 〜 N(μ, σ2)。

「〜」は「従う」だが、この場合は、

  • fX = normalDist(μ, σ2)

と解釈できる。同様に、

  • fZ = normalDist(0, 1)

normalDist(0, 1)を標準正規分布(の密度関数)と呼ぶ。XやZはあくまで確率変数であって、fX、fZは密度関数である。

z = (x - μx)/σx の正確な意味は、

  • z = λx∈R.(x - μx)/σx

つまり、zはR上の関数だが、z = z(x) のような古典的習慣が使われて、変数(so-called 従属変数)と関数を同じ記号で表す。

小文字zと大文字Zも習慣で、z:RR に対応する確率変数を大文字にする。しかし、この大文字小文字対応も省略して、確率変数と単なる変数を同じ文字で表すことが多い。もうどうにもならない。酷い、酷すぎる。

まだある。μx と σx が何であるか? これもxとXの混同らしく、

  • μx = μX = E[X]
  • σx= σX = √(V[X])

らしい。E[X]とV[X]は、確率変数Xに対する期待値と分散である。μxを「xの平均」とかいうが、このときのxは確率変数Xを意味する(はずだ)。

zの定義をもう一度書き直すと:

  • z = λx∈R.(x - E[X])/√(V[X])

x, zを確率変数だと思い直すと、

  • Z = (X - E[X])/√(V[X])

X|→Z の対応は確率変数の空間における変換とみなせる。

さてさて、事実はもっと錯綜している。z = (x - μx)/σx は僕がより理解しやすいように書き換えたもので、もとの記述は、

  • zi = (xi - μx)/σx

下添字iは、サンプルの番号を走ると思われる。x = (x1, ..., xn) = (xi) と書いてみると、

  • μx := Σ(i = 1, ..., n| xi) ここのΣは総和!

じゃないかという疑いも出てくる。しかし、このような場合はオーバーバーが使われる習慣に依拠して、その可能性は排除した。確率変数の等式だと再解釈すると:

  • Zi = (Xi - μX)/σX = (Xi - E[X])/√(V[X])

となると、Xi達は、確率標本(標本基底)ということになり、Zは確率変数の列のあいだの変換とも捉えられる(かもしれない)。このときも、XとXi暗黙の関係性(Xi達はXと同分布と独立)を仮定していると思われる。

結局、評判が良い某教科書の真意のほどは謎のままだ(それ以上は何も書いてないので)。