このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

「従う」ってなんだ?

「○○が××分布に従う」とか、「従う」がものすごくたくさん出てくる。重要で猛烈に頻出する概念なのだから、さぞや入念、懇切丁寧な説明があるのだろうと思うと、これもやっぱり定義がない。詳細に調査したわけじゃないけど、なんとなくいつのまにか用語を使うパターンだと思う。

分布は測度または像測度と解釈する。主語の○○が、「母集団が」だったり「確率変数が」だったり、「観測値が」だったりするのだけど、どれも正確だとは思えない。測度または像測度に関して云々するなら、次の前提が必要。

  • 可測空間
  • 測度

像測度に関する記述なら、さらに

が必要。よって、主語の解釈は:

  1. 母集団が…: 母集団を可測空間の台集合Xだとみなして、X上の測度空間を考えるか、またはXからの可測写像を考えることを「母集団が」で表す。
  2. 確率変数が…: 確率変数は可測写像のことなので、その可測写像fによるμの像測度 f*(μ) を考えることを意味する。
  3. 観測値が…: これは何を意味したいか?分からない。

測度空間 (X, ΣX, μ) と可測写像 f:X→V が(Vも可測空間)の状況で考えて、「fが××分布に従う」の意味を考えてみる。ここで「××分布」は、V上の測度または測度のパラメータ族 m(θ) とする。可能性としては、

  • X上の測度μのfによる像測度 f*(μ) が、適当なパラメータθを選ぶと、m(θ) に一致する。

この定義自体は厳密だと言えるが、実際にはこれは違うような気がする。この解釈では説明できない用例が多い。たいてい一致しないし、そもそも比較の土俵に乗らないことがある。「一致する」が定義できないのだ。「近似する」とか言っても近似の定義が必要だし。

こんな曖昧な前提でなんで議論を進められるのか?がむしろ疑問だ。用語と概念をすべて再整理しないと何がなんだかほんとにサッパリわからん。