このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

確率変数と事象の混同、その他諸々の混同も

ベイズ・ネットワークの定義では、普通、ノードは確率変数だと言われる。この意味での確率変数を「事象」と記述してある本がある。意味不明だったが、次のように解釈できる。

まず、確率変数を確率空間のあいだの確率(測度)保存可測写像の意味で使う。この使用法で、確率変数の域をバックエンド確率空間、余域をフロントエンド確率空間とする。

フロントエンド確率空間の確率測度をバックエンドのそれと区別して「分布」と呼ぶ人もいある。分布=フロントエンド確率測度。確率変数の意義は分布=フロントエンド確率測度を定義するだけで、フロントエンド確率測度が決まれば、バックエンド確率空間は不要とすることがある。この場合、確率変数と分布とフロントエンド確率空間は混同される。

つまり

  • 確率変数 ~=~ 分布 ~=~ フロントエンド確率空間

記号'~=~'は曖昧に混同されることを示す。

また、確率空間の台集合を標本空間と呼ぶことがあるが、これも用法がいくつかあって:

  • なんであっても確率空間の台集合を標本空間と呼ぶ。
  • バックエンド確率空間の台集合を標本空間と呼ぶ。
  • フロントエンド確率空間の台集合を標本空間と呼ぶ。

バックエンド確率空間の台集合を標本空間と呼ぶときは、フロントエンド確率空間の台集合を状態空間と呼ぶこともある。フロントエンド台集合の点を確率変数の状態と呼ぶのだ。そして、状態は確率的に決まるとか言う、意味不明だ。

「試行」という言葉も意味不明だが、自明空間1からバックエンド確率空間への写像を試行と呼ぶと辻褄があいそうだ。試行に対してバックエンド台集合の点が対応する。暗黙の確率変数=可測写像があれば、試行の結果である点の値が求まる。この値を「試行の結果(の観測値)」と言うのだろう。

さて、フロントエンド台集合は、確率変数の値空間と呼ぶことにして、値空間が特に二元集合だとする。この二元集合にtrue/falseの意味があるとき命題と解釈する。つまり、確率変数の値集合が命題論理の真偽値集合とみなす。

すると、バックエンド確率空間からの確率変数は真偽値を値とする。真の逆像はバックエンド確率空間の事象(台集合の可測部分集合)となる。つまり、値空間が真偽値のときは、「確率変数 ~=~ 事象」となる。よって、確率変数と事象を混同する現象が生じる。

ベイジアンネットワークの場合、確率変数の値空間が真偽値のときは非常に多い。ので、「ノード ~=~ 確率変数 ~=~ 事象」という曖昧な取り換え可能性がある。もちろん、「確率変数の値空間が真偽値である」という暗黙の前提がある。

事象と確率変数の混同は、部分集合が二値真偽値への確率変数と同一視できるからだ。連続真偽値[0, 1]への確率変数があると、バックエンド台集合にはファジー事象=ファジー部分集合が誘導される。ファジー事象とは、バックエンド台集合上のファジー述語ともいえる。

  • 連続真偽値を値とする確率変数 ~=~ バックエンド・ファジー集合 ~=~ バックエンド・ファジー述語