このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

分布の意味

どの分野も最初は用語法が無茶苦茶だと感じるもんだ(例えば型理論)。だから、どこも「こんなもの」なのかも知れないが、入門したばかりの今は「これは酷い!」の連発。

「分布」という言葉がものすごく頻繁に出て来るが、まともな定義が見当たらない。使用事例から推測するしかない(そんなんばっかり!)のだが、たぶん2つの意味。

  1. 測度と同義
  2. 像測度と同義

どっちも測度だから、まー「分布=測度」と言ってもいい。

まず、Rに標準的な測度構造を入れて、その上の密度関数から新しい測度を定義したものを分布と呼ぶ。密度関数を経由しなくてもよいが、密度関数があるときは、密度関数を分布と呼んでしまうこともある。同じ理由で密度の累積(積分)関数も分布と呼ぶことがある -- これらは測度の表現形式に過ぎないのだが…。要するに、R上のなんらかの測度、またはその測度を表現するナニカを、イイカゲンに曖昧に「分布」と呼ぶ。それが実情だろう。

上記の用法では、R(またはRの部分集合)が台集合であり、その他の集合や測度空間は出てこない。しかし、多くの場合は、別な測度空間を暗黙に仮定して「分布」を使っている。暗黙だからたちが悪い!

測度空間 X = (X, ΣX, μ) があって、f:X→R は可測写像とする。Rの標準的なσ代数をΣRとすると、fによる引き戻し(逆像)は、ΣR→ΣX という向きのσ代数の準同型を引き起こす。これをf*と書くことにする。

R上の測度νを、ν(A) := μ(f*(A)) で定義できる。これをfによるμの像測度と呼び、ν = f*(μ) と書く。点の関数が集合の関数を逆向きに引き起こし、さらに逆向き(で結局元に戻る)測度の関数を引き起こす。f, f*(逆向き), f*(同じ向き) の三つ組で考えるのが重要だと思う。

像測度νは、R上の測度だから、第一の用法で「分布」になる。しかし、背後には、別な測度空間Xと、Xの測度μがあり、νは像測度として得られたものだ。この状況での「分布」νは、μへの手がかりのように扱う。μの代わりにνを扱う、みたいな。潜在的・暗黙にそう考える。

Rベースで話をしたが、Rの代わりに実係数バナッハ空間でも大丈夫だろう。ただし、密度を累積する(積分する)とかは意味を失う。全順序に頼っているから。

「確率分布」というときの分布はたいてい第二の用法で、背後に確率空間があって、Rへの可測写像は確率変数と呼び、その確率変数(=可測写像)で前送りされた像測度(もとの確率測度の像)を「確率分布」と呼んでいる。確率測度と確率分布を、文脈によらずに完全に同義語として扱う例もある。

確率分布を単に分布と略称するのはまーいいのだが、確率と無関係な状況でも像測度を確率分布と呼んだりする。そもそも、有界測度が確率概念と関係あるかどうかが曖昧、というか決められないことが多い。「確率概念」なんてのが定義可能とも思えない。なにもかにもが曖昧な世界だ。曖昧さを取り扱う用語体系や定義が曖昧なのは洒落にならない。そこで、曖昧さに対処するトレーニングをしろ、ってことか、だとしたら大した教育的配慮だこと。

たまたま全体積が1になる図形のモデルである測度空間があると、定義上それは確率空間だが、確率概念に基づいた測度空間か?というとよく分からない。体積を計る話だから関係ない気もするが、「体積も確率なのだ」とか言われると、反論の方法がない。だって、そこから先は言葉遊びの世界だから。