このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

重要なこと、ただし雑多

  • 測度の定義から言っても、単関数(階段関数)は超重要である。
  • よって、単関数を作り出すビニング(箱割り)とヒストグラムは重要。
  • ビン(区間、領域)は可測集合で、ビニングは直和分割。
  • 連続関数をビニングすることもできる。ビンごとに定数関数で置き換える。
  • 連続分布と離散分布は、単関数分布(単分布、階段分布、局所一様分布)で出会う。
  • 連続分布と離散分布の相互変換を行うことがビニング。
  • 「実現値」、「観測値」、「標本値」などと言う時は、暗黙にそれを取得するための《確率変数》(可測写像)がある。
  • 「実現値」、「観測値」、「標本値」の集合には、通常、標準的な(canonical)測度が仮定されている。通常はボレル代数とルベグ測度。
  • 引き戻し測度はいつでも定義できるわけではないが、しばしば暗黙に使われている。部分測度空間は引き戻しで定義される。
  • 写像により、σ代数と測度をまとめて引き戻すことが多い。
  • 確率変数の値の空間を、「標本空間」、「状態空間」と呼ぶことがあるので注意。
  • 添字付けられた確率変数の族を「標本」(「確率標本」「確率的標本」)と呼ぶことがあるので注意。
  • 「添字付けられた確率変数の族」の確率変数なのの、「標本=確率変数」という用法になる。添字の集合が「観測/調査/実験」の多数性(時間的な繰り返しや、同時多数試行)を表現している。
  • 添字の集合は、「観測/調査/実験」をパラメトライズする空間となる。添字の集合に時間を使うと確立過程となる。
  • 標本=サンプリング結果=データなので、標本空間はデータ空間、標本点はデータ点、それは観測された状態(状態の観測値を再び状態と呼ぶ)。
  • 有権者の支持政党/性別/年齢/居住地域/収入、施設への入場者(年齢/男女/時刻)、商品群の売上のような、よくあるデータについて考えるとよい。
  • 確率変数を基準にして、domain側のモノをバックエンド、codomain側のモノをフロントエンドと呼ぶことにする。そうでもしないと用語的には区別できない。例えば、標本空間はバックエンドかフロントエンドか? なんとも言えない。
  • バックエンドの台集合の要素を、個体、実体、原子事象、根本事象などと呼ぶ。
  • バックエンドの台集合の添字付けられた族を個体標本とか実体標本として確率標本と区別する。
  • 個体標本のインスタンスと確率標本の実現値は対応する。
  • 確率標本の同分布性は、「観測/調査/実験」の繰り返し可能性/一様性を表現する。
  • 確率標本の独立性は、「観測/調査/実験」の相互干渉なしであることを表現する。
  • 確率標本は、直積可測空間上にテンソル測度を導く所がミソ。
  • 誘導されたテンソル測度=同時分布は、周辺分布=射影像測度により完全に決定可能であるところがうれしい。