このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

「従う」、「データが分布する」

相変わらず定義なしの基本用語にイライラしている。

「従う」の定義をみたことがない。索引に動詞を載せることはないので「従う」は載っていない(知る限りでは)。

まず、「従う」の主語が分からない。

はぁーーー?? 主語となる「母集団」「データ」「変数」がそもそも定義がハッキリしないが、変数=確率変数と考えれば、確率変数=可測写像のはずだから、

となる。これでは意味不明。

述語に出てくる正規分布が確実に定義できるのは、R上の密度関数、せいぜいRn上の密度関数としてだろう。測度としての正規分布は、密度関数に対する積分により与えられる。これはまークリアな話だ。

未知の測度空間である母集団では、「測度が正規分布である」にどのような定義を与えるのだろう?Rnのときのように、具体的な表式は使えない。なにか公理的に正規分布(である測度)を定義することは出来なくもない気がするが、そういう話ではないだろう。

「母集団」と呼ばれる測度空間や「変数」と呼ばれる可測写像が主語なのではなくて、やはり主語は像測度だろう。

  • 便宜上「母集団」と呼ばれる測度空間と、便宜上「変数」と呼ばれるR値の可測写像があるとき、元の測度空間の測度の像測度が ××× である。

が、たぶん正確な主張。それを「母集団が ××× である」「変数が ××× である」と(とんでもなく)省略しているらしい。

しかしそれにしても、「データが ××× である」は分からない。おそらくは、データは統計の基本中の基本をハッキリさせる - 檜山正幸のキマイラ飼育記で述べたデータシーケンスだろう。それ自身が「正規分布に従う」に意味があるとは思えない。おそらく、データを採取した状況に想定される人為的概念モデルにおいて「注目している変数が正規分布に従う」ことだろう。

「変数が正規分布に従う」の意味は、上記のように背後に測度空間があり、変数とは言いながら主語は像測度だと解釈するとして、「従う」ってナニ? 思うにこれは「属する」なのだろう。

例えば、R上の分布(測度)の空間を考えて、その部分集合を考える。つまり、単一の測度ではなくて複数の測度からなる族を考える。この族は多くの場合パラメータ表示で与えられる。注目している当該の分布(像測度)が、その族に含まれことを「従う」と表現しているように思う。

よって、「データが正規分布に従う」は次の意味になる。

  • データには、注目している変数がある。
  • その変数は可測写像である。
  • その可測写像の定義域は測度空間である。
  • その測度空間の測度は、注目している変数=可測写像で前送りされる。
  • 前送りで定義される値の空間上の測度を像測度と呼ぶ。
  • その像測度は、正規分布と呼ばれる測度族に属する

モデルの定義もない:しょうがないからとりあえず統計フレームを定義する - 檜山正幸のキマイラ飼育記 メモ編で、モデルの枠組みである統計フレームを定義したが、たいていの場合、統計フレームを前提にしているがそれに言及しない習慣があるのだろう。統計フレームは人為的に構成するものだが、まるで天が与えてくれた環境のように扱う、僕は良くない習慣だと思うが、文句を言ってもしょうがない。