このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

サンプリング

標本空間のサンプルの話は今は置いとく。

『統計数学』p.72では、確率標本という言葉を使っているが、おそらくはrandom sample(ing)だろう。

基本的には、I.I.D.確率変数列=確率標本でいいだろう。

さて、カルバートソン/スターツ(Culbertson, Sturtz)の https://arxiv.org/pdf/1205.1488 でsampling distribution(標本分布)という言葉を使っている。

↑とは意味がが全然違うような、、、

↑は教育的だが、これとも話が違う。

カルバートソン/スターツhttps://arxiv.org/pdf/1205.1488 は記号と言葉の選び方が不適切で読みにくい論文だ。

一般にベイズ推論では、仮説(hypothesis)と証拠(evidence)という言葉が使われていて(e.g. https://en.wikipedia.org/wiki/Bayesian_inference)、仮説の確率(Probability of a hypothesis)なんて概念があるから、カルバートソン/スターツの「仮説の空間」(hypothesis space)はパラメータの空間のように思える。

カルバートソン/スターツの「標本分布」は、仮説空間=パラメータ空間からデータの空間への確率核(単に「条件付き確率」と呼んでいる)のようだから、どうもパラメトリックモデルを「標本分布」と呼んでいるようだ。ほとんどワケワカな用語法。データ空間の分布が証拠に相当するのか?

別な論文 https://arxiv.org/pdf/1601.02593.pdf の記法は標準的で、だいぶマシな書き方になっている。

それとまた別な論文 https://arxiv.org/pdf/1312.1445.pdf では

The sampling distribution S and inference map I are often written as PD∣H and PH∣D, respectively, (誤記修正 by 檜山)

と書いてあるので、S(x|θ) = PD∣H(x|θ) の意味とすると、パラメータθごとの分布 S(-|θ) を与えているので、パラメトリックモデルだろう、やっぱり。どこから「サンプリング分布」が出てきたのか謎。

https://arxiv.org/pdf/1312.1445.pdf のp.6第2章から、p.25までの20ページのほうが https://arxiv.org/pdf/1205.1488 より幾分か改善されているようだ。