このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

不偏統計量

統計量の定義がハッキリしないし、幾つかの定義があるかも知れない。とりあえず、次のように考える。

  • 確率空間と実数値確率変数Xがある。
  • Xと同分布独立な確率変数列 X1, X2, ..., Xn がある。
  • X2, ..., Xn は確率標本である。
  • 母集団とは確率標本を伴う確率空間だと考える。(あるいは測度空間を規格化して確率空間とする。)
  • g:RnR がある。

X1, X2, ..., Xnデカルトタプリングを <X1, X2, ..., Xn> として、

  • G = <X1, X2, ..., Xn>;g 。

Gは確率変数である。Gの期待値(平均積分)をE(G)とする。

母集団は確率標本を伴う。その典型確率変数がXで、他の確率変数はすべてXと同分布。その分布が、パラメータ付きの密度関数の族 Φ = {fθ | θ∈Θ} で表されるとき、母集団はΦ母集団と呼ぶことにする。Φ母集団の定義には、典型確率変数(1回のサンプリングを定義する)が必要。

Φ母集団は、実際にはある特定のパラメータθに対する分布(密度関数)fθを持つ。そのθを推定したい。確率変数Gが、E(G) = θ としてθを与えるとき、Gを不偏統計量と呼ぶ。Gとgの区別は非常に曖昧なので、gを指して不偏統計量と呼ぶこともある。平均は不偏統計量である。

ちなみに、「母ナントカ」の「母」は「母集団のナントカ」と説明されることが多いが、「分布族のパラメータとしてのナントカ」のほうが誤解が少ないと思う。

統計モデルが、確率変数とパラメータ付き分布族により指定され、確率標本の実現値(値の空間の要素)によりパラメータを推定する。