不偏統計量 - (保存用) 檜山正幸のキマイラ飼育記メモ編

統計量の定義がハッキリしないし、幾つかの定義があるかも知れない。とりあえず、次のように考える。

X₁, X₂, ..., X_n のデカルトタプリングを <X₁, X₂, ..., X_n> として、

Gは確率変数である。Gの期待値（平均積分）をE(G)とする。

母集団は確率標本を伴う。その典型確率変数がXで、他の確率変数はすべてXと同分布。その分布が、パラメータ付きの密度関数の族 Φ = {f_θ | θ∈Θ} で表されるとき、母集団はΦ母集団と呼ぶことにする。Φ母集団の定義には、典型確率変数（1回のサンプリングを定義する）が必要。

Φ母集団は、実際にはある特定のパラメータθに対する分布（密度関数）f_θを持つ。そのθを推定したい。確率変数Gが、E(G) = θ としてθを与えるとき、Gを不偏統計量と呼ぶ。Gとgの区別は非常に曖昧なので、gを指して不偏統計量と呼ぶこともある。平均は不偏統計量である。

ちなみに、「母ナントカ」の「母」は「母集団のナントカ」と説明されることが多いが、「分布族のパラメータとしてのナントカ」のほうが誤解が少ないと思う。

統計モデルが、確率変数とパラメータ付き分布族により指定され、確率標本の実現値（値の空間の要素）によりパラメータを推定する。