不偏統計量
統計量の定義がハッキリしないし、幾つかの定義があるかも知れない。とりあえず、次のように考える。
- 確率空間と実数値確率変数Xがある。
- Xと同分布独立な確率変数列 X1, X2, ..., Xn がある。
- X2, ..., Xn は確率標本である。
- 母集団とは確率標本を伴う確率空間だと考える。(あるいは測度空間を規格化して確率空間とする。)
- g:Rn→R がある。
X1, X2, ..., Xn のデカルトタプリングを <X1, X2, ..., Xn> として、
- G = <X1, X2, ..., Xn>;g 。
Gは確率変数である。Gの期待値(平均積分)をE(G)とする。
母集団は確率標本を伴う。その典型確率変数がXで、他の確率変数はすべてXと同分布。その分布が、パラメータ付きの密度関数の族 Φ = {fθ | θ∈Θ} で表されるとき、母集団はΦ母集団と呼ぶことにする。Φ母集団の定義には、典型確率変数(1回のサンプリングを定義する)が必要。
Φ母集団は、実際にはある特定のパラメータθに対する分布(密度関数)fθを持つ。そのθを推定したい。確率変数Gが、E(G) = θ としてθを与えるとき、Gを不偏統計量と呼ぶ。Gとgの区別は非常に曖昧なので、gを指して不偏統計量と呼ぶこともある。平均は不偏統計量である。
ちなみに、「母ナントカ」の「母」は「母集団のナントカ」と説明されることが多いが、「分布族のパラメータとしてのナントカ」のほうが誤解が少ないと思う。
統計モデルが、確率変数とパラメータ付き分布族により指定され、確率標本の実現値(値の空間の要素)によりパラメータを推定する。