このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

統計量、n度目の再考

統計量を広義に解釈するなら、任意の確率変数ということになる。しかし、標本の実現値(=データ)から具体的に計算できないものは統計量ではない、という記述を見た。一方で、標準化統計量Zについて考えると、単なる確率変数よりは拡大しないといけない気もする(定義の拡大についてはいずれ)。

まず、Aは代数的確率空間であるトレース可換環だとする。トレースは期待値。確率変数=観測量はAの要素だとする。X∈A に対してn標本代数 An[X] を定義する。n標本代数 An[X] の純代数的な構成は分からないが、AがL∞-(Ω, P) として与えられている時なら、n標本代数はAの上にn個の生成元 X1, ..., Xn を持つ加群として構成できる。

  A^{n}[X] \,:= L^{\infty -}(\Omega^{\otimes n},\, P^{\otimes n})

いずれにしても、統計量の定義には、確率標本と許容できる統計値関数の空間が必要。実確率変数 X:Ω→R に対して、X(n) = (X1, ..., Xn) が確率標本=標本ベクトル確率変数。X(n)は、ΩnRn という、直積(圏論的には弱直積)確率空間で定義されたベクトル値確率変数。

Φn⊆Meas(Rn, R) (可測関数)とする。例えば、Φn = C(Rn) = (Rn上の連続関数の全体)。Φ = (Φn | n = 1, 2, ...) を許容統計値関数の空間(次数付き)とする。多項式関数の空間もΦとしてよく使われる。

統計量を実効統計量と超越統計量に分ける。まず、実効統計量は、基本観測量(基本変量)X:Ω→Rのn-確率標本をX(n)として、許容統計値関数 φ∈Φn を使って、φ(X(n)) と書けるもの。φ(X(n)) は、X(n);φ : ΩnR という可測関数の結合のこと。

実効統計量 φ(X(n)) において、X(n)n-サンプリングに対応し、φが統計値計算を遂行するための関数。x∈Rnに対するφ(x)は、サンプリングの実現値(データ)xに対する統計値になる。

統計汎関数は確率変数の空間、または分布の空間で定義された実数値関数のこと。一般の統計量は、統計汎関数を使ってスカラー(実数値)を求めて、その実数値をスカラー乗法で他の統計量(確率変数)に掛けることを許して作った確率変数。期待値汎関数(期待値作用素とも呼ぶ)が基本的な統計汎関数で、他の統計汎関数は、期待値汎関数を使って作られる。

一般の統計量(確率変数、変量)のなかで、実効統計量は統計汎関数を使ってない。統計汎関数(実質的には期待値汎関数だけ)を使っているものを超越統計量と呼ぶことにする。超越統計量は、n-標本の実現値(Rnの元、データ)に対する計算と同じ手順(許容関数、統計値関数)では計算できない。

統計値汎関数の値が定数として与えられたとき、それを神託(オラクル)と呼ぶ。神託を使うと統計量が実効的になる。神託定数を使った統計量を神託統計量と呼ぶ。母平均が与えられての母平均からの偏差ベクトルを求める計算や、母分散が与えられての母平均の推定統計量などは神託統計量となる。神託を実数定数とみなすと、神託統計量は実効統計量になる。