このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

代数的統計量、代数的統計汎関数

統計量の測度的解釈は、V値確率標本(独立同分布確率変数列) X1, ..., Xn:Ω→V に対して、任意の可測写像 ψ:Vn→W により誘導されるW値確率変数 <X1, ..., Xn>;ψ :Ω→W のこと。V = W = R のときが多い。

V = W = R の統計量は、標本代数を用いて代数的に定義できる。標本代数はトレース可換環であって、統計独立なn個の元からなる基底が固定されたもの。基底が明示的に指定されているところが重要。トレースは期待値と呼ぶことにして、E[X] と書く。E[-] は標本代数上のR線形なR値線形写像(線形形式)。

統計独立性の代数的定義は、多項式f, gに関する E[f(X)g(Y)] = E[f(X)]E[g(Y)] で定義する。標本基底(統計独立なn個の元からなる基底)X1, ..., Xn に関して、E[XiXj] = E[Xi]E[Xj] 。

標本代数の任意の元が代数的統計量。標本代数は、線形結合、環の積、期待値による単位元スカラー倍による生成されるので、これらの演算を組合せて出来た式が統計量と言ってもよい。また、これはモーメントの組合せなので、標本代数=モーメント代数 とも言える。標本代数の元はモーメント量である。

測度的/幾何的に定義される統計汎関数は、分布の空間Dist(V)からWへの関数。特に V = W = R なら、Dist(R)→R

分布の空間と確率変数の代数を相互に置き換えるには、確率変数の代数をL∞-(Ω, μ) とする。「∞-」はテレンス・タオの記号法で、∞-1で無限大から1の意味。すべてのLp空間の共通部分空間として定義する。μは可測空間Ω上の標準確率測度。f∈L∞-(Ω, μ) を密度関数と考えて、L∞-(Ω, μ)→Meas(Ω) として、Ω上の測度の空間に埋め込む。確率測度だけを考えると、L∞-(Ω, μ) の非負正規関数(正規は積部が1)は確率測度と同一視できる。このときの非負正規関数を密度関数と呼び、密度関数と分布を同一視する。

この設定で分布をトレース可換環の部分集合とみなせる。トレース可換環の部分集合である“分布”の上で定義されたR汎関数は代数的な統計汎関数とみなせる。統計汎関数は、トレース可換環全体で定義されていても何ら不都合はない。

典型的な代数的統計汎関数は、トレース自体、つまり期待値である。標本代数の場合は、任意の統計量(可換環の元)の期待値は代数的統計汎関数となる。

… まだ整理が必要だな。