このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

検定の謎

基本的は発想は、

  • 「極めて起こりにくい事が起きた」という主張は嘘に違いない

だと思う。これはいいのだが、「起こりにくい事」の正確な定義が分からない。

確率変数の値の空間をV、V上の確率密度関数をfとして、棄却域(rejection region)をR(R⊆V)とする。棄却域Rを確率密度fで測った速度を ∫(R, fdx) とする。fdxが測度形式(測度の微分形式風の表示)。

pを定数(危険率)として、∫(R, fdx) < p が棄却域の条件だが、これはRの形によりなんとでもなるので条件としてまともに機能しない。どんな実現値 a∈V が出てきても、Rを適当に選べば ∫(R, fdx) < p と出来る。

このため、「起こりにくいこと」を積分値ではなくて、密度の値そのものから測ることにする。0≦ ε < 1 を決める。密度関数の最大値をMとする。0 ≦ f(x) ≦ M 。棄却域Rを、

  • R = {x∈V | f(x) ≦ εM }

の形に限定して、εに依存するからR(ε)とする。決めた値pに対して、次の条件を考える。

  • ∫(R(ε), fdx) < p

これを条件にすると少しはマシ。

εは小さくなくともいい。一様分布に近いが滑らかな分布(密度関数)を考えれば、ε≒ 1 であっても、pを極端に小さくできる。その意味では、εの大小は判断基準とはならない。棄却域の選択方法に制限を与えるだけだ。

いろいろな分布を考える際には、次のような例に当たるとよさそう。現実性がなくても、思考実験にはなる。

  1. 平均の違う正規分布を足した多峰型の分布
  2. 既存分布の片側を切り落とした分布(ヘビサイド関数を掛け算して規格化)
  3. 既存分布の両側を切り落とした分布(区間のインジケータ関数を掛け算して規格化)
  4. 一様分布に近いが、垂直ではなくてなめらかな分布

現状、片側検定を合理化する理由がまったく思いつかない。


「狭義の論理」として考えての(考えないほうがいいのかも知れない)合理化も出来ない。命題としては、等号を使った命題だけが対象のような気がする。等号の確率は零だから、確率を真偽値と考える解釈はダメだ。棄却域のような部分集合(事象)の確率を問題にしているのだろう。

とはいえ、いくら探しても論理としての定式化がないのを見ると、そもそもが論理とは無縁である可能性がある。どうやっても論理体系とはみなせない、とか。