検定の謎
基本的は発想は、
- 「極めて起こりにくい事が起きた」という主張は嘘に違いない
だと思う。これはいいのだが、「起こりにくい事」の正確な定義が分からない。
確率変数の値の空間をV、V上の確率密度関数をfとして、棄却域(rejection region)をR(R⊆V)とする。棄却域Rを確率密度fで測った速度を ∫(R, fdx) とする。fdxが測度形式(測度の微分形式風の表示)。
pを定数(危険率)として、∫(R, fdx) < p が棄却域の条件だが、これはRの形によりなんとでもなるので条件としてまともに機能しない。どんな実現値 a∈V が出てきても、Rを適当に選べば ∫(R, fdx) < p と出来る。
このため、「起こりにくいこと」を積分値ではなくて、密度の値そのものから測ることにする。0≦ ε < 1 を決める。密度関数の最大値をMとする。0 ≦ f(x) ≦ M 。棄却域Rを、
- R = {x∈V | f(x) ≦ εM }
の形に限定して、εに依存するからR(ε)とする。決めた値pに対して、次の条件を考える。
- ∫(R(ε), fdx) < p
これを条件にすると少しはマシ。
εは小さくなくともいい。一様分布に近いが滑らかな分布(密度関数)を考えれば、ε≒ 1 であっても、pを極端に小さくできる。その意味では、εの大小は判断基準とはならない。棄却域の選択方法に制限を与えるだけだ。
いろいろな分布を考える際には、次のような例に当たるとよさそう。現実性がなくても、思考実験にはなる。
- 平均の違う正規分布を足した多峰型の分布
- 既存分布の片側を切り落とした分布(ヘビサイド関数を掛け算して規格化)
- 既存分布の両側を切り落とした分布(区間のインジケータ関数を掛け算して規格化)
- 一様分布に近いが、垂直ではなくてなめらかな分布
現状、片側検定を合理化する理由がまったく思いつかない。
「狭義の論理」として考えての(考えないほうがいいのかも知れない)合理化も出来ない。命題としては、等号を使った命題だけが対象のような気がする。等号の確率は零だから、確率を真偽値と考える解釈はダメだ。棄却域のような部分集合(事象)の確率を問題にしているのだろう。
とはいえ、いくら探しても論理としての定式化がないのを見ると、そもそもが論理とは無縁である可能性がある。どうやっても論理体系とはみなせない、とか。