どのくらい曖昧か
とある本[1]を調べた。
- 確率: 定義なし、例示のみ。
- 確率変数: 定義なし
- 確率分布: 定義なし
- 分布: 確率分布と同義として導入
- 分布関数: F(x) := P(X ≦ x) として導入、Xは確率変数、xは実数値。
- 密度関数: 分布関数の微分 f := dF/dx として導入。「密度関数が分布関数の微分」というのは多次元で破綻すると思うが。
- 確率関数: f(x) := P(X = x) として導入
P(...) が重要だが、Pの定義はない。Pは確率測度だろうが、確率空間も確率変数も定義がないから、Pを定義しようにも出来ないのだろう。確率変数Xの確率分布と分布関数FXが1:1対応するとの記述あり。これにより、確率分布そのものに代えて分布関数を使う、ということらしい。
確率変数Xに対するFXは、R全域で定義可能で、これをもって「Xの確率分布」に代えるようだ。分布関数ありきだとして、連続、離散、混合の定義は一応意味がある。
- 連続: 分布関数が連続で、たかだか可算個の例外を除いて微分可能
- 離散: X(分布関数ではない)の値の集合がたかだか可算。分布関数を使った言い換えはない。
- 混合: 分布関数がたかだか可算個の例外を除いて連続で、たかだか可算個の例外を除いて微分可能
別な本[2]では、確率質量関数というのが登場して、定義なし。確率質量が確率と同義と注意があるが、だからなんなんだ? 何の説明にもなってない。
さらに別な本[3]では、「離散分布では密度関数はなく、代わりに確率質量関数を使う」とあり。最初の本[1]の「分布関数」のことを「累積分布関数」と呼び、累積分布関数の逆関数を「分位点関数」と呼ぶ、と。累積分布関数が可逆?? そんなの保証されないと思うが。(「数学的に問題がある」とは注意されている。)
定義をせずに事例を出して、用語をどんどん導入していくのが伝統なのか? 分布関数(累積分布関数)をいくら説明しても、確率変数と確率分布が何であるかが分かるとは思えない。実際わからないし。
[追記]「t分布とは、t値が分布したものです」という説明発見。本[2][/追記]
[追記]悪口っぽいから実名を出すのはやめようかと思ったが、「厳密性に拘らない方針で書かれている本だから、イチイチ気にする僕に問題がある」とは断った上で、やはり書名を書くことにする。