このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

どのくらい曖昧か

とある本[1]を調べた。

  • 確率: 定義なし、例示のみ。
  • 確率変数: 定義なし
  • 確率分布: 定義なし
  • 分布: 確率分布と同義として導入
  • 分布関数: F(x) := P(X ≦ x) として導入、Xは確率変数、xは実数値。
  • 密度関数: 分布関数の微分 f := dF/dx として導入。「密度関数が分布関数の微分」というのは多次元で破綻すると思うが。
  • 確率関数: f(x) := P(X = x) として導入

P(...) が重要だが、Pの定義はない。Pは確率測度だろうが、確率空間も確率変数も定義がないから、Pを定義しようにも出来ないのだろう。確率変数Xの確率分布と分布関数FXが1:1対応するとの記述あり。これにより、確率分布そのものに代えて分布関数を使う、ということらしい。

確率変数Xに対するFXは、R全域で定義可能で、これをもって「Xの確率分布」に代えるようだ。分布関数ありきだとして、連続、離散、混合の定義は一応意味がある。

  • 連続: 分布関数が連続で、たかだか可算個の例外を除いて微分可能
  • 離散: X(分布関数ではない)の値の集合がたかだか可算。分布関数を使った言い換えはない。
  • 混合: 分布関数がたかだか可算個の例外を除いて連続で、たかだか可算個の例外を除いて微分可能

別な本[2]では、確率質量関数というのが登場して、定義なし。確率質量が確率と同義と注意があるが、だからなんなんだ? 何の説明にもなってない。

さらに別な本[3]では、「離散分布では密度関数はなく、代わりに確率質量関数を使う」とあり。最初の本[1]の「分布関数」のことを「累積分布関数」と呼び、累積分布関数の逆関数を「分位点関数」と呼ぶ、と。累積分布関数が可逆?? そんなの保証されないと思うが。(「数学的に問題がある」とは注意されている。)

定義をせずに事例を出して、用語をどんどん導入していくのが伝統なのか? 分布関数(累積分布関数)をいくら説明しても、確率変数と確率分布が何であるかが分かるとは思えない。実際わからないし。

[追記]「t分布とは、t値が分布したものです」という説明発見。本[2][/追記]

[追記]悪口っぽいから実名を出すのはやめようかと思ったが、「厳密性に拘らない方針で書かれている本だから、イチイチ気にする僕に問題がある」とは断った上で、やはり書名を書くことにする。

  • [1] リスクを知るための確率統計入門 (東京図書)
  • [2] 入門統計学オーム社
  • [3] Rグラフィックス自由自在 (丸善