このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

まともな定義がない

Rを入れたはいいが、計算の方法が分からないので、確率統計について調べた。図書館で古い本を見た。なんだかわけわからん説明が多いなー。新しい本でも事情は変わらんだろうと思う。

『はじめての数理統計学』(近代科学社

  • p.81 分散σ^2に絶対値の和を使わない理由が「絶対値の計算は煩雑なので」、なに言ってるんだ? 自乗のほうが大変だろうよ。
  • 標準偏差がで平方根を取るのは、「[分散は]もとのデータと単位が異なる」から。

全く説明になってない。この本に限らず、無作為抽出の説明が酷い。「公平に」「偏りがないように」「乱数を使って」とか。「ランダムに抽出する」と書いてあるのもあるが、同語反復そのものだろう。

大家・竹内啓の『数理統計学』(東洋経済)も、「…が自然な考え方である。」とかの情に訴えるような表現があるし。

「標本」という用語は要注意。「母数」もヤバイ、上記竹内本ではパラメータの意味で使っている。

サンプルが母集団の特徴を備えている、ってのは一体どういうこと? 逆に、偏っていてダメなサンプリングってなに? 「明らかに偏っている」とかごまかさないで欲しい。