まともな定義がない
Rを入れたはいいが、計算の方法が分からないので、確率統計について調べた。図書館で古い本を見た。なんだかわけわからん説明が多いなー。新しい本でも事情は変わらんだろうと思う。
- p.81 分散σ^2に絶対値の和を使わない理由が「絶対値の計算は煩雑なので」、なに言ってるんだ? 自乗のほうが大変だろうよ。
- 標準偏差がで平方根を取るのは、「[分散は]もとのデータと単位が異なる」から。
全く説明になってない。この本に限らず、無作為抽出の説明が酷い。「公平に」「偏りがないように」「乱数を使って」とか。「ランダムに抽出する」と書いてあるのもあるが、同語反復そのものだろう。
大家・竹内啓の『数理統計学』(東洋経済)も、「…が自然な考え方である。」とかの情に訴えるような表現があるし。
「標本」という用語は要注意。「母数」もヤバイ、上記竹内本ではパラメータの意味で使っている。
サンプルが母集団の特徴を備えている、ってのは一体どういうこと? 逆に、偏っていてダメなサンプリングってなに? 「明らかに偏っている」とかごまかさないで欲しい。