このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

フィールド調査 早稲田大学

ダメ出しのフィールド調査:

上のURLのページからコピー:

  • 母集団:分析が対象とするすべてのデータ.例えば,早稲田大学の学生全員.
  • 標本:母集団からの一部のデータ.例えば,今日,教室にいる早大生諸君.
  • 記述統計:統計の手法のひとつ。収集したデータの特徴を、平均や標準偏差などから求める手法のこと。(ASCII.jpデジタル用語辞典より)
  • 推測統計:収集した全データの性質を、サンプルデータをもとに推測する方法のこと。推測統計の種類には、推定と仮説検定がある。推定は、サンプルデータ(標本)から、母集団の性質を表す値を求める方法。仮説検定は、データの母集団の性質が、仮定した性質と一致するかどうか調べることで収集したすべてのデータの性質を判断する方法。(ASCII.jpデジタル用語辞典より.一部加筆)
  • 標本数:データの数.よく,Nで表す.
  • 最小値:データの中の最も小さな値.Excelでデータの最小値を求める関数名はmin.
  • 最大値:データの中で最も大きな値.Excelでデータの最大値を求める関数名はmax.
  • 範囲:データの取る範囲.
  • small:小さい方からの任意の順位を取る値を求める関数名.引数は(範囲,N)となる.Nは順位.したがって,small(範囲,1)=min
  • large:大きい方からの任意の順位を取る値を求める関数名.引数は(範囲,N)となる.Nは順位.したがって,large(範囲,1)=max
  • 分布:データの散らばり,集まり具合を示す.連続型と離散型がある.
  • 連続型分布
    • 一様分布:0から1の間の実数値を取る分布.乱数を作るときによく使う.
    • 正規分布:自然や社会の中に観察される多くの事象に当てはまる(と言われる)分布.左右対称,単峰の釣鐘状の形状をしている.特に平均0,分散1の正規分布を標準正規分布と呼ぶ.
    • 指数分布:製品などの寿命,耐用年数,災害が発生するまでの期間によく見られる分布
    • カイ二乗分布:標本分散に関する分布.実現値と期待値(理論値)との誤差の検定に用いられる.
    • t分布:標本数が少ない場合に正規分布の代わりに用いる分布.
    • F分布:2つの母集団の分散比に関する分布
  • 離散型分布
    • ベルヌーイ分布:とりうる結果が2つしかないものの分布.(例)合格/不合格とか.
    • 二項分布:ベルヌーイ試行を複数回実施した際の分布.
    • ポアソン分布:二項分布において,1回あたりの確率が小さく,試行回数が多い場合の分布.(例)あるエリアでの事故件数

事前に必要な定義:

  • データ
  • 一部のデータ
  • データの特徴
  • データの性質
  • サンプルデータ
  • データの数