このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

確率統計

可測空間の分離性と可算性

THE FACTORIZATION OF THE GIRY MONAD KIRK STURTZ https://arxiv.org/pdf/1707.00488.pdf に、可測空間の分離性〈separability〉について書いてある。位相空間のT1分離性と似た話。分離性がないと、ジリィモナドの単位 ηX:X→G(X) が単射になってくれない。…

ジリィモナド

非常に広いジリィスタイル・モナドじゃなくて、ジリィモナド。次の6種がジリィモナド 一般 単位的 劣単位的 Meas MG<∞ MG1 MG≦1 Polish PG<∞ PG1 PG≦1 狭義ジリィモナドは、MG1とPG1の2つ。以下では、次の略記 G := MG<∞ G1 := MG1 用語は次のとおり: 拡散 …

統計的決定論

吉田朋広『数理統計学』は異例に厳密に書かれた良い本だが、それでも、関数結合と汎関数適用がゴッチャになっていたりする。統計的決定論を圏Stoch内で展開するために、少し記法を変える。'→'はStochの射、'→!'はクリスプ(フリスクじゃない)射。 吉田本 こ…

説明、被説明=目的

なんだかもう、呆れるを通り越して凄い気がする。 説明変数=独立変数≒原因 目的変数=被説明変数=従属変数≒結果 関数を因果関係と捉えたいとき(実際はどうであれ)に、こういう言葉を使うのだろう。しかし、独立変数/従属変数を今も使うのかぁ。

決定、推定、学習、最適化、ゲーム

まず、普通の統計用語に関して、 inferenceとesitimateがどちらも推定。inferenceを推計として区別することもあるが、「推計」自体が変な言葉。 estimateとestimatorが一応は区別される。が、一般に統計値と統計量〈statistic〉を区別するわけではない。統計…

フィールド調査 標本調査法

標本調査法の基礎理論 その1 http://www.computer-services.e.u-tokyo.ac.jp/p/itme/dp/dp60.pdf 有意抽出: 街頭で調査者が主観的にねらいをつけた何人かの人にアンケート調査をするなど ← 調査の精度を評価することができないと ← どのような根拠で標本が…

フィールド調査 統計的仮説検定

仮説検定の例題 http://www.math.s.chiba-u.ac.jp/~yasuda/statB/toukei10.pdf 出てくる言葉・言い方 正規母集団 N(μ, σ2) において (実際は、パラメータ表示された正規分布のことだ) 分散 σ2 = 152 = 225 は既知 (非常にフィクショナルだが、まー、そい…

確率測度の空間の上の距離

ポンペイウ/ハウスドルフ距離は別物だが、ついでに入れておく。 PH: ポンペイウ/ハウスドルフ距離〈Pompeiu–Hausdorff distance〉 H: ハッチンソン距離〈Hutchinson metric〉 → https://en.wikipedia.org/wiki/Hutchinson_metric W: ワッサースタイン距離…

Prof. Boris Tsirelson の「確率変数」

良心的な人だ。http://www.tau.ac.il/~tsirel/Courses/MeasContin/lect2.pdf より引用: A remark on terminology. Some authors call a measurable map φ from a probability space to a measurable space (Y, B) “random element of Y ” with special case…

三項スカラー積と双対性

X, Yは位相可測空間で、φ:X→Y は連続写像、μがX上の測度、fはX上の関数、gはY上の関数とする。 二項スカラー積 <f|μ>X は、測度μによる関数fのX上の積分 二項スカラー積 <A|f|μ>X は、測度μによる関数fのA上の積分(A⊆X) まず二項の場合の双対性は: <φ*(g)|μ>X = <g|φ*(μ)>Y 積</g|φ*(μ)></a|f|μ></f|μ>…

ポーランド空間の意義

どうもポーランド空間すごい、感じがしてきた。標準ボレル空間とは、可測空間のことで、ポーランド空間のボレル集合と可測空間として同型になるものをいう。おそらく、可測空間がボレル空間だとは、位相から作ったボレル族と可測空間として同型な可測空間の…

分布と拡散

分布から拡散へ: ミシェル・ジリィを巡って - 檜山正幸のキマイラ飼育記 で参照したが、 YouTube 他に、黒いインク HD Ink Drop in water 'Black60FPS_005' - Free Stock Footage - YouTube エアブラシ Airbrush Anleitung für Anfänger - How To airbrush …

統計多様体

情報幾何の統計多様体と、多様体論の統計多様体は別物と思ったほうがいいようだ。 情報幾何の統計多様体: パラメータ空間Θから確率分布の空間へのなめらかな写像。確率分布の空間における“なめらかさ”はうまく定義する必要がある。あくまで写像で、像である…

最適化する関数/入力データ

評価の目安にする関数 目的関数 損失関数(たぐん利得関数もある) 精算〈payoff〉関数 コスト関数 効用〈utility〉関数 誤差成分 解を検索する空間、出力(解)が入る空間 検索空間 推測空間 モデル空間 仮説空間 入力 訓練データ 標本データ 計画データと…

フィールド調査 codereading.com

https://www.codereading.com/statistics/statistic.html ナンバーズ予想で学ぶ統計学 上記ページからコピー 統計量とはデータの特徴を表す値のことです。 合計 数値を合わせまとめた値。 最小 最も小さな値。 最大 最も大きな値。 平均/算術平均/相加平均…

フィールド調査 Wikipedia

要約統計量(ようやくとうけいりょう)とは、標本の分布の特徴を代表的に(要約して)表す統計学上の値であり、統計量の一種。記述統計量(英: descriptive statistics value)、基本統計量、代表値(英: representative value)ともいう 事前に必要な定義: 標…

フィールド調査 早稲田大学

ダメ出しのフィールド調査: http://www.aoni.waseda.jp/abek/document/spread_sheet_mean.html 上のURLのページからコピー: 母集団:分析が対象とするすべてのデータ.例えば,早稲田大学の学生全員. 標本:母集団からの一部のデータ.例えば,今日,教室…

パラメトリックモデルと条件付き確率

条件付き確率を P(A|B) と書く。これは、Bが起こった前提でのAの確率で、 P(A|B) = P(A∩B)/P(B) この定義は何の不思議もない。だが、pを確率モデル〈統計モデル〉として、条件付き確率 p(x|θ) を使うことがある。 pはパラメトリックモデル xはデータ(または…

改善案:ほとんど雰囲気だけかも

Mが標準測度付き位相測度空間の圏で、射は可測写像とする(連続写像ではない!)。Pをなめらかな多様体となめらかな写像の圏で、標準的な位相となんらかの標準測度によりMに埋め込まれているとする。M上のジリィ・モナドのクライスリ圏をStochとする。Mの対…

改善案:ベイズのとき

改善案:パラメトリック統計モデル - 檜山正幸のキマイラ飼育記 メモ編は、ベイジアンのときもだいたい使える。Modelがプロ関手であったのと同様に、BayesModelもプロ関手として定義できる。Pはパラメータ領域の圏とする。ただし、今度は P⊆M と考える。Mは…

改善案:パラメトリック統計モデル

Mを次のような圏とする。 Mはハウスドルフ位相空間の圏への構造忘却関手を持つ。 Mは可測空間の圏への構造忘却関手を持つ。 Mの対象のσ代数は、その位相のボレル集合族である。 Mの対象には、標準測度と呼ばれる測度が載っている。標準測度は、有界〈有限〉…

改善案

多少はマシな用語法 - 檜山正幸のキマイラ飼育記 メモ編とかの延長線上の記事。 写像=関数 (同義語) 集合:=可測空間 (設定) 写像:=可測写像 (設定) つまり、単に集合といって可測空間を意味し、単に写像/関数といってもそれは可測写像/可測関数を意…

推定量、統計量関係の定義もどき

https://bellcurve.jp/statistics/glossary/1061.html より [不偏推定量の定義] 標本から測定した推定量の期待値が母集団のそれに等しいとき、その推定量を不偏推定量と言う。 必要な定義: 標本 (標本から)測定する (測定した)推定量 推定量の期待値 母…

調査フィールド

https://ja.wikipedia.org/ や http://toukeigaku-jouhou.info/ 以外に、実例として http://www2.kokugakuin.ac.jp/~ogiso/spss/staterm.html もいい。より実務よりの定義がある。 質的な独立変数を要因、量的な独立変数を共変量と呼ぶ。 必要な定義 質的 量…

尺度の圏とプロ関手と母集団

「「確率変数」の変種:測度に縛られない確率変数 - 檜山正幸のキマイラ飼育記」と「尺度の圏論 - 檜山正幸のキマイラ飼育記 メモ編」で似たことが書いてある。共通の構造を抜き出してみる。確率モデル〈統計モデル〉に尺度の圏を組み入れるって話。まず、「…

ダメ出しのまとめ リンク集

用語ごとのリンク集: 母数: まともな定義がない - 檜山正幸のキマイラ飼育記 メモ編 母数 - 檜山正幸のキマイラ飼育記 メモ編 やっぱり用語記号が分からない - 檜山正幸のキマイラ飼育記 メモ編 定数と汎関数とパラメータ(母数) - 檜山正幸のキマイラ飼育…

ダメ出しの総括

ほぼワースト順 確率変数 分布、分布する 従う 母集団 試行、試行する サンプリング〈標本調査〉する 離散(形容詞) 例文(例文はもっと欲しい) xを確率変数として、xの関数f(x)をxにより積分すると、f(x)の期待値が得られる。 t値とは、t分布に従って分布…

独立性の概念とグリーフ

コンポジトリとグリーフの論文 Title: Compositories and Gleaves (2013v1 - 2016v3) Authors: Cecilia Flori, Tobias Fritz Pages: 54p URL: https://arxiv.org/abs/1308.6548 このなかに独立性や条件付き確率に関する例がある。そこから参照されているのが…

空間と言語、惨劇は続く

続き。 https://lirias.kuleuven.be/bitstream/123456789/298291/1/hyp-space.pdf"Hypothesis space" by Hendrik Blockeel によると、観測言語〈observation language〉、仮説言語〈hypothesis language〉、バイアス記述言語〈bias specification language〉…

仮説空間とかナニヤラカニヤラ

機械学習が台頭してきて、またさらにジャーゴンが増える。分野が増える/成長すれば、用語法はどんどん錯綜・混乱するという嫌な現象。仮説空間〈hypothesis space〉に関しては次を参照した。 https://lirias.kuleuven.be/bitstream/123456789/298291/1/hyp-…