このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

2015-06-01から1ヶ月間の記事一覧

不偏統計量

統計量の定義がハッキリしないし、幾つかの定義があるかも知れない。とりあえず、次のように考える。 確率空間と実数値確率変数Xがある。 Xと同分布独立な確率変数列 X1, X2, ..., Xn がある。 X2, ..., Xn は確率標本である。 母集団とは確率標本を伴う確率…

標準化得点

学力テストでしか使わない概念だろう、くらいに思っていた。 標準得点 - Wikipedia z得点: 平均が0、標準偏差(SD)が1になるように変換した得点。得点とは、別にテストの得点に限らずR値変量の観測値ベクトル(サイズnの標本)を座標変換したときの新座標(…

相関係数とか、使い方は大丈夫か?

「2つの変数の相関は?」というとき、2つの変数の値が同じ空間で、定義域(個体識別子の集合)も同じなら、同じベクトル空間内で角度を測るので意味を持つが、身長と体重の相関とか年齢と体力の相関とか、どう考えるのだ? 異なる2つのユークリッドベクトル…

分散、共分散、相関係数などの背景

データフレームで、df[i, ] でi番目の個体(あるいは観測)のタプルが得られる。このタプル(ベクトル変数の具現値)をベクトル空間の要素と見てよいが、df[ , k] もベクトルと見る必要がある。df[ , k]はRのデータ構造としてもベクトルだが、意味的にもベク…

雑多メモ

ともかく色々な言葉がある。イヤになるほど。 因果関係(らしき文脈)のときは、原因系変数と結果系変数 関数の域側変数: 説明変数(explanatory variable)、独立変数(independent variable) 関数の余域側変数: 目的変数(criterion variable)、従属変数(dep…

雑多メモ

主成分分析、因子分析、線形回帰はアフィン空間の部分空間を求める問題のようだ。 大枠は同じだが、動機と目的、何を求めるかは違う。 共分散構造分析(covariance structural analysis)、構造方程式モデリング(structural equation modeling)が、主成分…

思いつき例題

後で確認してみるが、とりあえずメモ。先に、z-w空間内での計算 [P1, P2] = [(z1, w1), (z2, w2)] として、次の方程式を解く。 w2 + t*(w2 - w1) = 0 t = w1/(w1 - w2) s = z1 + (w1/(w1 - w2))*(z2 - z1)話は前後するが、座標変換の行列Tを定義する。 Tの成…

最初の障害とハマリ所

スカラーがない。長さ1のベクトルしかない。 とにかくリテラルがない。ベクトルでさえリテラルで書けない。キツイ。 ミュータブルなオブジェクトがない。S4, R5, R6か? 構造体的データがない。listで代用 行列の折り返し方向が逆(列優先) データフレーム…

長い引数リストの例

stat_bin <- function ( mapping = NULL, data = NULL, geom = "bar", position = "stack", width = 0.9, drop = FALSE, right = FALSE, binwidth = NULL, origin = NULL, breaks = NULL, ... ) { StatBin$new( mapping = mapping, data = data, geom = geom…

パッケージの操作

確認 .Library path.package() search() loadedNamespaces() library() packageVersion(名前) libray(helpe="名前"), help(package="名前") example(名前) vignette(名前) browseVignettes(名前) インストールと更新 istall.packages(名前) install.packages…

独立性

確率変数の定義は確率とは関係ない。確率変数の独立性も可測空間の範囲で定義できるのかと思ったらそうではなかった。確率測度が定義に入り込む。まず2つの事象の独立性は、p(A∩B) = p(A)p(B) という積の公式が成立すること。大きなσ代数に含まれる2つの部分…

grid例

grid.rect(3/4, 5/8, 0.5, 0.25, gp=gpar(fill="pink")) grid.rect(3/4, 7/8, 0.5, 0.25, gp=gpar(fill="skyblue")) grid.grill() grid.lines( c(0.0, 1.0), c(0.5, 0.5)) grid.lines( c(0.5, 0.5), c(0.0, 1.0))

ggplot2の構造、部品機能が使えなくてもったいない

ggplot2の原理と機能性は素晴らしいが、ライブラリの作りとしては「どうなの」な点がある。モジュラー/コンポネント的に作ってあるのだけど、部品を単独で利用したり、部品の処理だけを確認することが出来ない。再利用可能部品もあるのに、隠蔽して閉じ込め…

秘書問題

Wikipediaでは「秘書問題」で紹介されているが、「モーテル問題」とう呼び名が記憶にある。車を運転中に今晩泊まるモーテルを選ぶ問題。出会ったモーテルを見てどれが一番いいかを決める、後戻りは出来ない設定。結婚問題、お見合い問題なんてのもあるのか、…

関数リファレンスのいいかげんさと「...」

ggplot2のlayer関数、以下がすべて。 Create a new layer Description Create a new layer Usage layer(...)他の関数のリファレンスからlayerが参照されている(ブラケットで表記)。layerへのリンクをたどったときのガッカリ感は半端ない。 Usage geom_poin…

関数リファレンスのいいかげんさと謎仕様

こういうの(↓)がけっこう多い。情報量ゼロに近い。Rのgridパッケージの凄まじい座標系 - 檜山正幸のキマイラ飼育記 メモ編 も参照。 Description an ellipse grob Usage ellipseGrob(x, y, size = 1, angle = rep(pi/2, length(x)), ar = 1, gp = gpar(colou…

ESS設定

(setq ess-default-style 'DEFAULT) (ess-toggle-underscore nil) (setq ess-fancy-comments nil)

確率要素

Pを確率測度として、確率要素 dP なんてのが出てきた。なんだこりゃ!?測度を密度と標準測度からの微分形式として表したものらしい。密度関数fに対して、dP = f(x)dx とか。Pはバックエンド確率空間の測度で、f(x)dx はフロントエンド確率空間の標本空間を走…

gridの例

簡易版・ボレルのパラドックスとその解釈:R言語を使って - 檜山正幸のキマイラ飼育記 で使った、gridによる描画。 # target-disk # grid.circle(x=0.5, y=0.5, r=0.5, gp=gpar(fill="skyblue")) grid.circle(x=0.5, y=0.5, r=0.5/3, gp=gpar(fill="red")) #…

検定関数の汎関数

検定を含む決定の理論で、Eθ[φ(X)] なんて式がチョロっと出てくる。 Eは期待値 θはパラメータ空間の点で、Fθが分布関数。あるいは、fθが密度関数と言っても同じ。 Xは確率変数、φは確率変数の値の空間上の関数(条件付き確率の密度関数と解釈)。 (U, ΣU, μθ…

S3, S4, R5, proto

ひどい話だ。 S3 S4 R5 proto typeof(x) 多くは"list" "S4" "S4" "environment" class(x) S3クラス名 S4クラス名 R5クラス名 "proto", "environment" attributes(x) 普通 オブジェクト構造 普通 classだけ names(x) メンバー列挙 NULL NULL NULL ls(x) メン…

ggplot2とproto

ggplot2内でprotoを使っているが、protoの有効範囲はggplot2の名前空間内に閉じ込められているようだ。require(proto)すると事情が違ってくる。protoパッケージをロードしている状態だと、protoオブジェクトxに対して x$class()関数が使えるようになる。仮想…

ggplot2のソースを読んで

ggplotオブジェクト: S3クラスのオブジェクト。実体はリスト。メンバー列挙はnames(p)、メンバアクセスは p$m layerオブジェクト: protoオブジェクト。実体は環境(environment)。メンバー列挙はls(lay)、メンバアクセスは lay$m statオブジェクト: prot…

ggplot2のスケール

プロットオブジェクトのscalesメンバーには、S4オブジェクト(への参照)が入っている。 S4オブジェクトのさらにscalesメンバーがあって、これはリスト。 それとは別にS3システムで書かれたscale_*関数群がある。 かなり混乱している。色々とツギハギな感じ…

ggplot2のソースを読んで

ggplotオブジェクト: S3クラスのオブジェクト。実体はリスト。メンバー列挙はnames(p)、メンバアクセスは p$m layerオブジェクト: protoオブジェクト。実体は環境(environment)。メンバー列挙はls(lay)、メンバアクセスは lay$m statオブジェクト: prot…

gridパッケージ ブータレ

showViewport(), showGrob()がイマイチわからない。戻す方法も分からない。gridTree()は元のウィンドウが消えてしまう。複数のウィンドウがあるとうまくいかないみたいだし。なんか役に立たない。

gridパッケージの用語

シーン(graphical scene):ビューポートとグロブからなるツリー・データ構造 ページ: 描画が実行される物理デバイス。dev.* で制御する。配置されたピクセルの集合。 ビューポート: 入れ子の親子関係を持てる矩形領域。ROOT以外は親ビューポートを持つ。…

統計的推論(推測)と決定の理論

統計的推論(推測)は、命題と論理の話かと思ったがどうも違うらしい。パラメータ空間とパラメータ変数θに対して、θ∈Θ0 という命題が出てくるが、真偽値や論理演算が中心になるわけではない。決定の理論という大きな枠組みのなかで考えるのが普通らしい。決…

bioconductorからのインストール

初めてbioconductorのライブラリをインストールした。 source("http://bioconductor.org/biocLite.R") biocLite("Rgraphviz") これで済む。biocLiteという関数を使うわけだ。簡単だ。入れたパッケージは、Rgraphviz。 http://www.bioconductor.org/packages/…

gridパッケージの例

Rのgridパッケージの凄まじい座標系 - 檜山正幸のキマイラ飼育記 メモ編 のような座標系で: library(grid) # 横幅は半分、高さは8割のビューポートを作って使う vp <- viewport(x=0.5, y=0.5, width=0.5, height=0.8) pushViewport(vp) # ビューポートに枠…