このブログは、旧・はてなダイアリー「檜山正幸のキマイラ飼育記 メモ編」(http://d.hatena.ne.jp/m-hiyama-memo/)のデータを移行・保存したものであり、今後(2019年1月以降)更新の予定はありません。

今後の更新は、新しいブログ http://m-hiyama-memo.hatenablog.com/ で行います。

2014-03-13から1日間の記事一覧

非侵入的パターンと侵入的パターン

新しい用語法によれば、パターンは次のいずれかの形である。 原子パターン(atomic pattern) 原子パターンのOrElse結合 デフォルトで、パターンは非侵入的であるとする。つまり、あるノードにマッチングした場合(成功時)、次のノードは水平順序により決定…

抽出操作

Eが抽出式のとき、extract(a, E) は次のように評価される。 aとEから決まる検索範囲のノードセット(XPathで言う軸)をSとする。Sが空のときもある。 Eから決まるパターンをPとする。 概念的には(実装とは違う)、検索範囲Sをスキャンして配列として結果を…

パターンマッチング

パターンは、ノードaに対してマッチングされ、マッチングが成功すると内容が評価されてパターン全体の値を得る。マッチング失敗のときは、内容の評価に進まず、評価は中止される。説明の便宜上の話であるが、マッチングの失敗を表すためにundefinedを使う。…

概念と用語法

従来(うちわで)使っていた用語法を幾分変える。情報抽出に使う式を抽出式(extract expression)と呼ぶ。次のBNFでパターンを定義する。 原子パターン ::= セレクター 条件式? 内容? 終端子 パターン ::= 原子パターン | '(' 原子パターン ('|' 原子パター…