2014-03-13から1日間の記事一覧
新しい用語法によれば、パターンは次のいずれかの形である。 原子パターン(atomic pattern) 原子パターンのOrElse結合 デフォルトで、パターンは非侵入的であるとする。つまり、あるノードにマッチングした場合(成功時)、次のノードは水平順序により決定…
Eが抽出式のとき、extract(a, E) は次のように評価される。 aとEから決まる検索範囲のノードセット(XPathで言う軸)をSとする。Sが空のときもある。 Eから決まるパターンをPとする。 概念的には(実装とは違う)、検索範囲Sをスキャンして配列として結果を…
パターンは、ノードaに対してマッチングされ、マッチングが成功すると内容が評価されてパターン全体の値を得る。マッチング失敗のときは、内容の評価に進まず、評価は中止される。説明の便宜上の話であるが、マッチングの失敗を表すためにundefinedを使う。…
従来(うちわで)使っていた用語法を幾分変える。情報抽出に使う式を抽出式(extract expression)と呼ぶ。次のBNFでパターンを定義する。 原子パターン ::= セレクター 条件式? 内容? 終端子 パターン ::= 原子パターン | '(' 原子パターン ('|' 原子パター…