「正規（regular）」とは何なんだ 2
正規構造

檜山正幸 (HIYAMA Masayuki)

Wed Apr 13 2005:start
Wed Apr 20 2005:draft

正規表現と正規言語の対応関係を拡張／一般化するために、正規構造という構文／意味システムを導入する。正規構造とは、基本的な代数系（ただし、特に法則を要求しない）をベースに、最小不動点を意味する項を導入して代数系を拡張するメカニズムの定式化である。

1. はじめに
2. 正規構造の概要
3. 正規表現の復習
4. 正規表現から正規言語へ
5. Kleene代数
6. 数系の拡大との対比
7. Kleene構造構文パート
8. Kleene構造意味パート
9. 正規構造へのシナリオ
10. 平方根って、どうやって導入したっけ？
11. 算術テンプレート
12. 算術テンプレートの使い方
13. 実例と注意
14. 再帰テンプレートと正規構造（構文パート）
15. 正規構造（意味パート）
16. XMLの事例

1. はじめに

この記事では、正規性（regularity）概念を一般的に定式化する1つの試みを示す。同じ話題について、既に記事「『正規（regular）』とは何なんだ」で論じている。記事「『正規（regular）』とは何なんだ」では、「正規性とは、再帰代入系で定義される」ことを一応の結論としている。が、本記事では、正規性の別の定式化を提示する。

この記事で採用する道具立て／枠組みは正規構造（regular structure）と呼ぶことにする。正規構造は正規代数（regular algebra）の変種であり、正規表現と正規言語の対応をストレートに一般化することを狙っている。正規構造と再帰代入系は最終的には統合されるべきものだが、複数の入り口を作っておくことは（おそらく）無駄ではないだろう。

この記事の最初のほうで、列言語に対する正規表現とその解釈（正規表現の意味論）を復習する。それから、「正規表現⇔正規言語」対応のエッセンシャルな部分を抽出し、一般化することにより正規構造を導入する。また、正規構造で採用しているアプローチが伝統的な手法であることを指摘するために、（記事の何カ所かで）数系の拡大との対比も行う。

参考文献として、形式言語理論の教科書は、いつものとおり（「形式言語理論への疑問など」の第2節も参照）次の2冊を挙げておく。

[守屋] 守屋悦郎『形式言語とオートマトン』（サイエンス社, 2001）
[有川] 有川節夫（監修）、西野哲朗、石坂裕毅『形式言語の理論』（丸善, 1999）

正規代数（正則代数）については、次が代表的な文献のようだ。

[Bidoit&Tarlecki] Michel Bidoit, Andrzej Tarlecki "Regular Algebras -- A Framework for Observational Specifications with Recursive Definitions" (1995)

2. 正規構造の概要

列言語における正規性の概念は、非常にシッカリとした自然な（とても人為的とは思えない）ものである。正規表現、線形文法、オートマトン、Kleene代数など、さまざまな定式化により正規性を定義できる。

しかし、記事「『正規（regular）』とは何なんだ」の第5節でも述べたように、列言語のときは、どうも話がうまく行き過ぎている。列以外のデータ構造に対して、このような万全の整合性／精緻性を望むのは虫が良すぎる、というのが僕の印象だ。

記事「『正規（regular）』とは何なんだ」では、一般的な正規性を定義する手段として再帰代入系（「再帰代入系 1」、「再帰代入系 2」参照）を想定している。再帰代入系は、モジュール化された（modularized）BNF規則とも言える系で、（強いて言えばだが）線形文法による正規性の定義を一般化したようなものである。有限から無限を生み出すメカニズムは再帰部（再帰方程式、不動点方程式）が担う。正規表現やKleene代数におけるスター演算子のようなものはない（より正確に言えば、いつでもあるとは限らない）し、スッキリとした代数構造も期待してない。

それに対して、再帰構造はより代数的である（スッキリとはしてないが）。有限から無限を生み出す演算、つまりKleeneスターの一般化は必要なら明示的に導入する。新しい演算を導入して、それによって代数系を拡張するという方法を採用するわけだ。おおざっぱに言えば、再帰構造とは、基礎となる演算を備えた代数系を、再帰方程式により定義される演算を付け加えて拡大したものである。

3. 正規表現の復習

記事「属性のための正規表現」の第1節で述べたように、正規表現にはいくつかの変種がある。ここでは、構文的演算子として、「,」「|」「*」の3つを採用し、他に定数EMPTYを使う。

以下で使う記法は次の表にまとめてある。また、必要があれば、記事「『正規（regular）』とは何なんだ」の第2節や、そこから参照されている関連記事（の当該部分）を読むとよいだろう。

TABLE: 正規表現に関係する記法

慣例的記号	関数名/引数個数	理論的な記法	言語（集合）における概念
,	concat/2	・	連接
｜	choice/2	+	合併
*	repeat/1	*	Kleeneスター
EMPTY	empty/0	1	空列からなる単元言語

列言語の‘正規表現’（regular expression）を正式に定義しておこう。正規表現の帰納的（inductive）な定義は、「順序言語」の第5節にあるが、ここでも繰り返しておく。Σはアルファベット（与えられた基本記号の集合）とする。

定数記号EMPTYは正規表現である。
Σのメンバーは正規表現である。
r, sが正規表現のとき、(r,s)は正規表現である。
r, sが正規表現のとき、(r | s)は正規表現である。
rが正規表現のとき、r*は正規表現である。
以上の手順で得られるものだけが正規表現である。

記事「順序言語」では、EMPTYを「1」で表しており、連接に「;」を使っている。また、記事「順序言語」では空集合を表す定数「0」も入っているが、とりあえずなくても不便はないので、ここでは入れてない^(*注1)。

注1

結局、後で必要になってコソッと入れたりしているのだけどね。

上の正規表現の定義は、慣例的記号「,」「|」「*」を使って述べたが、対応する関数記法を使えば、次のような定義となる。

Σのメンバーは正規表現である。
emptyは正規表現である。
r, sが正規表現のとき、concat(r, s)とchoice(r, s)は正規表現である。
以上の手順で得られるものだけが正規表現である。

この定義と、記事「『形式的』とは何だろう」第4節の“項の定義”を比べてみてほしい。帰納的な定義方法はまったく同じである。つまり、正規表現とは、形式的体系（formal system）における項（term）の特殊事例なのである。

形式的体系の項については、記事「再帰代入系 1」の第4節で述べているが、同じ事を繰り返えせば：変数記号全体の集合Kと、関数記号の集合達F₀, F₁, F₂, ... （F_iは引数の個数がiの関数記号）が与えられたとき、‘項’（term）は次のように帰納的に定義される。

変数（記号）は項である。つまり、t∈Kならば、tは項である。
定数（記号）は項である。つまり、t∈F₀ならば、tは項である。
t₁, t₂, ..., t_n がn個（n≧1）の項で、a∈F_nのとき、a(t₁, t₂, ..., t_n)は項である。
以上の手順で得られるものだけが項である。

上の定義で得られる項の全体をTerm_F(K)と書く。変数をX（X⊆K）に限定した項の全体はTerm_F(X)と書く。Fが周知ならTerm_F(X)をTerm(X)とも書き、 Fを強調したいならTerm_F(X)をTerm(F, X)とかTerm(F)(X)と書くこともある ^(*注2)。

注2

一般的に、2変数のナニカf(x, y)があるとき、xはとりあえず止めて（固定して）、yの変動を考えたいときに f_a(y)のような書き方をする。また、xに対する値f(x)が関数（fは関数値の関数）になっていて、その関数に変数yを入れた形がf(x)(y)となる。f(x, y)をf(x)(y)の形にすることはカリー化と呼ぶ。カリー（Curry）は人名（1900-1982）、ちなみにCurryのファーストネームはHaskell。

4. 正規表現から正規言語へ

ここでは、正規表現の直接的な“意味”として正規言語を定義しよう。

Σのメンバーから構成される列の全体をSeq(Σ)とする。通常、 Σ上の正規表現は、Σ上の言語（つまり、Seq(Σ)の部分集合）として解釈される。これについては、記事「『正規（regular）』とは何なんだ」のノート「正規表現の標準的解釈」に記している。

標準的解釈においては、Σのメンバーaの意味は{"a"}という単元言語である。だが、Σのメンバーに自由に意味を与えてもよい。例えば、「順序言語」の第5節では、Σのメンバーa の意味は、[a]↓によって示される下方閉な集合である。一方、記事「属性のための正規表現」の第7節では、Σ のメンバーaの意味は、適当な集合の集合 B(a)∈Pow(Pow(X))としている。

NOTE:

記事により記号法がマチマチだな。a∈Σに対する長さ1の列が"a"だったり [a]だったり、連接が「,」だったり「;」だったり。そのうち整理したいとも思うが、この程度のゆれ／食い違いはしかたのないことかも知れない。

一般的には、Σ上の正規表現は、Σとは異なるかもしれないアルファベット Π上の言語として解釈してよい。以下に、そのような解釈の定義を記す。正規表現rの意味をM(r)とする。先に示した正規表現の帰納的定義に従ってM(r)を定義する^(*注3)。

M(EMPTY) = {ε} （εは空列）
a∈Σとして、M(a)はSeq(Π）の適当な部分集合。（aごとに自由に割り当ててよい）
M((r,s)) = M(r)・M(s)
M((r | s)) = M(r)∪M(s)
M(r*) = M(r)^* （ただし、A^* = {ε}∪A∪A²∪A³ ...）

注3

この記事の後のほうでは、丸括弧の入れ子を嫌ってM[r]としている。

この定義では、「M(a)はaごとに自由に割り当ててよい」となっている。つまり、ΣからPow(Seq(Π))への写像（a∈Σに、Seq(Π）の部分集合を割り当てる対応）を、前もって勝手に決めておいてよいことになる。いま、Σ→ Pow(Seq(Π)) の写像をvとして、これを‘付値’（valuation）と呼ぶ^(*注4)。付値vを与えれば、意味写像Mは自動的に決まってしまう。念のため、vから決まるMの定義を繰り返しておけば：

M(EMPTY) = {ε}
M(a) = v(a) （v(a)⊆Seq(Π)）
M((r,s)) = M(r)・M(s)
M((r | s)) = M(r)∪M(s)
M(r*) = M(r)^*

注4

付値は、環境（environment）とか文脈（context）と呼ばれることもある。

正規表現と付値vにより、アルファベットΠ上の（vにより決まる）‘正規言語’を定義することができる。

{ε}は正規言語である^(*注5)。
a∈Σに対するv(a)（v(a)⊆Seq(Π)）は正規言語である。
A、Bが正規言語なら、A・Bも正規言語である。
A、Bが正規言語なら、A∪Bも正規言語である。
Aが正規言語なら、A^*も正規言語である。
以上の手順で得られるものだけが正規言語である^(*注6)。

注5

通常、空言語{}も正規言語に含める。

注6

この条項はしばしば省略されるが、必要なものである。後で出てくるKleene代数の言葉を用いれば、正規表現の全体は、v(a)達を含む最小の部分Kleene代数である。その最小性を主張しているのが、この条項である。

付値vによりv(a)の形に書ける言語の全体は、{v(a) : a∈Σ}という言語族とみなせる。付値と無関係に、単に言語族{B_i : i∈I}が与えられた場合でも、 {B_i : i∈I}に相対的に正規言語を定義できる。

{ε}は正規言語である。
Bが言語族{B_i : i∈I}に属するなら（つまり、あるk∈Iに対して B = B_kなら）、Bは正規言語である。
A、Bが正規言語なら、A・Bも正規言語である。
A、Bが正規言語なら、A∪Bも正規言語である。
Aが正規言語なら、A^*も正規言語である。
以上の手順で得られるものだけが正規言語である。

5. Kleene代数

この節でKleene代数に関して急ぎ足でまとめる。代数的な内容であるから、あまり詳細は気にしないで、ザッと目を通したら次節に移ったほうがよい。

今までの流れを振り返れば、正規表現を解釈するためには、定数EMPTYに対応する特定対象と、3つの演算記号「・」、「∪」、「*」に対応する（ホントの）演算を備えているような代数系^(*注7)があればよいことがわかる。「・」、「∪」、「*」が言語の連接、合併、Kleeneスターを意味する必要はない。

注7

代数系／代数構造の正式な定義は後で与える。

一般に、正規表現を解釈できるような代数系を‘Kleene代数’と呼ぶ。 Kleene代数とは、次のような条件を満たす構造を備えた集合Kである^(*注8)。

特別なメンバーe∈K が指定されている。（eは、混乱の心配がなければ1とも書く。）
2項演算+, ・, * が定義されている。（x・yの・を省略して xyとも書く。）
+は可換、ベキ等、結合的な演算である。
・は、結合的な演算である。
1（eの別表記）は、・の単位元である。
・は+に対して左右分配的である。
*は後で示す等式を満たす。

注8

アッ、記号Kは、変数集合の全体を表すのに使っていた。文字Kを選んだ理由が「他の目的で使う予定がないから」だったが、Kleene代数ならKを使いたいよね、やっぱり。文字Kが何を表すかは文脈で判断してください。

演算*以外に関する規則を等式で書き下せば次のとおり（ただし、・は省略した書き方をする）。

(a + b) + c = a + (b + c)
a + b = b + a
a + a = a
(ab)c = a(bc)
1a = a1 = a
a(b + c) = ab + ac
(a + b)c = ac + bc

通常は、0∈Kの存在と 0 + a = a + 0 = a も仮定する。（0は＋の単位元だが、それより、順序に関する最小元として必要とされることがある。）

Kleene代数において、a≦bをa + b = b のことだとして定義すると、次が成立する^(*注9)。

a≦a
a≦b、b≦c ならば a≦c
a≦b、b≦a ならば a = b

注9

可換、ベキ等、結合的な演算+が定義されていれば、a≦b ⇔ a + b = b という定義は有効である。

さて、演算*は、次の等式群を満たすとする。

1 + aa^* = a^*
1 + a^*a= a^*
ab≦b ならば a^*b ≦ b
ba≦b ならば ba^* ≦ b

以上がKleene代数の定義（公理群）である。

通常の列言語の全体Pow(Seq(Σ))はもちろんKleene代数だが、記事「順序言語」に出現した、下方閉集合の全体Pow_LC(Seq(Σ))もKleene代数になる。記事「属性のための正規表現」に出現した、集合言語の全体Pow(Pow(Σ))もまたKleene代数である。だから、Pow_LC(Seq(Σ))もPow(Pow(Σ))も正規表現の解釈の場となったのである。

KがKleene代数のとき、L⊆Kが、1, 0∈Lであり、しかも+、・、*で閉じていれば、Kの‘部分Kleene代数’という。特に、任意のS⊆Kに対してSを含む最小の部分Kleene代数が存在する。これは、（Kにおいて）‘Sから生成された部分 Kleene代数’と呼ぶ。言語族{B_i : i∈I}に対して定義された相対的正規言語の全体は、実はPow(Seq(Σ))において{B_i : i∈I}から生成された部分Kleene代数である。

/* ここから書き足した部分 */

6. 数系の拡大との対比

Kleene代数には、3つの演算（演算“記号”ではない）が備わっているが、スター演算*は忘れて、足し算+と掛け算・だけを見てみよう。足し算+と掛け算・が満たす法則を再び述べてみる。

・足し算

(a + b) + c = a + (b + c)
a + b = b + a
a + a = a

・掛け算

(ab)c = a(bc)
1a = a1 = a

・両者の関係

a(b + c) = ab + ac
(a + b)c = ac + bc

掛け算の可換性（ab = ba）が仮定されていない点と、足し算に関する「a + a = a」（ベキ等律という）は異質だが、それ以外は、小学校で習った算数と変わりはない。つまり、足し算+と掛け算・を考えている限りは、初等代数的あるいは算術的なレベルにとどまり、再帰性や無限性が入り込む余地がない。

Kleene代数の自明でない特徴はスター演算*に集約されている。では、a∈Kに対するa^*は一体何なのかというと、方程式 x = 1 + ax の解である。実際、 xにa^* を代入した形 a^* = 1 + aa^* はKleene代数の公理の一部である。

ただし、x = 1 + ax の解は存在しても一意的とは限らない。となると、a^* を「x = 1 + ax の解」として一意的に特徴付けることができなくなる。しかし実際には、「x = 1 + ax の最小解」であることが、残りの公理（ab≦b ならば a^*b ≦ b、ba≦b ならば ba^* ≦ b）から保証される。このことについては、文献[守屋]の2.5.3節に少し一般化された次の形で証明されている。

Kleene代数において、a^*bは方程式 x = b + ax の最小解である。

つまり、Kleene代数は、足し算+と掛け算・を備えた初等的代数系に対して、方程式 x = 1 + ax の最小解としてa^* を付け加えたものだといえる。

このように、既存の代数系に方程式の解を付け加えることは、歴史的にも教育課程でも頻繁に延々と繰り返された手法である。たとえば、ゼロの導入では、任意のaに対して方程式 x + a = a を満たすようなx、つまりこの方程式の解としてゼロが定義された。さらに方程式 x + a = 0 の解として-aが導入される。平方根や虚数の導入、それに伴う数系の拡大も事情は同じである。このことは、第10、11, 12節でもっと詳しく述べる。

NOTE: Kleeneスターの級数表示

Kleeneスターa^*は、方程式 x = 1 + ax の最小解なのだが、通常 1 + a + a² + ... という無限級数の表示を持つ。これは次のような事情である。

まず、x = 0 が解になっているかどうかを見ると、0 = 1 が成立していれば OKだが、それ以外なら0は解ではない。そこで次に、1 + axのxに0を代入した値1を解の候補と考える。 1 = 1 + a が成立していればOKだが、一般にはそうではない。では、1 + a1 = 1 + a ではどうか？ 1 + a = 1 + a(1 + a) が成立していればよいが…… この繰り返しは、 x₀ = 0 （0は最小値）から初めて、x_n+1 = 1 + ax_n という系列を順次作っていることになる。

このような手順で、0, 1, 1 + a, 1 + a + a² のような近似系列を作れる。これが実際の解に収束することは別に合理化する必要があるが、適当な条件下では、この近似系列の極限が実際の解を与えることが示せる（各種の不動点定理）。これを根拠に、 a^* = 1 + a + a² + ... に意味を持たせることができる。

方程式の解を数系に付け加えることにより、“本来存在するはずのなかった数”を既存の数系に組み入れることができる。そのような仮想的な対象（新しい数）も含めることにより、より計算が楽になり、より豊かな記述能力を手に入れてきたわけだ。

後で定義する正規構造は、Kleene代数の概念のなかで、「基底となる初等的代数に、方程式（再帰方程式、不動点方程式）の最小解を付け加える」という構成法に注目した一般化である。

7. Kleene構造構文パート

一般の正規構造を定義する前に、Kleene代数の条件を弱めた‘Kleene構造’ からはじめよう。Kleene構造は正規構造の特別な事例となっている。

Kleene代数を定義するときに使った定数と演算記号を再び採用する。ただし、以下では関数記法を用いることにして、F₀ = {empty}、F₁ = {repeat}、 F₂ = {concat, choice}、その他のF_i = {} とする。

さらに集合Σを適当に選んでTerm_F(Σ)を考える。Σはアルファベットだが、（定数として使うのではなくて）項を構成する変数集合として使う。‘正規項’ （regular term）という概念によりTerm_F(Σ)を拡張する。正規項は正規表現の形式化されたバージョンである。正規項の帰納的定義は次のとおり。ただし、zはΣには含まれない記号だとする。

t∈Term_F(Σ)ならtは正規項である。つまり、通常の項は正規項である。
tが正規項であるとき、μz.[choice(empty, concat(t, z))]という表現は正規項である。
t, t₁, ..., t_nが正規項、a₁, ..., a_nがΣのメンバーであるとき、t[t₁/a₁, ..., t_n/a_n]は正規項である。ここで、[t₁/a₁, ..., t_n/a_n]は置き換えである。
以上の手順で得られるものだけが正規項である。

μz.[choice(empty, concat(t, z))]の形の正規項を‘μ（ミュー）正規項’ （mu regular term）、または単に‘μ（ミュー）項’と呼ぶ。 μz.[choice(empty, concat(t, z))]と書くと複雑そうだが、もっと簡略に書けばμz.[1 + tz]である。

μ項に出現する変数記号zは（μオペレータの）‘束縛変数’と呼ぶが、Σのメンバーでなければどんな記号でもよい。また、束縛変数は必ず1つ出現するだけでまぎれる心配はまったくないから、μの直後のzは書かずに μ[choice(empty, concat(t, z))]でもよい。μ[choice(empty, concat(t, z))]のなかで変動するのはtだけだから、さらにμ(t) のように略記してしまってもさしつかえない。

略記μ(t)を採用して正規項を定義してもよい。ただし、省略形μ(t)を元の形に戻す必要はある（後で、一般の正規構造の定義を見ればわかるだろう）。

t∈Term_F(Σ)ならtは正規項である。つまり、通常の項は正規項である。
tが正規項であるとき、μ(t)という表現は正規項（μ正規項）である。
t, t₁, ..., t_nが正規項、a₁, ..., a_nがΣのメンバーであるとき、t[t₁/a₁, ..., t_n/a_n]は正規項である。
以上の手順で得られるものだけが正規項である。

略記μ(t)を採用するかどうかは本質的な問題ではない。略記を使っても使わなくても、上のようにして定義された正規項の全体をRegTerm_F(Σ)とする。 μ(t)をt*のことだと思えば、RegTerm_F(Σ)は普通の正規表現そのものであることを各自確認してほしい。

以上で、Kleene構造の構文側は定義が終わった。なんのことはない、普通の正規表現をもって回った言い方で再定義したに過ぎない（という理解で正しいのだ）。

8. Kleene構造意味パート

Kleene構造の意味的部分は、集合とその上のホントの演算から構成される。K を集合として、e∈K、単項演算*:K→K、2項演算+:K×K→K、・:K×K→Kが与えられているとする。KはKleeene代数と同じ特殊元と演算を備えているが、 Kleene代数のように等式（演算の法則）を満たすことは要求されていない。ただし、K上には順序≦があるとする。*、+、・は、K上の順序に対して単調写像になっているとする^(*注10)。

注10

x ≦ y ならば f(x) ≦ f(y) のとき単調という。

単調写像であることを仮定しないこともあるが、ここではすべての写像が単調だとしておく。

前節で定義したRegTerm_F(Σ）と、いま準備した(K, e, *, +, ・, ≦)を結びつけよう。まず付値v:Σ→Kを与える（与え方は自由）。付値vに基づいて、 M:RegTerm_F(Σ）→ Kを次のように定義する。

tがΣのメンバーaのときは、M(t) = M(a) = v(a) とする。
tがemptyのときは、M(t) = M(empty) = e とする。
tがrepeat(r)のときは、M(t) = M(repeat(r)) = M(r)^* とする。
tがconcat(r, s)のときは、M(t) = M(concat(r, s)) = M(s)・M(r) とする。
tがchoice(r, s)のときは、M(t) = M(choice(r, s)) = M(s)+M(r) とする。
tがμ(r)のときは、f(x) = e + M(r)・x で定義される単調関数f: K→Kの最小不動点を M(t) = M(μ(r))とする。

ここで、M(μ(r))の定義には若干の問題がある。f(x) = e + M(r)・x で定義されるf: K→Kの最小不動点が存在することが保証されない。よって、M(μ(r))は未定義になる可能性がある。対処法としては、未定義でもよいとする方法と、ちゃんと定義される場合に限って考える方法がある。ここでは後者の方法を採用する。つまり、f(x) = e + M(r)・x の最小不動点は常に存在すると仮定する。

さて、結局‘Kleene構造’とは何かと言えば、正規項RegTerm_F(Σ)の解釈を与えるシステムである。Kleene代数と異なるのは、計算法則を何も仮定してないことである。よって、(K, e, *, +, ・, ≦)の演算が a + a = a とか e・a = a などを満たすことは全然保証されない。だから、通常の正規表現の常識が通用しないかもしれない。

念のため、あらためてKleene構造の構成素を示しておけば、必要な特殊元／演算／順序が定義された集合(K, e, *, +, ・, ≦)と、付値v:Σ→Kである。これが与えられれば、M:RegTerm_F(Σ) → K は自動的に決まってしまう。

9. 正規構造へのシナリオ

Kleene構造を定義する際に、Kleene代数では要求していた演算の法則（結合律や分配律など）は捨ててしまった。なぜ、法則を捨てたかというと、一般のデータ構造に関して、Kleene代数のような整った法則のセットが見つかることは期待できないからである。もちろん、演算法則を見つけることは重要だし、それが見つかれば役に立つのも明らかである。しかし、さまざまなデータ構造に対する“言語”（ツリー言語、レコード言語、マップ言語、バッグ言語、その他いろいろ）に対して完全な法則性（公理化）を要求するのは現実的ではない。演算法則が部分的にでも見つかればラッキーと考えておこう。

このような事情で、代数的な法則性よりはむしろ、再帰方程式の最小解として新しいメンバーや演算を導入できる能力に注目する。別な言い方をすれば、 Kleeneスター演算の一般化が厳密に定義できるようなメカニズムを問題にする。この方針に従って定義される構文／意味システムが正規構造である。

正規構造を定義する際の要点は、正規表現の一般化である正規項をキチンと定義することと、正規項のなかで特にμ項に対して、最小不動点としての意味を与えることである。この2点がうまくいけば、他のことは気にしないことにしよう。

Kleene構造のときは、F₀ = {empty}、F₁ = {repeat}、F₂ = {concat, choice}、その他のF_i = {} という特別な関数記号集合を使ったが、一般の正規構造では、任意の関数記号集合F = (F₀, F₁, F₂, ...)から出発する。また、Kleene構造で使った変数集合Σは、もともと言語のアルファベットだったものを変数として“流用”した感じだった^(*注11)が、一般の正規構造では、変数記号集合になんの仮定もしないし、条件も設けない。

注11

これはあくまで「感じ」の問題である。変数の正体が何であるかは、まったく問題ではない。どんなモノであれ、それが置換（substitution, replacement）の対象となるなら、それは変数なのである。

関数集合Fと変数集合Xに対して、項の全体Term_F(X)は通常どおりに定義する。「通常どおり」については、記事「再帰代入系 1」の第4節や記事「『形式的』とは何だろう」の前半（第5節まで）を見て欲しい。このTerm_F(X)をベースにして、それを拡張することにより正規項（regular term）の全体RegTerm_F(X)を定義するが、そのための道具として、再帰テンプレートというものを導入する。再帰テンプレートは、慣れてしまえば、ごくありきたりの道具だが、定義だけを見ても意味不明なところがある。節を改めて、助走としてインフォーマルな説明からはじめよう。

/* ここからさらに書き足した部分 */

10. 平方根って、どうやって導入したっけ？

前節で、「助走としてインフォーマルな説明」をすると述べた。概念の導入のさいに、助走路を設けるかどうかは毎度悩む。僕は、気合いが入りすぎていると、助走や準備をすっとばしてイキナリ抽象的な概念を持ち出すこともあるが、これはよろしくない。が、かといって、長い助走路や補助的概念の説明を “まどろっこいしい”、“迂遠”と感じる人もいるだろう。

この記事に関して言えば、ダラダラと書いていたら、気合いは失せてしまった。よって、一気に抽象的な概念を提示する気分がしない。という、まことに勝手な理由で、ちょっと冗長な説明を挿入することにする。記事が長くなるのは困ったことだが、人によっては、冗長な説明を懇切丁寧と受け取ってくれるかもしれない（って、勝手な言い訳）。

以下に述べるインフォーマルな説明は、第6節「数系の拡大との対比」の続きのようなものである。正規構造で使われる手法が、お馴染みのものであることを強調したいのだ。よって、過去を振り返る。過去とは歴史的な過去でもあるし、個人の過去（小学校から高校あたり）でもある。

小学校から高校あたりで習う数系（自然数、整数、有理数など）は、実数系の部分系になっている（複素数は例外）^(*注12)。Rは実数系（演算や順序を備えた実数全体のこと）だとして、Rを「世界」として考えよう。「世界」とは、記号的表現を解釈する普遍的（universal）な場ということである。

注12

高校卒業までに、実装の概念をちゃんと理解しているかというと、たぶんそうではない。だが、ちゃんと理解している必要はない。四則演算と数直線のイメージがあればそれで十分だと思う。

関数f:R→Rがあるとき、f(x) = 0 となるようなxの全体をfの‘零点集合’と呼び、Z(f)と書く（Zはzeroに由来）。Z(f)は空かもしれない（例：f(x) = x² + 1）、無限集合かもしれない（例：f(x) = 0, f(x) = sin x）。Z(f)が空ではなくて、Z(f)から一点（1つの実数）を選び出す方法があるとき、選び出された実数をτ(f)と書くことにしよう。

「一点を選び出す方法」には、例えば次のようなものがある。

Z(f)が一点であることが前もって保証されている。Z(f)に含まれる唯一の実数をτ(f)とする。例：a≠0であるf(x) = ax + b 。
Z(f)に所属する点であり、しかもある範囲内に入るものが一点であることが保証されている。その一点をτ(f)とする。例：a, b≧0であるf(x) = ax² - b、非負の範囲のxだけを考える。
Z(f)に所属する点であり、ある範囲内に入るものがたくさんあっても、そのなかで最小のものが存在することが保証されている。その最小の点（最小値）をτ(f)とする。例：xが非負の範囲で考える。fが連続でZ(f)が空でないなら、最小のxは一意的に定まる。

fの零点集合Z(f)は、「方程式f(x) = 0 の解集合」と言い換えても同じである。だから、τ(f)の定義の背後には、「関数→方程式→解集合→一点の選択」という長い手順がある。

ところで、関数fを定義するには、通常は式（形式的体系の用語なら“項”）が使われる。例えば、x² - 2 という多項式（2次式）が関数を定義する。式（項）は記号的な存在だから、機能的実体である関数とは違うものである。式により定義された関数を指示する記法にラムダ記法がある。例えば、x² - 2 という多項式で定義される関数はλx.(x² - 2) と書く。（これは内容的なラムダ記法であり、形式的ラムダ式ではない。）式に登場する変数の名前は問題にならないので、 λs.(s² - 2) と λx.(x² - 2) はまったく同じ関数である。

NOTE: ラムダ記法：こんな説明はどう？

「式と関数は違います」に対して、「えーっ、関数って式のことじゃないの？」という反応はけっこうありそうだ。コンピュータ関連業界の人に対してなら、「ソースコードと実行可能形式は違うでしょ」と言えばわかりやすいかもしれない。もっとも、実行可能形式といえども何らかのプロセッサ（実行エンジン）の力を借りないと機能的実体にはなりえないのだけど。まー、それを言い出すときりがないので、「実行可能形式=機能的実体」とみなそう。

例えば、x² - a という式（expression）をソースコードとみなす。が、この式には変数（文字記号）xとaが含まれるから、変数xが引数であることを宣言して、(x)(x² - a) とでも書こう（(x){return (x² - a);}ならもっとリアルっぽいかな）。これを「xの関数」としてコンパイルした結果が λ(x)(x² - a) なのである（普通は、xを括弧で囲む代わりにピリオドで区切る記法が採用されるが）。

では、λ(x)(x² - a) に含まれる変数aは何なのか、と言えば、コンパイルされた形式が実行されるときに、外部（実行環境）から受け取る値で具体化されるパラメータである。「a」という名前は、適当なメモリを指すようにコンパイルされるから、aは実行時のメモリ状況から決まると言ってもいい。

結局、λ(x)(x² - a) は、実行環境からaの値を受け取って、引数x（これはレジスタとかスタックに積まれる）に対して出力値を計算する機能実体を表すことになる。

以上は、“インフォーマルなラムダ記法”のインフォーマルな説明になっている。“フォーマルなラムダ式”でも、このような解釈が（少なくとも心情的には）背景にあるといってよい。

先のτ（零点集合からの選択）とλ（ラムダ記法）を組み合わせると、 τ(λx.(x² - 2)) は意味を持つ。τ(λx.(x² - 2)) は特定の実数を表すが、多項式 x² - 2 から特定の実数に至る道筋は「式→関数→方程式→解集合→一点の選択」となる。「なんと面倒な！」と感じるかも知れないが、あなたは中学校でこの道筋を経験しているはずだ。それは次のようなものだ。

多項式（二次式） x² - 2 を考える。
多項式 x² - 2 から、二次関数 λx.(x² - 2) が定義される。
二次関数 λx.(x² - 2) の零点集合Z(λx.(x² - 2)) （すなわち方程式 x² - 2 = 0 の解集合）は空ではない。原点（0）に対して対称な位置にある二点を含む。
非負の零点を選ぶ。それをτ(λx.(x² - 2)) とする。

τ(λx.(x² - 2)) は、「x² - 2 = 0 の解の非負のほう」である。そう、これは「ルート2」に他ならない。さて、τ(λx.(x² - 2)) を τx.(x² - 2) と略記することにしよう（λとτを一緒にしたオペレータをあらためてτを書く）。こう書くと、τは、式（項）から特定の実数を作り出すオペレータのように思える。実際、τx.(x² - 5) は「5の平方根」を表すし、τx.(x³ - 2) なら「2の立方根」を表す。τを使えば、√とか³√ のような新しい記号（これらは1引数関数記号である）を導入する必要はない。（もちろん、新しい関数記号を使えば表現が煩雑になるのを避けることができるが。）

11. 算術テンプレート

この記事では、「算術的」という形容詞を、小学校の算数と中学校の数学で習うような内容を示すときに使うことにする^(*注13)。算術演算とはいわゆる四則演算のことだし、算術方程式とは「一変数多項式・イコール・ゼロ」という形の方程式だとしよう。この「算術的」の使い方はこの記事だけの用語法だから注意（一般的に、初等代数的と呼ばれるような範囲のものだろう）。また、「式」という言葉は、形式的体系におけるformulaに限らず、記号的表現一般を指すためにも使う（つまり、日常的な用法）。

注13

「算術的」は「数論的」と同義の形容詞として使うこともある。この意味での算術的は、極めて高度で難しいことになってしまう。

さて、算術的な数系（number system）が進化する過程を、形式体系を使ってキチンと捉えみよう。具体的には、非負整数 0, 1, 2, 3, ... が知られている状況に対して、逆数（割り算と言っても同じ）と平方根を導入する過程を 算術テンプレートを使って定式化する。算術テンプレートが理解できれば、再帰テンプレートはほとんど同じものである。

最初にベースとなる形式的体系を定義する。

定数記号（0引数の関数記号）は、記号 0, 1, 2, 3, ... だとする。
2引数の関数記号は、+、-、× の3つとする^(*注14)。
その他の関数記号はない。

注14

この形式的体系を常識的（あるいは標準的）に解釈すると、記号「-」は引き算である。引き算があるので負の整数を (0 - 1)のように表現できる（一意的ではない）。が、この方式よりは、次のどちらかのほうが多いだろう。

定数記号として -1, -2, -3などを最初から入れておく。
単項のマイナス記号を採用して、負の数は -(1), -(2)などで表す。

こうして見ると、記号「-」は、定数記号の一部、単項の符号反転演算、2項の引き算と、3用法でオーバーロードされているわけで、その解釈は難しい。

余談だが、普通の教育でも、記号のオーバーロード、演算の多態性、構文の曖昧性などが理解のネックとなっている可能性を配慮した方がいいと思う。

この形式的体系の変数記号集合F = (F₀, F₁, F₂, ...)を明確に定義すれば：

F₀ = {0, 1, 2, 3, ...}
F₂ = {+, -, ×}
i=0, 2以外のF_i = {}

変数集合Xは適当に選んで（なんでもよい）Term_F(X)を作る。項+(2, 3)、 ×(2, 3)などは中置の(2 + 3)、2×3 にして、さらに×は適宜省略する。要するに、なるべく“普通”の書き方をする。

変数yとzは変数集合Xに含まれないとして、2つの項 yz - 1 と z² - y を考える。もちろん、正式に書けば -(×(y, z), 1) と -(×(z, z), y) である。yz - 1 も z² - y もTerm_F({y, z})には入るが、Term_F(X)には所属していないことに注意せよ。

yz - 1 と z² - y は算術テンプレートの実例であり、それぞれ、逆数と平方根を導入するために使う。平方根は前節で触れたから、逆数のためのテンプレート yz - 1 を説明しよう。

この形式的体系には、非負の整数（を表現するつもりの記号）1, 2, 3, ... は含まれるが、その逆数 1^-1、1^-1, 2^-1, 3^-1, ...や、より一般の“分数”を表現する手段はない。ここでは、個々の逆数／分数ではなくて、むしろ逆数を取る関数<x |→ x^-1> ^(*注15)の導入を目的にしたい。分数は逆数と積（掛け算）から構成できる。

注15

<x |→ … x …>は、内容的なラムダ記法の別表記である。「よく使う記法など」を参照。

例えば、2の逆数2^-1を考えると、これは「方程式 2×z = 1 を満たす唯一の数z」として特徴付けられる。少し書き換えれば、「2×z - 1 = 0 であるようなz」である。一般に関数fの零点をZ(f)と書いたのだから、この特徴付けは、「Z(λz.(2×z - 1)) の唯一の点」と書ける。Z(f)から1点を選ぶ出す方法が決まっているとき、その一点をτ(f)と書く約束だったので、2の逆数2^-1に対する表現は、τ(λz.(2×z - 1))となる。「λとτ を一緒にしたオペレータをあらためてτを書く」流儀を採用すると、τz.(2z - 1) と簡略化できる（掛け算の×も省略した）。

以上は、特定の数2に対する逆数の話だっが、3の逆数ならτz.(3z - 1)だし、項(x + 1)に対する逆数なら、τz.(2(x + 1) - 1)と書ける。一般に、項tの逆数の表記は τz.(tz - 1) となる。

先に出した式 yz - 1 を使えば、「項tの逆数を表す表現」は次のような手順で作れる。この手順は完全に機械的／構文的なものである。

yz - 1 の変数yをtで置き換える。
その式の前に「τz.」を付ける。

ここまで説明すれば、算術テンプレートを定義しても天下りにはならないだろう。‘算術テンプレート’とは、Term_F({y, z})に属する項である。yz - 1 と z² - y は実際、Term_F({y, z})に属する。この定義だけでは実は意味がなく、問題は算術テンプレートをどう使うかである。節を改めて続けよう。

12. 算術テンプレートの使い方

算術テンプレートの使用目的は、前もって与えられた基礎的な形式的体系に、新しい演算を導入することである。算術テンプレートは、変数yと変数zを含む（可能性がある）が、yを‘テンプレート変数’と呼び、zは‘束縛変数’と呼ぼう。

変数yとzは、変数集合Xには含まれない記号を選んでいるのでTerm_F(X)には含まれない（例えば具体例として、X={x}の状況を想定せよ）。算術テンプレートを‘具体化’するとは、Term_F(X)に属する項（例えば 2 や x + 1）をテンプレート変数yに代入することである。 yz - 1 → 2z - 1、yz - 1 → (x - 1)z - 1 はテンプレート具体化の例である。

算術テンプレートを具体化しても、変数zは残る（可能性がある）。zだけを含む（実はzを含まなくてもいいが）項に「τz.」を付けた形が‘τ項’である。τ項の意味は既に説明した。τz.(2z - 1)は2^-1のことだし、τz.((x - 1)z - 1) は (x - 1)^-1のことである。算術テンプレート yz - 1 に関してτ項を導入することは、逆数関数（の記号）を導入することと同じであることは推測されるだろう。

もともとあった項の集合Term_F(X)にτ項を加えて拡張する手順は次のとおりだ。このとき使う算術テンプレートをTとする。

Term₀, Term₁, Term₂ のような項集合の系列を作っていく。 Term₀ は Term_F(X) のことだとする。
t∈Term₀ に対して、τz.T[t/y] の形のτ項をすべてTerm₀に付け加える。ここで、[t/y]は置き換え（変数yへの代入、具体化）を意味する。さらにFに属する演算（具体的には、+, -, ×）で組み立てられる項の全体をTerm₁ とする。Term₀ ⊆Term₁ であり、Term₁にはτ項が新しく入っている。
t∈Term₁ に対して、τz.T[t/y] の形のτ項をすべてTerm₀に付け加えて、演算で組み合わせた全体をTerm₂ とする。この過程で作ったτ項の一部は、すでにTerm₁に入っていて、新しいものではないかもしれない。が、入れ子になったτ項は新規のものである。つまり、Term₁ ⊆ Term₂ であり、Term₁ ≠Term₂である。
同様にして、Term₃, Term₄, Term₅, ... を作っていく。
Term₀, Term₁, Term₂, ... をすべて寄せ集めたもの（集合の系列 Term_i の極限）をTerm_∞ とする。

このようにして作ったTerm_∞ が、Term_F(X)を算術テンプレートTを使って拡張（拡大）した項集合である。Term_∞は算術テンプレートTに依存しているので、このTerm_∞をArithExtTerm_F(X; T)と書こう（長ったらしいが）。ArithExtTerm_F(X; yz - 1)は、逆数が自由に取れるような体系を意味している^(*注16)。

注16

意味論を厳密に定義しているわけではないので、「意味している」と言うのは少し勇み足である。実際は、「意味することを心情的に期待している」とでも言うべき。

13. 実例と注意

前節の定義では、算術テンプレートを1つだけ使って、項集合を拡張したが、 2つ以上の算術テンプレートを同時に使って拡張を行ってもよい。例えば、 ArithExtTerm_F(X; yz - 1, z² - y)は、逆数と平方根が自由に取れる体系だといえる。詳細な定義は省略して実例を出そう。

（srrtは平方根の関数記号だとして）(1 + sqrt(5))/2 は黄金数として知られている。黄金数の表現には平方根と割り算（逆数）が必要になる。算術テンプレート z² - y のテンプレート変数yを5で具体化すれば、z² - 5 であり、これをτオペレータで束縛したτz.(z² - 5)は「z² - 5 = 0 であるようなzの非負のほう」だからsqrt(5)に他ならない。一方、算術テンプレート yz - 1 のテンプレート変数yを2で具体化すれば、2z - 1 であり、これをτオペレータで束縛したτz.(2z - 1)は1/2に相当する。したがって、(1 + τz.(z² - 5))×τz.(2z - 1) が黄金数の表現になっている。

さて、今までの定義では、1/0に相当するτz.(0z - 1) や、sqrt(-1)に相当するτz.(z² - (0 - 1))なども項として許されている。意味的に考えれば（実数の範囲内で考える）、このような項はまずい。 τz.(0z - 1)やτz.(z² - (0 - 1))の扱いには2つの方法がある。

項の構成規則に制限を設けて、このような項が生成されないようにする。これは構文的な解決であり、違法と思える項を「最初から項とはみなさない」方法である。
項の構成規則には特に制限を設けない。したがって、違法な項も作られる。意味を割り当てる段階で、これらの項が無意味となるようにする。

いずれの方法でも、論理式（formula）と演繹系（deduction system）がないと、ちゃんとした扱いはできない。それは、本記事の範囲を越えるから、上記の注意だけにとどめる。ただし幸いに、正規構造の主たるターゲット分野である形式言語理論では、このての問題はほとんど起きない。

14. 再帰テンプレートと正規構造（構文パート）

‘再帰テンプレート’の定義は算術テンプレートとほとんど同じである。違いは、算術的方程式「項・イコール・ゼロ」の代わりに再帰方程式（不動点方程式）「変数・イコール・項」を考える点だけである。下の表に両者の対応を示す。

TABLE: 算術テンプレートと再帰テンプレート

	算術テンプレート	再帰テンプレート
方程式の形	項 = 0	変数 = 項
解集合	零点集合Z(f)	不動点集合Fix(f)
解の一意選択方法	いろいろ	最小点
オペレータ記号	τ（この記事のみ）	μ（伝統的）
拡張した項集合	ArithExtTerm_F(X; T)	RecExtTerm_F(X; T)

常識的な引き算や零の概念があるなら、再帰方程式 x = f(x) は算術的方程式 x - f(x) = 0 と変わりはない。よってこの場合は、再帰テンプレートは算術テンプレートに帰着されてしまう。しかし、「常識的な引き算や零の概念」がいつでもあるとは限らない。実際、Kleene代数では、（零はあるが）合理的な引き算は定義できない。よって、再帰テンプレート（例えば、1 + yz）は固有の意味を持つ。

基本となる項集合Term_F(X)に対して、いくつかの再帰テンプレートが指定されると、正規構造の構文パートは決定される。つまり、正規構造の構文パートは、次のもので指定される。

関数（記号）集合F = (F₀, F₁, F₂, ...)。
変数（記号）集合X。
Term_F({y, z})に属するいくつかの項（再帰テンプレート）

Kleene構造は正規構造の特殊な例である。Kleene構造の構文パートを与えるデータは次のとおり。

関数集合：F₀ = {empty}、F₁ = {repeat}、 F₂ = {concat, choice}、その他のF_i = {} 。
変数集合：適当な集合Σ、例えばΣ={a, b, c}。
再帰テンプレート：choice(empty, concat(y, z))

Term_F(X)を拡張してRecExtTerm_F(X; T)を作る方法は、第7節で述べた方法でも、第12節の方法でも同じである。

15. 正規構造（意味パート）

関数（記号）集合F、変数（記号）集合X、いくつかの再帰テンプレートT₁, ..., T_kが与えられると、基本となる項集合Term_F(X)、μ項で拡張した項集合RecExtTerm_F(X; T₁, ..., T_k)などは自動的に定義できる。これらの構文的な存在物に意味を与えるとは次のことである。

‘台集合’とか‘領域’と呼ばれる集合Dを準備する。Dには順序が入ってなければならない。
Fに属する関数記号に対して、ホントの関数（写像）を割り当てる。 a∈F_n ならば、記号aに対応するホントの関数は Dⁿ → D という形である。特に、a∈F₀ ならば、記号aは D⁰ → D、つまり一点集合からDへの関数だから、Dのメンバーだと考えてよい。（D⁰が一点集合であることは、記事「タプルと直積」参照。すべての関数は Dの順序に対して単調でなければならない。
XにDのメンバーを対応させる付値v:X→D を与える。付値は自由に定義してよい（制限はない）。

最も重要な点は、μ項の解釈が最小不動点であることだ。再帰テンプレートTを具体化した結果T[t/y]は、束縛変数zを含む。この変数zを “領域Dを走る独立変数”と解釈すれば、λz.T[t/y] はDからDへのホントの関数と解釈できる（もちろん、T[t/y]内の関数記号と変数記号も、ホントの関数と付値で解釈する）。

与えられた構文と意味が「正規」であるためには、次の条件を要求する。

μ項μz.T[t/y] に対して、ホントの関数λz.T[t/y]は最小不動点を持ち、この最小不動点がμz.T[t/y] の意味である。

記号的な存在Sの意味を一律にM[S]と表すことにして、 RecExtTerm_F(X; T₁, ..., T_k) の意味定義をまとめてみる。tは（拡張された）項であり、Tは再帰テンプレートのどれか（どれでも）ひとつを表すとする。

tがXのメンバーxのときは、M[t] = M[x] = v(x) とする。
aがF_nに属する関数記号aのときは、M[a]は Dⁿ → Dという関数である。
tがa(t₁, ..., t_n)の形をした項のとき、M[t]は、M[a](M[t₁], ..., M[t_n]) である。これはDのメンバーとなる。
tがμz.T[t/y]のときは、λz.T[t/y] で定義される単調関数の最小不動点を M[t] = M[μz.T[t/y]]とする。

正規構造が与えられた（または与えられる予定の）とき、RecExtTerm_F(X; T₁, ..., T_k)のメンバーを‘正規項’と呼び、RecExtTerm_F(X; T₁, ..., T_k)をRegTerm_F(X; T₁, ..., T_k)とも書く。

16. XMLの事例

XMLを扱うには、いままで定義した正規構造ではやや不足で、変数にソート（型）が必要である。「『正規（regular）』とは何なんだ」の第8節と同様にTiny Toy XMLで考える。ソート（型）は、Name、List、 Treeである。

List型テンプレート変数yとTree型束縛変数zを含む再帰テンプレートを、次の（インフォーマルな）パターンで定義する。

<a/> | <a>y z</a>

テンプレート変数yを |<c/> で具体化すると、次のようになる。

<a/> | <a>(<b/>|<c/>) z</a>

束縛変数zに対してμオペレータを作用させてμ項を作ると：

μz.[<a/> | <a>(<b/>|<c/>) z</a>]

このμ項が何を意味するかというと、次の再帰方程式（不動点方程式）の最小解である。

z = <a/> | <a>(<b/>|<c/>) z</a>

z = 0 = {} から始めて、近似列を作ろう。パターンはブラケットで囲み、集合はブレイスで囲んで表記する。

z0 = {}
z1 = [<a/> | <a>(<b/>|<c/>){}</a>] 
   = {<a/>}
z2 = [<a/> | <a>(<b/>|<c/>){<a/>}</a>]
   = {<a/>, <a><b/><a/></a>, <a><c/><a/></a>}
z3 = [<a/> | <a>(<b/>|<c/>){<a/>, <a><b/><a/></a>, <a><c/><a/></a>}</a>]
   = {<a/>, 
     <a><b/><a/></a>, <a><b/><a><b/><a/></a></a>, <a><b/><a><c/><a/></a></a>,
     <a><c/><a/></a>, <a><c/><a><b/><a/></a></a>, <a><c/><a><c/><a/></a></a>
     }

...

μ項 μz.[<a/> | <a>(|<c/>) z</a>] は、Tiny Toy XMLに対する一種の正規表現であり、いくらでも（インスタンスの）入れ子を許すので、無限個のインスタンスにマッチするパターンと解釈できる。項 μz.[<a/> | <a>(|<c/>) z</a>] を、他のパターンに含めることもできる。例えば、μz.[ | μz.[<a/> | <a>(|<c/>) z</a>] z] はより複雑な正規表現である。

「正規（regular）」とは何なんだ 2正規構造

目次