Janus（ヤヌス）の紹介 2 -- フィルターからコンポネントへ

さて今回の話題だが、Janusのややこしい点をうまく取り扱うための「絵の描き方」を示す。その「ややこしい点」とは、コンポネントの“方向”や“順序” のことだ。Chimaira/Janusでは、矢印記号や矢印の形をした絵が頻出する ^(*注2)。いろいろな“方向”や“順序”があるので、間違いやすく、混乱しがちだ。別に難しい話ではないのだが、言葉や記号だけでは表現しにくかったりミスを犯しやすいから、いつでも絵を描くことをお勧めする。絵（図式）は、ほんとに強力な武器になる。

この記事のなかで、Janusコンポネントの基本概念である極性と双方向性（対称性）も導入する。極性／双方向性を視覚的に理解するためにも、図式は必須だ。図式法をマスターすれば、Janusを使いこなすことができるだろう。

それで、今回の説明に使う素材は……、またパイプ＆フィルターです :-) 他の例も出したほうがいいかもしれないけど、それは別な記事に書こうと思う。パイプ＆フィルターは、（世間の認識はどうであれ）僕にとってはコンポネント・アーキテクチャのお手本だし、典型的なコンポネント・アーキテクチャだとも思っている。まー、愛着があるから^(*注3)、これを素材にすると説明しやすいって事情もありますね。

2. フィルターとパイプの復習

前回の復習をかねて、フィルターとパイプの概念をもう一度明確にしておく。フィルターとは、stdinから入力して、処理結果を stdoutに書き出すようなプログラムである。そしてパイプは、フィルターとフィルターを繋ぐ連結装置だ。フィルターfとフィルターgのパイプによる直列結合は、伝統的に「f | g」と書かれる。ここで、パイプ記号（縦棒）は、単なる形式的記号（構文的コネクタ）ではなくて、ソフトウェア的実体を指していると思うことにする（これ、重要なポイント）。だから、縦棒の代わりにpなどを使って、パイプラインを「f p g」のようにも書く。「f | g | h」なら「f p g p h」ってことになるが、ここで2回登場しているpの実体は別物だとする。そうでないと、f、g、hを線形に繋げない。

従来、パイプは「フィルターとは別なもの」「フィルターの結合をサポートするOS側の機能」のように考えてきたのだが、我々は普通のフィルターとパイプを特に区別しないで、一様な枠組み内で捉える。普通のフィルター（狭義のフィルター）とパイプの違いはそのプロファイル（→ 前回第5節）である。普通のフィルターとパイプは、それぞれ次のようなプロファイルを持つのだった。

今後我々は、「フィルター」という言葉で次のようなソフトウェア的実体を指すことにする。

入力ポート／出力ポートそれぞれに割り当てるインターフェースと、そのインターフェースを“利用する”のか“提供する”のかをハッキリと記述した宣言をプロファイルと呼ぶのだった。上記5項目の定義のごとくに一般化されたフィルターの性格／特徴は、そのプロファイルで決定される。

なお、以下では、フィルター間で受け渡されるデータ（の最小単位）はキャラクタだと仮定しよう。別にそう仮定する必要はないのだが、あまり余計なことを考えたくないから、この前提で話をする。

3. 例題の説明

説明に使う例の説明をしておく。以下では、Push型のパイプラインを考えてみる。まず、次のインターフェースTextHandlerを思い出そう（→ 前回第7節）。

このインターフェースは、XMLのSAX仕様のように、データを受け取る側が実装すべきハンドラー（コールバック・プロシージャ）を規定している。データを送る側は、相手のhandlecというメソッドを呼び出して通知する。

PushRelayは、インターフェースとしてTextHandlerだけを使ってパイプラインを構成するためのプロファイルである。プロファイルPushRelayを持つフィルターは、データ入力用にハンドラーhandlecを実装し、データ出力には他のフィルターのハンドラーhandlecを呼び出す。fとgが共にPushRelayフィルターなら、fとgは直列結合可能である。PushRelayフィルターだけでパイプラインを構成するのはたいてい無理だ（両端はどうする？）が、パイプラインの中間部分にPushRelayフィルターを何個も並べることができる。

何もしないでデータを流すPushRelayフィルターは次のように書ける^(*注6)。なお、変数outportは、出力ポート（あるいはその先につながっているフィルター）を指すTextHandler型変数だとする^(*注7)。

注6

「書ける」とはいっても、擬似コードで書いているだけだ。Javaなどのホントのプログラミング言語で実装しようと思うと、メソッド呼び出しの同期／非同期、スレッディング、ポートをどう実現すべきか、などで悩んでしまうだろう。呼び出しの中継、ポートの実現、ポートを繋ぐような作業は、コンポネントではなくて、コンポネントの動作環境や制御機構が担当するものだ。つまり、 “Janusコンテナ”や“Janusシェル”が必要になるのだ。

コンテナやシェルの実装についての僕の試案も、時期がくれば説明したい。だが、やり方が一つってわけでは全然ないから、興味を持った方は各自で考えてみればよい。僕みたいな白頭爺が考えるより、よほどいい案が出るだろう。

注7

このoutportって変数はちょっと正体不明だろう。プロファイル宣言における "output:"とはどう関係するのだろうか？考え方は2つある。1つの方法は、ポートとプログラム内で使う変数の関係（バインディング）を、毎回明示的に宣言する。もう1つは、なんらかの約束事により、ポートとプログラム内で使う変数の関係は自動的に決まるようにする。変数outportは、このいずれかの方法で、出力ポートと関連づけられていると仮定している。

ところで、インターフェースTextHandlerを経由してデータを受け渡すとき、 “データの受け側＝ハンドラーの呼ばれ側”は、データ受け取りのタイミングを自由に制御することができない。外部から一方的にキャラクタを押し込まれる。たとえば、処理を一時的に休止したくてもどうにもならない。そこで、昔なつかし“フロー制御”^(*注8)のインターフェースFlowControlを導入しよう。

isactiveによって、いまデータが流れている状態かどうかを知ることができる。stopを呼べばデータの流れが止まり、startで再開する。まー、あたりまえの仕様だね。が、せっかく定義したインターフェースFlowControlを割り当てるべきポートがない！だって、inputにもoutputにも割り当てられないでしょ、この2つはデータ用のポートだから。さて困った。で、次節に続く -- いやっ、次節ではちょっと別な概念を準備しよう。

NOTE: 独り言

前回において、最初のサンプルコードとしてCによるフィルターを使ってしまった。それに引きずられて、関数／メソッドの名前は、 iseof、handlec、isactiveなんてことになっている。あーあ。首尾一貫したネーミングも良し悪しだわ。もう、isEndOfFile, handleCharacter, isActiveに変えたい気分だわさ。

4. 極性

ここで、極性という概念を導入しておこう。極性については、前回の第9節でほんのちょっと（いわくありげに）触れたが、ここで正式に定義する。この極性というやつは、Janusのキーコンセプトの1つである。

‘極性’（polarity）とは、「電気のプラスとマイナス」、「磁石のNとS」、「論理の真と偽」のような、二値の量のことである。また、ナニカに二値の量が割り当てられているとき、そのナニカは極性を持つ、とか偏極している（polarized）というのだ。「偏極ナントカ」の代わりに、「符号付き（signed）ナントカ」とか「荷電（charged）ナントカ」というときもある。場合によって、向き（orientation）が極性を与えることもある。

この記事では（たぶん、Chimaira/Janus全体で）、極性の値としてプラスとマイナスを使う。よって、極性値の集合は{+, -}である。P={+, -}だとして、集合X上の偏極（符号割り当て、荷電）とは、写像p:X→Pのことである。集合Xと偏極pの組(X, p)は、偏極（符号付き、荷電）集合と呼ぶことになる。

さて、P上の唯一の演算としてσ:P→Pを導入しよう。これは、 σ(+)=-、σ(-)=+ で定義される。ようするに、プラスとマイナスをひっくり返す演算である。「唯一の演算」と言ったのは、論理値の集合（booleanだね）なら、ANDとかORとかも考えるけど、極性値の集合Pでは、そんなものは考えないのだ。意味のある演算はひっくり返しσだけだ。

このひっくり返し写像σには、むやみと色々な呼び名がある（それだけ、いろんな所で登場するってことだね）。反転とか逆転を意味する reverse, reversion, conversion はもちろん使う^(*注9)。別記事「ETBダイアグラム」第5節の注で触れたが、交差や取り替えを意味する cross, crossing, flip, swap, twist, symmetry, permutation, transposition, exchangeなども使っていいだろう。幾何的な比喩からは、鏡像、鏡映（reflection、mirroring）などの用語もある。代数では、2回行うと元に戻るような演算を対合(involution)^(*注10)とか共役（conjugate, conjugation）と呼ぶので、このての言葉も使われる。そして、論理の用語を借りて、否定（negation）と言う場合もある。で結局、我々はどれを使うかというと……、悩んじゃうのだけど、平凡に「反転」にしましょうかね。

さて、極性を何の目的に使うかというと、メソッド呼び出しの“向き”を指定するために使う。どういうことかというと、プロファイル宣言において、 useとprovideっていうキーワードを使ったけど、useをプラス、provideをマイナスという極性値（符号）で区別する。つまり、use TextInputの代わりに「+TextInput」、provide TextHandlerの代わりに「-TextHandler」と書いてもいい。

単に表記法を変えただけで何がうれしいかって？まずとりあえず、図を描きやすくなる。図が描きやすいなら、考えやすくなるし、説明も楽になる。それに、物理、電気工学（特に回路図）、論理（線形論理）などの知識・技法を拝借できるようになる。

ところで、use、provideのどちらをプラス（もう一方がマイナス）にするかは、まったく恣意的（どっちでもいい）なのだ。必然的、絶対的な理由や根拠なんてなくて、エイヤッと決めればいいことだ。だが、どっちでもいいことだと、かえって悩む。僕はすごく悩んでしまった。今も悩んでいる。ある日気が変わって、プラスとマイナスを逆にしたくなる、ってこともあるかもしれない。useをプラスにした理由は、下のノートに書いておく。

NOTE: どっちでもいいから悩む

メソッド呼び出しを、“呼び側”から“呼ばれ側”に向かう矢印で表す（これを後で「呼び出し弧」と呼ぶ）。コンポネント境界を越える呼び出しでは、呼び出しの矢印の根本がuse側で矢先がprovide側になる。

さて、矢印の両端のどちらにプラスを割り当てるべきか。電流は「+ → -」と流れるから、根本がプラスがよいか？だが、実際の電子の流れは「- → +」だし、数学でも「- → +」が普通だ。点pから点qに向かう矢印（1次元有向単体）に対して、その境界は q - p と表すのだけど、これは (+q) + (-p) で、始点にマイナス、終点にプラスの極性（向き）を与えたものだ。

それじゃ、「- → +」がいいかというと、まだ考慮すべきことがある。インターフェースをuseするとは、そのインターフェースを能動的（active）に使うことだ。一方、provideするインターフェース（の実装）は、受動的（passive）に呼び出しを待つことになる。プラス・マイナスは、英語だと positiveとnegativeとも言うけど、語感としては、positiveとactive、 negativeとpassiveが対応した方が自然な気がする。この方針だと、「+ → -」になる。

結局、日常的な感覚では、useがプラスでprovideがマイナスなのが自然な気がしてきた。それで、「use=プラス=positive=active」、「provide=マイナス=negative=passive」という対応を選んだ。

5. フィルターからコンポネントへ

話を戻そう。2つのフィルター間でフロー制御を行いたいのだった。そのためのインターフェースFlowControlは定義したが、このインターフェースを割り当てるべきポートがない。もうこれは、ポートを増やす以外に手がないでしょ、やっぱり。つまり、データ入出力用のポート以外に、制御用ポートを付けるのだ^(*注11)。

そうなるとだね、先に導入した「フィルターの定義」が早々と破綻してしまう。なぜなら、フィルターとは、入力用に1本、出力用に1本のポートを備えたものとして定義したからだ。制御用ポートはポートとして勘定しないという逃げ道はあるが、そうではなくて、フィルターの定義をさらに拡張して、任意本数のポートを許すことにしよう。そのほうが建設的、発展的だからね。

もっとも、ポートが5本も10本も出たヤツをフィルターと呼ぶのは抵抗があるのも事実だ。そこでいっそ、フィルターの拡張概念を‘コンポネント’と呼ぼうじゃないの。ここで、「そもそもコンポネントとは、カクカクシカジカ…」とか言い出すのはやめようね -- それは建設的じゃない、発展的じゃない、つまり不毛だから。

一般のコンポネントは、任意の本数の入力ポートと出力ポートを持ってよいとする。「任意の本数」には0本も入るから注意してね。と、そういうわけで、たとえば、3本の入力ポートと2本の出力ポートを持つコンポネントは次のような図で表す。

ん？「ボックス」ていう書き込みはなんだ？とお思いだろう。ゴメン、これは「コンポネント」と書くべきだ。実はモノグサして、「ETBダイアグラム」という記事の最初の図をそのまま流用した。この「ETBダイアグラム」は、図の描き方を集中的に説明した記事だ。いまここで「ETBダイアグラム」を読みにいかなくてもいいけど、後で「ETBダイアグラム」にもざっと目を通しておくといいだろう。

さて、Janusにおいては、ポートの本数が自由というだけでなく、それぞれのポートに極性（プラスまたはマイナス）が付くという点がとても重要だ。例として、フロー制御を持ったコンポネントの図を描いておこう。

この図で、入力から出力への向きは左から右だ。コンポネントの各ポートには、極性とインターフェースが割り当ててある。極性プラスはuseに対応し、極性マイナスはprovideに対応するのだった（前節を参照）。2つのポートをつなごうとするとき、プラスのポートはマイナスのポートと、マイナスのポートはプラスのポートとつなぐ -- 電気回路の結線を思い出してね！もちろん、インターフェースは一致してなくてはならない。上の図のコンポネントAとコンポネントBは、“AからBへ”の順序でつなぐこともできるし、“BからAへ” という順でも直列結合できる。だが、一般にはそうウマクはいかないから注意せよ。

6. コンポネントのパイプライン

任意本数のポートを許すと、プロファイル宣言の構文も拡張しておく必要がある。とはいっても、その拡張方法は自明に近い。use宣言文とprovide宣言文を複数書いてもよいだけのことだ。下に例を挙げよう。なお、プロファイル宣言において、プロファイルの名前が不要なときは、無名のプロファイルも許すことにしよう。

ついでに、プロファイル宣言の略記も導入しておく。プロファイルの全体は、 [入力 → 出力] の形とする。入力と出力の部分には、インターフェース名の前に極性（プラスかマイナス）を付けたものをカンマで区切って並べる。上の2つのプロファイルはそれぞれ次のように略記できる。

これまでの話で、フロー制御を持ったPush型パイプラインを設置する準備は整った。例えば、次のようなコンポネントA, B, Cを考えてみよう。

コンポネントAは、Pull型のストリームからgetcを使って文字を自発的に吸い出す（ポンプの役割だ）。そして、出力先のハンドラーを使って文字を押し込む。また、コンポネントAはフロー制御をサポートしているから、stop/start によって、文字の出力（押し込み）の休止／再開を指令できる。

コンポネントBは、フロー制御付きPush型パイプラインの中継部分になっている。コンポネントBのなかで、例えば大文字→小文字変換（tolower）を行ってもよい。

最後のコンポネントCは出力ポートを持たない。つまり、データストリームの最終消費者ということだ。わざとらしい話だが、Cは小さなバッファしか持たず、画面に非常にゆっくりと文字を書き出すプログラムだとしよう。文字がドンドンやって来ると困るから、Cはフロー制御を使うことになる。

A、B、Cをこの順でつないだパイプラインは次の図のようになる。

7. 「ややこしい点」を整理する

この記事の冒頭で、「Janusの『ややこしい点』とは、コンポネントの“方向” や“順序”のことだ」と述べた。これはホントに間違いやすい。この点をこれから説明する。前節の「コンポネント達」と「パイプラインの図」を見返しながら読んで欲しい。

まず、1個のコンポネントにおいて、入力側と出力側がある。今まで常に、入力側が左、出力側が右になるように図を描いたがいつでもそうとはかぎらない。入力側が上、出力側が下の図もあるだろう。ともかくまずは、1個のコンポネント内の入出力をハッキリと識別する必要がある。

次に、「パイプラインの図」だが、この図にある白抜きの大きな矢印は、パイプライン全体の方向を示している。一方、箱をつないでいる細い矢印はメソッド呼び出しの方向を示している。この細い矢印は‘呼び出し弧’（call arc）と呼ぶ。Janusの特徴は、双方向性を導入したことだから、呼び出し弧の方向は「右から左」と「左から右」が混じる。くれぐれも、“パイプライン全体の方向”と“メソッド呼び出しの方向”を混同しないように。極端な例では、“パイプライン全体の方向”と“メソッド呼び出しの方向”がちょうど正反対になることもある。

それでも、テキストストリームの例では、“パイプライン全体の方向”はキャラクタ・データが運ばれる方向に一致しているから、方向概念はハッキリとした意味を持つ。だが、対等に対話する2つのコンポネントだと、“パイプライン全体の方向”という概念がハッキリしない。だがこの場合でも、絶対に“パイプライン全体の方向”を決めなくてはならない。「AからB」でも「BからA」でも、どっちでもいいからドチラカに決める！そうしないとJanusで採用している構成法や計算法が一切機能しなくなる。

繰り返すが、直感的に明確な意味があろうとなかろうと、「コンポネントの入力と出力」「パイプライン全体の方向」は常に決定して意識しておく必要がある。いいですね。

「パイプラインの図」のような、A, B, Cの直列結合は、数式的表現では、 A;B;C と書かれる。セミコロンが直列結合の演算記号だ。ところが、数学の伝統的記法では、C・B・Aのように逆順で書くこともある。これだと図と向きが反対になる。まれに、C・B・Aに合わせて右から左に向かって図を描く人もいる。上下方向になると、「上から下」と「下から上」が、ほぼ半々という感じ。もう、注意するしか方法がないね。

最後にもう1つ。呼び出し（サービス要求）は、（我々の約束では）電流と同様にプラスからマイナスに流れる。だが、これはコンポネント（箱）の外の呼び出し弧の話で、コンポネント内部では、マイナスからプラスに呼び出しが起きる。これも図を描いてみたら分かる。

8. おわりに

細かい点や微妙な点については、説明を“はしょって”いるのだが、それでも、Janusの輪郭が多少は見えてきただろうか。ここまで読み通した方は、次に予定されている、パイプラインの実例を述べた記事^(*注12)や、Janusの基本概念を整理した記事を読む準備ができたと思う。

Janusは、明確で一般性があるバックグラウンドを持っているから、プログラミング言語、論理、幾何、力学、形式言語理論などとの共通構造が知られている。それら隣接分野との交通路も開きやすい。ところで、このサイトの「主要な話題」を読んだ人は、「いったいこれのどこがXMLなんだ？」と思っているかもしれないが、とりあえずは、「Janusのバックグラウンドは、構文論にも使えるのだ」と答えておこう。