「整形式」とは何か
XMLの仕様書には、"well-formed"とか"well-formedness"という単語が出てきます。英語では一般的な単語で、形容詞"well-formed"の原義は文字通り「形の良い」といった所で、言語学では転じて「適格な」「(理論・体系に)合致した」となり、名詞"well-formedness"は「well-formedである事」らしいのです(手許の電子辞書のジーニアス英和大辞典に拠ると)。XMLを扱う日本語の文書では、"well-formedness"の訳語は「整形式」(「整」+「形式」)と相場が決まっているようです。よって今書いている翻訳版でもこの訳語を使う事にしています。一方、"well-formed"の訳語は「整形式の」が主流なようです。これは、「整形式」という語の組成から──「形式」は名詞であり、そこに形容詞的働きをする(名詞を修飾する)「整」が付いているから──「整形式」は名詞句(あるいは、固有名詞? ちなみに、ここでは「句」をphraseの意味で使います)であり、ここから形容詞を作る為格助詞「の」を使って「整形式の」となったのでしょう。「の」から転じたらしい「な」にも格助詞として似たような意味はあるようですが、「形式」に付くと変な感じがします(恐らく、殆どの人が「新しい形式な文書」や「古い形式な書類」という表現を不自然と感じるでしょう)。
さて、言語学なんてかじった事もありませんが、この記事では(多分)中学校で習った日本語の文法知識と日本人としての経験を基に、僭越ながらこの「整形式」について、というより「整形式」がきっかけとなって考えた事を書き下してみようと思います。
"well-formed"と「整形式の」
形容詞句「整形式の」は、"well-formed"が限定用法で使われている間は役に立ちます。"a well-formed document"は「整形式の文書」でいいでしょうし、"a well-formed parsed entity"は「整形式の解析対象実体」(ここではparsed entityの訳語がこれでいいかどうかについては問題にしません)でいいでしょう。が、well-formedが叙述用法で使われた場合は困ります。"The document is well-formed."は「その文書は整形式の。」……じゃおかしいですよね(当たり前か)。この場合「その文書は整形式である。」が妥当でしょうか。もう少し柔らかくすれば「その文書は整形式だ。」でしょう。今書いている仕様書では使われる予定はありませんが、「です」を使えば「その文書は整形式です。」となります。勿論、これを逆翻訳した時"The document is well-formedness."となる事は期待しません。やはり"The document is well-formed."となる事を期待します(本筋から逸れますが、敢えてwell-formednessを使うなら、"The document has well-formedness."ですかね)。つまり、「整形式である」「整形式だ」は形容詞的な働きをする事を意図しています。
日本語の「である」「だ」「です」
「である」や「だ」、「です」を広辞苑第五版で引いて、関連する言葉と併せて要約してみます。
- である
-
「にて」のつづまった「で」と動詞「ある」が接合したもの。この「にて」の品詞は書かれていませんが、元の「だ」や「である」が断定の意味を持つ事から、助詞「にて」ではなく連語「にて」なのでしょう(連語は品詞の一種じゃないから品詞書いてないんでしょうか)。連語「にて」を見てみるとまた語義が二つありますが、片方は「完了の助動詞『ぬ』の連用形『に』に接続助詞『て』の付いたもの」でもう片方は「断定の助動詞『なり』の連用形『に』に接続助詞『て』の付いたもの」なので、もとめる「にて」は後者でしょう。
活用は動詞「ある」のもの、つまりラ行五段活用、とすると、語幹も含めて書けば「であら・であろ/であり・であっ/である/である/であれ/であれ」となりますが、未然形の「であら」に否定の助動詞「ず」を使うと"The document is not well-formed."に対して「その文書は整形式であらず。」となって変ですね。補助形容詞(なんてのがあるんですね)「ない」を使って「ではない」とすれば自然ですが、これって本当に「である」の活用?
- だ
-
「にてある」から「である」、「であ」、「だ」と転じた助動詞。断定を表す、とあります。
活用は「だろ/だっ・で・に/だ/な/なら/○」。
- です
-
体言や体言に準ずる語句、一部の助詞について、指定の意を表す助動詞。特に、普通に使われる「です」は、「丁寧の意味を込め、指定の意味を表す」ですでしょう。
活用は「でしょ/でし/です/です/○/○」。
つまり、「である」も「だ」も「です」も、直前の語に接続するものは助動詞という訳ですね。
具象名詞と抽象名詞
英語などの助動詞から連想すると、助動詞が付くのは用言だけかと想像されますが、日本語の助動詞は必ずしも用言に付く訳ではないようです(英語などのヨーロッパ言語の助動詞は必ず動詞に付きますよね。「動詞」に意味を付け加えて「助」けるから「助動詞」と言う訳で)。先程取り上げた三つの助動詞は体言や助詞にも付き、実際、「私が太郎の父である。」「これは不良品だ。」「彼らはごろつきです。」という文は名詞に接続していますが、自然に受け容れられます。これらの文は「(代)名詞=名詞」あるいは「(代)名詞の作る集合⊂名詞の作る集合」(場合によっては「(代)名詞∈名詞の作る集合」もあるかも知れない)という構図になっていて、英語に訳せば"I am Taro's father." "This is a defective product." "They are vagabonds."となり、主語も名詞、補語も名詞です。
別の例文を考えてみます。「真理を追究するのに信念は無用である。」「そんな事をするのは無理だ。」「窓から身を乗り出す事は危険です。」を訳すとすれば、それぞれ"Belief is useless to quest for truth." "It is impossible to do such a thing." "Leaning out of the window is dangerous."のようになるでしょう。主語は名詞ですが、補語は形容詞になっています。まあ、必ずしも形容詞にする必要は無いでしょう。例えば最後の例文の訳を"Leaning out of the window is a danger."としても、間違いとは言えません。dangerには「危険なもの、人、事」という可算名詞もあるからです。ですが、それを再び日本語に直訳すると、「窓から身を乗り出す事は危険な事です。」となるでしょう。とすると、これら「無用である」「無理だ」「危険です」は形容詞的なもので、性質の概念を言い換えたいのではなく性質の形容をしたいのだと言えます。もしこれらを概念の言い換えだと解釈すると、その訳語は"usefulness" "impossibility" "danger"(このdangerは不可算名詞のdangerであり、可算名詞ではない)になります。これをそのまま置き換えると"Belief is uselessness to quest for truth." "It is impossibility to do such a thing." "Leaning out of the window is danger."となり、おかしな訳文になってしまいます。beliefはusefulnessの部分集合ではありませんし、to do such a thingでimpossibilityを、leaning out of the windowでdangerを言い換えられる訳でもありません。
さて、このセクションで最初に挙げた例文三つは、主語も名詞、補語も名詞になりました。次に挙げた例文三つは、主語は名詞でしたが、補語は形容詞になりました。ではこのセクションの始まりよりも前に挙げた例文、「その文書は整形式である。」はどちらの型に当てはまるでしょうか。勿論後者ですね。well-formedは形容詞であり、well-formednessは「well-formedである事」という性質の概念ですから、"The document is well-formedness."とするとthe documentが概念well-formednessの部分集合あるいは言い換えのように聞こえます。「整形式である」とか「整形式だ」というのは、性質を形容したくて使うのですから、それには形容詞well-formedを使う訳です。「整形式」を単独で使えば、性質の概念と言えそうです。
性質の概念の修飾
さて、ここまでの性質の形容は叙述的でした。では、性質の形容を限定的に表す場合、つまり体言を修飾する場合はどうなるでしょう。適当な言葉を考えてみると、「無用な心配」「無理な要求」「危険な賭け」は自然な日本語として受け容れられそうです。それもそのはず、「体言の後に付けて、その状態にある事を示す」事もある助動詞「だ」は、「だろ/だっ・で・に/だ/な/なら/○」と活用する為、その連体形「な」を使って、「無用」+「な」+「心配」、「無理」+「な」+「要求」、「危険」+「な」+「賭け」とする事ができる訳です。「です」の連体形を使うと変な感じがします(広辞苑第五版には「です」の連体形が載っていますが、明鏡国語辞典には「です」の連体形が載っていないのはこの為でしょう)が、「である」の連体形「である」を使っても、そんなに不自然には感じません。と言う事は、性質の概念であろう「整形式」も、「だ」や「である」を活用させて限定的な修飾ができるはずです。とすると、"a well-formed document"の訳語として「整形式な文書」は自然な日本語として受け容れられ……、ますか? 少し変な感じがします。この事は冒頭でも触れました。「形式」に助詞「な」がつくとおかしい、例えば「新しい形式な文書」や「古い形式な書類」はおかしな感じがします。でも、先程述べたように、今回の「整形式な文書」に含まれる「な」は、助詞ではなく助動詞「だ」の活用形のはずです。「整形式」は性質の概念のはずですから、「無用」「無理」「危険」のように、「だ」の連用形「な」を付けて繋いでもおかしくないのが普通でしょう。何故矛盾するのでしょう?
「整形式だ」と「整形式の」の間の壁を解消する解釈
実は、この矛盾は当たり前の事です。何故って、語の組成の時は「整」に「形式」を修飾させ、"a good form"というような作り方をしたのに、その意味は「整った形式である事」、つまり"well-formedness"にしてしまったからです。語の組成に使われた「形式」という日本語は「外面に現れる形」、つまり英語の"form"の主な語義とほぼそのまま対応します。「形」は勿論性質ではありません。しかし、「この文書は新しい形式だ。」と言う事もあります。これは、「この文書は新しい形をしている。」「この文書は新しい形式を持っている。」というように解釈される事を意図した、言わば省略された文です。「文書」が「新しい形式」そのものではないでしょう。また、「新しい形式の文書を解析できるプログラムはまだ無い。」という文も自然に聞こえます。これも「新しい形をしている文書を解析できるプログラムはまだ無い。」などのように解釈される事を期待しているのでしょう。でも、助詞「な」を使って「新しい形式な文書を解析できるプログラムはまだ無い。」とした文書は奇妙です。文法的には助詞「な」は助詞「の」の転なので問題無いのでしょうが、普通は使いませんよね。助動詞「だ」の連体形「な」を使ったと考えても、「新しい形式な文書を解析できるプログラムはまだ無い。」は変です。「形式」は性質ではないので、「この文書は新しい形式だ。」という文は「この文書」が「新しい形式」という状態ならぬ状態にある事を示すのではなく、「この文書」が「新しい形式」という「もの」そのものを示すのでもなく、「この文書は新しい形式を持つものだ。」という文の省略形である事を示すからです。名詞「形式」と助動詞「だ」は繋がっているように見えて、実は繋がっていないのです。だから、あたかも直接繋がっているかのように助動詞「だ」を活用すると変なのでしょう。
「整形式」の場合も「形式」と同じように、「その文書は整形式である。」と言った場合、「その文書は整った形をしている。」「その文書は整った形式を持っている。」と解釈されるべきもの、つまり「その文書は整形式を持つものだ。」という文の省略形である事を示唆するでしょう。そして、「整形式の文書」と言う時は、「整った形をした文書」「整った形式を持つ文書」と読まれる事を期待します。……あれ、では何にも問題は無い?
「整形式」と"well-formedness"
いや、いや、一つあります。「整形式」を「形式」の一つとしてしまえば、その訳語は明らかに"a good form"になります。「整った形式を持つという性質」でなければ"well-formedness"にはなりません。英語で"well-formedness constraint"と表される句を「整形式制約」と訳すのは飛びすぎではありませんか?
現存するXML関連の文書との協和を重視するなら、「整形式」という言葉は残すべきなのでしょう。"The document is well-formed."の訳文に「その文書は整形式である。」を使い、"a well-formed document"の訳語に「整形式の文書」を使い。ただ、"well-formedness"に対しては、性質を表す名詞「整形式性」を使うべきだと思います。
でも、ほんとは
本当の所を言うと、"well-formed"や"well-formedness"の訳語に、名詞「整形式」は使わない方がいいと思っています。「その文書は整形式である。」や「その文書は整形式だ。」という文は誤解されやすく、何より「整形式」という言葉が性質でない以上、普通に連体形に活用させて修飾する事が不自然になり、「整形式の」という例外を生んでしまいます。性質を表していてかつ誤解される恐れの少ない言葉を新しく考えるのは難しいとは思いますが、例えば……
- 形容動詞「整形式だ」
-
助動詞「だ」から、「体言の後に付けて、その状態にある事を示す」語義を奪い、形容動詞という品詞を確立させて「整形式だ」を造るという案。名詞「整形式」は廃し、性質を表す名詞「整形式性」を導入します。形容動詞「整形式だ」の語義は「形が整っている。形が良い。」事とか、XMLの仕様書を示して「この仕様書に書かれている全ての整形式性制約を満たす。」事とし、名詞「整形式性」の語義は「整形式である事。整形式さ。」とします。"The document is well-formed."の訳文として「その文書は整形式だ。」を、"a well-formed document"の訳語として「整形式な文書」を、"well-formedness constraint"の訳語として「整形式性制約」を使います。
ついでに、性質を表す名詞「無用」「無理」「危険」や、その他「簡単」「困難」「静か」「穏やか」「綺麗」「勤勉」「怠惰」などはそれぞれ形容動詞として、性質を表す以外の意味が無い名詞(「簡単」とか、「静か」とか。「無理」や「危険」などは、「無理な事」「危険な事」などという意味もあるのでなくすとまずい)については元の名詞を撤廃してしまえばいいと思うんですけどねえ。(日本語についての)言語学を知らないので、形容動詞を品詞として確立する事の弊害も知らないんですが、どうなんでしょう。というか、日本語の助動詞って本当に助動詞? (参考:助動詞のない文法)
- 形容動詞「整式だ」
-
いっその事、「形式」とか「整形」とか、辞書に別の項目で載ってしまうような単語を入れるのではなく、普通人が見たら辞書をその言葉全体で(この場合「せいしき」で)引こうとするような単語にする案。「整形式」を「整式」に変える他は、形容動詞「整形式だ」と同じ(つまり、名詞「整式性」も造ったりする)。
代数学の専門用語に既に名詞「整式」がありますが、これも専門用語だから誤解される恐れは少ないでしょう。
- 形容動詞「式整だ」
-
造語なのだし、既存の単語に拘らず、漢字の意味と、意味の流れを重視して造った案。「整形式」を「式整」に変える他は、形容動詞「整形式だ」と同じ。
はしがき
この記事は考えながら書いたので、ちょっと冗長かも知れません。もう少し考えがまとまったら、書き直すかも。
現在、2.4 Character Data and Markupの頭。この記事を書いていたら大分時間を食ってしまいました。にしても、XMLの仕様書って流し読みとか拾い読みには向いてないなあ。と、通し読みしながら思った。