5.1 古典カテゴリ論

事物の分類というテーマは、古代ギリシャ時代から考察されていた。属性の束により、個体あるいは個体の集合を特定する方法は、アリストテレスが体系付けた、とされている。ここでは、アリストテレスの系譜に属すると考えられる分類(範疇化)の理論を古典カテゴリ論と総称する。

古典カテゴリ論によれば、事物は基本的(プリミティブ)で普遍的(ユニバーサル)な属性により特徴付けられる。この考えにおいて、分類を本質的に支える基本的・普遍的属性は、弁別素性(または意味素性)と呼ばれた。カテゴリ、すなわち事物の範囲は、いくつかの弁別素性の値を指定することによって定義・特定される。例えば、既婚で女性である人間は、「妻」というカテゴリを形成する。

オリジナルの古典カテゴリ論は、超越的・思弁的・楽観的に過ぎるが、幾分の修正を施した上で、現代でもなお多用されている。修正された古典カテゴリ論では、属性の「基本的かつ普遍的」という性格(根元性)にこだわらず、名前と値のペアとして属性(または素性)が定式化される。オリジナルの古典カテゴリ論では、属性値はYES, NOを意味する2値的なものだったが、修正版では有限個の選択肢や整数などの値も許容する。先の「妻」カテゴリを、修正された古典カテゴリ論で表記すれば次のようになる。(考える範囲は、人間とする。夫を持つメスライオンは範囲外である。)

    妻:
      性別="女"
      未婚既婚の別="既婚"
 

5.2 現代の古典カテゴリ論

現代の情報技術において、名前と値のペアによる記述や定式化は、きわめて広範囲に使われている。最も典型的な事例は、事物をレコードとして定式化する関係データベースだろう。属性を意味する言葉が、「フィールド」、「カラム(列)」、「プロパティ(特性)」、「メンバ」、「フィーチャ」など、多数存在することも、古典カテゴリ論が情報技術の各分野で採用あるいは再発見されていることを物語る。

一般的に言って、有限個の属性名a1, a2, ..., aNと、それに対応する値v1, v2, ..., vNによって事物の一側面がデータ化される。例えば、"名前"、"性別"、"生年月日"、"住所"という属性名と、それぞれに対応する値により、人物(人物の情報的側面のごく一部ではあるが)を表すことができる。

例:

{名前="鈴木一郎",
性別="男",
生年月日="1972 05/05",
住所="東京都港区麻布1-1-1-1"
}

カテゴリ化のための制約は、属性値に対する単純な条件、属性値間の関係、属性値から抽出・計算される値に関する条件、それらの条件の論理的結合などにより構成される。例えば、「埼玉県に住む20歳以上の女性」というカテゴリは次のような制約により定義される。

カテゴリ化とは「条件による制約」であり、これは言葉を換えれば「検索条件による絞り込み」ともいえる。つまり、古典カテゴリ理論は、レコード型データとその検索として、現代でもほぼそのままの形で活躍している。
 

5.3 属性による分類 -- ラベリング

Webページを分類するとは、Webスペースに検索可能な構造を導入することである。これを実現するために、我々がとりあえず採用できる(安易な、しかし唯一とも思える)方法は、Webページにレコード型のデータを付加することである。 Webページが元来レコード型データではないのは明らかである。よって、レコード型の構造は、意図的に余分な作業により付加せざるをえない。つまり、検索可能性の実現には、Webページの自然な本来的構造とは異質な付加情報を必要とする。

ここでは、レコード型の構造を(Webページに対する)ラベルと呼ぶ。ラベルは、古典カテゴリ論に基づくレコード型データである。Webページの一部として存在するラベルは内部ラベル(埋め込まれたラベル)、外部に存在するラベルは外部ラベル(参照や目録としてのラベル)と呼ぶことにする。内部ラベルも外部ラベルもWebページの特徴付けを与えるメタデータという点では差がないが、この2つはアクセスの手段がまったく異なるし、この差が実現方法や運用制度にも影響する。

内部ラベルは、各Webページの発行者の責任において付加されるので、特定の 管理機構は必要ない。しかし、専門的な見地からの統制されたメタデータとは なりえない。外部ラベルは集中的に管理され、専門家によるラベル付けが行わ れる点において信頼性は高い。しかし、コストが大きく、Webの変動に追従す るのは困難である。

ラベルによる(すなわり古典カテゴリ論に基づく)Webページ分類の試みは、現時点において既にいくつか進行中である。このアプローチは、(おそらくは二千数百年)の利用実績があり十分に信頼できるが、根本的な困難もまた、古代から何の進展もないままである。オリジナルな古典カテゴリ論では、弁別素性は基本的で普遍的と仮定されていた。直感によるか長い分析の結果かはともかくとして、絶対的な弁別素性の組が得られるという前提を置いている。しかし、この前提はナンセンスと言っていいほどに現実性を欠く。

事物を本質において特徴付ける絶対的な素性などは存在しない。少なくとも、誰にとっても明らかで安定した素性の組が容易に見つかるケースは極めて希である。事物を特徴付ける属性の選択は恣意性をまぬがれず、決して小さくはない揺らぎを伴う。現実には、関係する人々の協議と合意によってしか、属性の組を決定することはできない。ときにこの決定は、政治的・権力的な力学により下される。
 

5.4 関係による分類 -- 同類リンキング

属性による分類に対抗しうるとは言いがたいが、関係に基づく分類の手法がある。「AとBは同類である」という関係が定義できれば、同類の関係にある事物たちはカテゴリを形成する。Webページ分類にとって、関係による分類はラベリングより魅力的に見える。ページ間のリンクを関係として捉えて、分類に結びつける可能性があるからだ。付加的な情報、管理機構、強制力を持つ権力を必要とするラベリングに比べ、関係に基づく分類はWebにとって自然にも思える。

しかし残念ながら、リンクをたぐる方法では、安定した有意な分類を提供できないことが若干の考察から導かれる。(安定してなくともよい、ときに有意でなくてもよいという寛大な態度もあり得るのだが。)

最初の問題は、Webリンクには、ブラウザの動作以外には、何の意味も機能もないことである。リンクは、Webページ内から他のロケーションを指す無味・無臭・無色な矢印に過ぎない。矢印の両端がいかなる関係にあるかを明示はしない。この問題のアドホックな解決は技術的には簡単である。「AとBは同類である」という意味を表すアンカーの構文を決めればよい。しかし、「決める」ためには“政治的な”決定を下し、“付加的な情報、管理機構、強制力を持つ権力”を必要とする。

「AとBは同類である」を示すメカニズムが決定したとして、個々のリンクの作成は“恣意性をまぬがれず、決して小さくはない揺らぎを伴う”。関係の種類を増やせば、知識や経験による揺らぎはさらに大きくなるだろう。

関係によりカテゴリが形成されるためには、その関係が、対称的(双方向)かつ推移的でなくてはならない。Webリンクは片方向しか持てないため、「自分がどこから指されているか」は検出できない。このため、リンクをたどることによりカテゴリに属するメンバを網羅できる可能性は低い。

推移性とは、「友達の友達はまた友達だ」を形式的に表現した原則である。同類リンクをたどっているかぎりカテゴリ内にとどまることが期待される。この期待は推移性により保証される。しかし現実には、「友達の友達が赤の他人」になるケースも多い。つまりリンクをたどることにより(意味的な)カテゴリの外部に出てしまうケースがある。最悪のケースは、対象とするWebスペースが単一のリンクカテゴリに落ちてしまうことである。リンクのループが生じないことも保証できない。

一般に、推移性を根拠として同値関係を導入することは、理論的には万全でも 現実性が乏しい場合が多い。リンクを同値関係とみなすには、次の論法が根拠 となる。

これは、リンクのホップ数に関する数学的帰納法である。数学的帰納法が現実 には極めて疑わしいのは、例えば次の議論がナンセンスであることからも明ら かだろう。


5.5 問題点のまとめ

古典カテゴリ論に基づく(ラベリングの)方法でも関係に基づく(リンキングの) 方法でも、分類枠の決定に関する困難は共通している。

属性の過不足が、分類の適切性に影響を与える。 リンクの本質的な性格は、分類に向かない。  

5.6 問題点の(部分的な)対処

ラベリングもリンキングも、広範囲に適用しようとすれば困難が増す。適用範囲の制限することにより、分類枠の合意を容易にし、数量の増大に伴う困難を対処可能なレベルに抑えることができる。

例えば、特定のサイバーモールに出店するショップに対し、出店の条件としてラベリングを強制することはできるだろう。特定の業界団体内の申し合わせにより、統制されたリンクを張ることも可能だろう。制限された範囲であれば、ソフトウェアロボットによるリンクの自動メンテナンスも現実的である。

ただし、整合性を保てる小さな範囲だけに満足することなく、そのような範囲の相互接続を将来的に可能とするため、ラベリングとリンキングに対するフレームワーク的なアプローチも必要と思われる。フレームワークでは、カテゴリ化に必須と思われる一般属性やリンク種別などを最低限定める。フレームワークによる統制は弱いものなので、十全な相互運用を保証するものではないが、無意味な個別性を防ぐ効果はある。

理論的には困難な面があるリンクによる方法だが、実用上ではいくつのメリットがある。ラベリングでは、複数のラベルの値を適正に設定するには、専門的な知識や訓練が必要となることがある。リンクは、必ずしもその根拠を値として示すことは要求されないため、直感的に関連を記述することができる。(リンクの種類の選択は悩むことがあるかも知れないが。)リンクを張る人間が十分な見識を持っていれば、リンクによるナビゲーションはユーザーにとって十分に有意義なものになる。

どのような分類方法、関係設定方法であれ、精度や妥当性にゆらぎがでるのは避けられない。その点を割り切って、リンクを張った人間を信頼すれば、ある程度の実用性が得られる。


[5.目次に戻る] [6.に移る]