Home » General, UserInterface

TAGによる新しい分類。あと少し!!

2006/05/03

「Tagによる分類はデジタルならではの新しい分類である。ただし、あとちょっと足りない気がする」
という勝手な仮説のもとTAGによる分類の可能性について考えてみたいと思います。

本を分類する

図書館などでは資料分類法を利用しています。最終的に分類されている方法にはいくつかの手法があるのですが、基本理念としては「区分の原則」というものに従っていくことになっているようです。まずはこの「区分の原則」について簡単に触れてみたいと思います。「区分の原則」ですが下記のようなものがその原則になります。

一貫性の法則

各段階における区分原理はただ1つでなければならない。さもないと交差区分となる。

例えば、「色」という分類方法の下に「形」という分類方法を作ってしまった場合、赤だけど形は丸で…でも丸は青の下にあるから…なんてなってしまうわけです。だから「色」で分類をするなら、「赤系」の下に「ピンク」と「赤」があるなど、細分化していく分類をしないとおかしくなってしまうということですね。

相互排除の原則

区分肢は互いに排他的でならなければならない。

上記と同じように「色」で区分を考えた場合に、「暖色系」というものと「赤系」という分類を作ってしまった場合、「赤」はどちらにも属してしまうことになります。区分の法則においては1つのカテゴリに属すことが前提なのでおかしくなってしまうわけです。

一致の原則

区分肢は全ての場合を網羅する。

これも「色」で考えた場合、全部の「色」を網羅できるように区分を用意しておらず、例えば「青」が無いなどがないようにしましょうということですね。

漸進の原則

区分は順序どおりに上位概念から下位概念に進むべきである。また、飛躍してはならない。

これは複数階層にまたがる場合は上から下に大きな概念から小さな概念になっていきましょうということです。

図書館で行われている分類はデューイ十進分類法(DDC)をいくつかの方法があるようですがどれも上記原則は乗っ取っているようです。実はこれがTAGによる分類を考えた場合に、考えなくてもよい原則となってくるのです。

なぜTAGによる分類は新しいか。

前述の通り、資料分類法は「区分の原則」を基に考えられています。これは昔から考えられていたものでそうそうに考えを変えられるものでもありません。しかしながらTAGによる分類はその「区分の原則」に従わなくても分類ができることに大きなアドバンテージがありました。

下記は簡単に抜粋したTAGによる分類の特徴です。

  • 1つの分類対象に対して、複数の分類項目(TAG)を設定できる。
  • 複数項目を設定でき、新しいTAGを個人が作り出せる。
  • 複数観点からの検索が可能なため、特に「漸進の法則」に従う必要がない。

複数の分類項目(TAG)を設定できる。

これはデジタルならではの分類の考え方になると思います。通常、本を分類する場合、分類対象である本は物理的に1つなので複数の分類項目に分類されることはありません。実はこれが出来ることによって分類の原則の「一貫性の法則」および「相互排除の法則」は成り立たなくなります。

というのは「一貫性の法則」は分類対象に対して1つの項目が割り当てられるというのが前提ですので、そもそも複数できることで一貫性はなくても良くなってしまうのです。また、「相互排除の法則」ですがこれはそもそもが「相互排除」なので複数設定できるということで排除はできなくなってしまいます。

このような複数分類項目を設けることで、複数視点からの検索が可能となります。例えば「チワワ」を分類する場合、区分の原則にのっとると、「犬」の下にある「チワワ」のカテゴリに分類されます。しかし、TAGによる分類では「犬」「チワワ」のほかに「茶色い犬」や「ア○ム」のどのカテゴリにおいても存在することができるのです。

新しいTAGを個人が作り出せる。

通常の本の分類などは、既に全ての分類項目が決まっています。これは有識者などによって「一致の原則」にのっとって作られているものです。よって、あとは本の内容を加味して分類をおこなっていくわけば良いわけです。

TAGによる分類については、分類をしようと思った人間が任意でタグを設定していくことができます。これは「一致の原則」を真逆でいくようなもので、数限りなく分類項目を広げていくことができるわけです。

これがTAGによる分類がフォークソノミーと呼ばれる由縁の1つでもあります。(ここでは深く触れませんが…)

特に「漸進の法則」に従う必要がない。

「区分の原則」に従った場合、「漸進の法則」に従って分類をするのですが、あまり関係がありません。例えばサルは「動物界>脊索動物門>脊椎動物亜門>哺乳綱」といった感じで分類されているわけです。つまり上位から順番に分類をされているわけです。

TAGの場合はこの上位・下位概念がありません。全ての分類項目は並列で登録されていることになるのです。もし、サルがTAGによって分類されていたら「動物界」「脊索動物門」「脊椎動物亜門」「哺乳綱」は別々のTAGとして登録されているかもしれません。

これが上位・下位概念が無い、「斬新の法則」に従う必要がない理由です。ただし、そうは言ってもという部分については後述します。

TAGをどう検索するか

情報を分類は「検索」があって本来の機能となります。ということでTAGの検索について考えてみたいと思います。

  • Googleライクなキーワード検索。
  • 動的に変化のできるデジタルデータならではのTAGCloud。
  • 通常の分類について資料分類法が適用できる。

Googleライクなキーワード検索

別にGoogleでもYahoo!でも良いのですが、METAキーワードがデジタル化されていることで、いわゆるフォームにキーワードを入力して表示ということができるわけです。

TAG を付与しておくことで何が可能かというと、直接検索対象に含まれていないが、結びつくであろうキーワードを付けておくことができることでしょうか。いまはやりの「WEB2.0」についての文章を記述していたとしても、その文章に「WEB2.0」が含まれていないとその文章だけを検索対象とした場合に「WEB2.0」では検索されません。TAGとして「WEB2.0」を付与しておくことで、「WEB2.0」でも検索させることもできるようになります。

TAGCloud

TAG検索から生まれた検索の1つに、TAGCloudというのがあります。↓はhttp://radar.oreilly.com/ で表示されているTAGCloudです。

060503001.gif

これはTAGの登録具合によって大きさを変えて表示しているものです。TAGのそれぞれのキーワードを大きさによって変化をつけることで、雲っぽい感じなるのでTAGCloudなんですね。例では「Google」が頻出しているようです。

この表現方法は登録されている単語をザーッと並べてり多く登録されている単語などを探すときに役に立ちます。

通常の分類について資料分類法が適用できる。

さんざん資料分類法に沿わない分類ができると記述していますが、資料分類法を適用することも可能です。それはTAG自体を資料分類法によって分類する方法です。

TAG を資料分類法によって、上位から下位に流れるような検索もできるようになります。資料分類法だけで分類してしまった場合は、グルーピングをする概念が1つだけに限定されてしまいます。それがTAG自体をグルーピングすることでいくつかの方法でグルーピングすることができるようになるわけです。

実際に資料分類法のような形でTAGを分類しているところを見たことはないのですが、そういった分類もできるということです。

TAGによる分類がなぜあと少しか。

TAGによる分類は分類と検索の両方にうまく対応した、非常に良い分類方法だと思います。但し、あと少しと感じる部分もあります。

  • 分類項目のムラと揺れ
  • 大量のTAGの登録によるTAGCloudの検索性の低下

分類項目のムラと揺れ

これは複数人で登録した場合に特に起こりえる問題だと思いますが、同じように分類できる項目を違うように分類するようにできてしまうわけです。それが利点といえば利点なのかもしれませんが、そこでムラが出てしまうのも確かだと思います。

例えば「WEB2.0」に関する文章を分類する場合、Aさんの場合は「WEB2.0」と登録するかもしれません。しかしBさんは「WEB」と「2.0」を分けて登録するかもしれません。こうするとAさんが分けたものとBさんが分けたものでは、内容自体は同じようなカテゴリに分類されるようなものであっても、実際のTAG上では別のものに分類されることになります。

また、表記の揺れについても同じことが言えます。「WEB2.0」も「WEB_2.0」や「WEB20」も「Web2_0」などいった表記ができるかもしれません。これらも基本的には別のTAGとして登録されていまいます。つまり同じカテゴリとして分類対象をグルーピングできないのです。

この問題は個人で分類される場合でも同じようなことが起きえるのではないでしょうか。同じようなドキュメントをTAGによって分類する場合も、記憶があいまいなため、必ず過去の似たような文章と同じタグを付与できるとは限らないのです。

こういったTAGを付与する際のムラや揺れを解決することがTAGによる分類をさらに良いものとしていく1つの方法だと考えます。

大量のTAGの登録によるTAGCloudの検索性の低下

TAGCloudの仕様などといったものは特に規定されているわけではないので、実際は設計者によって変わってくるわけですがTAGCloudも登録されているTAGが多くなり、それをズラッと並べてしまうとそこから単語を拾うのは難しくなってきます。

この辺りはdel.icio.usで提供されているような分類機能やフィルタリングできるツールのようなものがあると良いのかもしれません。

最後に

長々と書いてしまいましたが、別に自分は司書でもなければ分類の専門家でもないのであくまで一側面として見た場合のTAGによる分類の有効性を考えてみたものと捕らえていただければと思います。

TAGはこれからブラッシュアップして利用していける分類方法だと思っています。多分、他にもTAGの活用方法はあると思いますので、その辺りは今後すこしずつ思いつきしだい書いていきたいと思います。


Tags:



Comments are closed.