一般社団法人 『データで考える力』イニシアティブ

第9回:オントロジー・アルゴリズムとデータマネジメントの可能性について

オントロジーアルゴリズムとは、一言で言えば「わかる」と「分ける」に関する分類の知識表現である。すなわち2つの考え方があるが、一つはいかに自己流のシソーラスを作成し分類軸を持つかという視点と、もう一つはいかに既存のデータを使って、分類するためのシソーラスを活用するかという視点である。

これまでも研究法の研究で述べてきた「分類」「推論」「解釈」のうちで、一番研究プロセスの中で初動で動くデータメソドロジーとしてアルゴリズムなわけである。

研究法の研究の中で磨かれてきたオントロジーという言葉を、哲学的な存在論と認識論において情報学的な目線で概念を捉える時、データをいかに記録して、情報、知識への体系化させる全体的な概念が必要となる。

これまでもデータマネジメントをどのように実践していくかということを本コラムで述べてきたが、特に知識経営における暗黙知(知恵)も含んだナレッジマネジメントとデータマネジメントのレイヤーを挟んだ、情報と知識を包含した体系が必要となる。そこは記録物としての図書が、記録属性としてのメタデータやデータを備えて包含したカタログデータなどといった表現形態によって管理され得るが、このアルゴリズムを DIKWモデルと擦り合わせることで、データ活用の活路を見出そうとするものである。

データマネジメントをナレッジマネジメントと融合させることによってもたらされる意義は、経営学に置き換えて考えるとわかりやすいが、知識経営を実践するために知識資産をどのように有効活用するか、という情報検索システムのあり方がどうあるべきかというテーマに繋がっていき、知識検索システムというものが今後望まれるという帰結に至る。つまりは、記録情報学における知識モデルを分類モデルとして捉えることと同義である。人間が行う分類は、まさにオントロジーアルゴリズムをベースに考えられる。

その際に、知識の表現単位は知識の活用目的によって幾つかの視点を包含する。一つはその領域における事実、もう一つはその事実の属性と相互関係、最後にその知識そのものを取り扱うルールがある。記録から情報を生成する記録情報のアルゴリズム(主題分析)は、何らかの知識モデルのアルゴリズムを通して、ナレッジマップとして表現されていくのである。

ナレッジ(知識)マップのアプローチを取り扱う知識モデルは、以下のようなモデルも存在する。

    • 人工知能の知識モデル
    • 知識工学の知識モデル
    • 認知科学の知識モデル
    • ナレッジマネジメントの知識モデル

ここで私がすでに取り上げているナレッジマネジメントの知識モデルこそが、「ビジネスをデータで考える力」として有意義であると述べたい。もちろん、他の知識モデルもその壮大な世界観を全てファセットで置き換えることも良いと思うが、現実的な解として、本コラムではナレッジマネジメントに絞って考える。

では、ナレッジマネジメント、つまり管理すべき知識資産とはどのようなものであるか?

一般にヒト・モノ・カネ・情報という経営資源がよく言われているが、第五の企業成長の源泉と言われているのが「知識」資産である。

    • 企業の人的な資産(社員の知識・能力)
    • 組織的制度・文化としての資産(伝承されているノウハウ、知覚的能力)
    • 顧客に関わる資産(顧客データベース、顧客が認知した製品の知識、顧客ロイヤリティ)
    • 市場における資産(ブランド、契約関係)
    • 外部の人的な資産(関係企業の人々、外部専門家の知識)
    • 技術・ノウハウ資産(特定分野の技術、開発のためのノウハウ、マニュアル、知識ベース、人工知能などのデータベース)
    • 知的所有権資産(知的保護を受ける知的財産)
    • 情報システム資産(インフラ、知的業務連携)

上記の知識資産をナレッジマップの中で把握することが、今後重要になってくると言えるであろう。

ナレッジマップについて

知識地図
*参照:齋藤孝著(2011)中央大学出版部『「記録・情報・知識」の世界 オントロジーアルゴリズムの研究』より抜粋

ナレッジマップとはオントロジーアルゴリズムを図解したものであり、ナレッジマップを大規模化したものは分類・検索システムであるとも言える。それは分類を図解し、シソーラスの意味をネットワーク構造によって図解したものである。つまり、図をもって理解するから「図解」という言葉がまさにオントロジー的であると言える。

MIT のミンスキーは1975年にフレームモデルという知識モデルを考案したが、情報の単位を最小化して構造化することによって検索に時間がかかりすぎる問題があった。とはいえ、フレームモデルは情報を構造化し、知識として主題単位に図式化され、意味ネットワークとして知識ベースに格納されるものであった。

意味ネットワーク(Semantic Network)について

意味ネットワークは、事実あるいは概念それ自体だけでなく相互関係性を持つものとして考えられていて、ネットワーク構造を持つものとされる。また、知識を継承という概念で引き継ぐことができ、多様な知識の性質を再利用することができる。ただ、これらも限界があり、変数や関数や存在記号などでうまく表現ができないという問題や、概念の取り扱いや動作に関する知識の取り扱いの問題が指摘されている。

これらのナレッジマップを表現する技法自体の課題点を解決したフレームワークが望まれるが、最終的にはナレッジマップの分類・検索システムこそがその出口戦略になり得るのではないかと考えている。つまり、分類・検索システムを通してオントロジーアルゴリズムを具現化することが、ナレッジマネジメントの知識モデルが完成に近づくのはないかと考えている。

オントロジーがインターネットの世界で席巻したセマンティックウェブの世界観から、知識モデルのアルゴリズムを再考したい。

Semantic Web におけるオントロジーは、共有される概念化の形式化と、明示的な条件を満たすことが必要となる。概念化とは対象とする現象の抽象的なモデルのことであり、関係性を明らかにすることでもある。つまりは、その概念形成を意味ネットワークで表現する訳である。そして、形式化とはコンピュータによって RDF などのメタデータでそれを適用し、概念間の定義が明示的になることを意味する。RDF を XML で表現した名前空間でインターネット上の URL の中で記述したりもする。

これらをもとに3層の暗黙知検索の仕組みをデータマネジメントのデータメソドロジーから提言したいと考える。

知識検索システムとしての階層化は、まずユーザーがいて、その先にそれを受け取る ChatGPT のようなフロントエンドのモジュールなり AI なりの存在が必要となる。そこに人間の自然言語による問いかけや知識資産へのアプローチの検索システムのインターフェースがまず存在する。そして、バックエンド側に暗黙知を包含したナレッジマネジメントをするためのデータの溜めどころとしてのストレージ上での DIKWモデルの全階層を検索できる DWH なりのデータ基盤が存在すべきである。

ここで重要となってくるのが、その中間層でエージェントとなり得る存在で、エージェントモジュールが昨今のニューラルネットワークなどで動作する AI によるナレッジを意味ネットワークで表現したものを検索の肩替わりをする、新たな階層の存在が必須となることである。

上記のようなデータメソドロジーを構築することによって、データマネジメントが知識レイヤーまでをも包含するオントロジーアルゴリズムを展開することができ、より多くのデータ活用ができるようになると言いたい。

PAGE TOP