Enterprise Watch
最新ニュース

米IBM、非構造化データ検索技術をオープンソース化


 米IBMは8月8日(米国時間)、文書や他のコンテンツ内のテキストを分析して潜在的な意味や事実の関連性を見つけ出す技術「Unstructured Information Management Architecture(UIMA)」をオープンソース化する計画を発表した。年内にオープンソースプロジェクトの管理サイト、SourceForgeでUIMAのソースコードを開示する。

 UIMAは、IBMの研究所と米国防省の国防高等研究事業局(DARPA)が4年前から共同で研究・開発を進めてきた技術。プロジェクトでは、文書、画像、コメントやノート、電子メール、リッチメディアなど、非構造化データに含まれるテキストを分析して、潜在する意味や関係、事実を理解することを目指している。

 米Googleや米Yahooなどの技術はキーワード検索技術だが、企業内データの多くは非構造化データであり、そうしたデータを文脈に応じて検索する技術へのニーズは高い。IBMでは、UIMAによって検索を効率化できるだけでなく、分析ツールへの適用でさらに高度なデータの利用が可能になるとみている。

 IBMによると、UIMAは標準的なインターフェイスを採用したオープンなソフトウェアフレームワークであり、各種アプリケーションに柔軟に組み込めるという。これにより、さまざまなベンダーが提供する業務アプリケーションに分析ツールを容易に統合できるほか、非構造データを管理する分析ソフトウェアコンポーネントの作成や再利用も容易に実現するという。

 IBMは、UIMAをオープンソース化して、非構造化データ検索技術の業界標準とすることを狙う。すでに、BI大手のカナダCognosなど15社以上が自社ソフトウェアに採用することを表明しているという。

 UIMAは、すでに「IBM WebSphere Information Integrator OmniFind Edition」「IBM WebSphere Portal Server」「Lotus Work Place」に搭載されており、同社の新技術情報サイト、IBM AlphaWorksでダウンロードが可能。



URL
  米IBM
  http://www.ibm.com/


( Infostand )
2005/08/09 09:07

Enterprise Watch ホームページ
Copyright (c) 2005 Impress Corporation, an Impress Group company. All rights reserved.