NRI、新聞などから企業活動情報を抽出する技術を開発


 株式会社野村総合研究所(以下、NRI)は5月26日、テキスト文書から企業活動に関する情報を抽出する技術を開発したと発表した。

 同技術は、新聞記事などのテキスト文書から、製品販売・生産・研究開発などの企業活動に関するメタデータを自動抽出するもの。抽出したメタデータによって、意味や概念を指定した企業検索や分析が可能となり、従来は人でなければできなかった企業に関する情報整理・構造化が自動で行えるという。

 具体的には、企業活動のメタデータを「主体企業」「活動」「目的語」の形式で自動抽出する。例えば、「液晶テレビ」を「販売」している企業を探す場合は、「A社」「販売」「液晶テレビ」という形式で情報を抽出。さらに本エンジン内部には商品や技術用語に関する概念辞書を保有しているため、単に文書に表記されている文字列ではなく、同義語や類義語、表記ゆれを吸収した「概念」としてデータを保持することが可能。その結果、特定のキーワードだけではなく、関連したキーワードを含めた検索結果が得られるという。

 さらに例を挙げると、「燃料電池」を「研究開発」している企業、目的の企業と「業務/資本提携」している企業の検索や、「エコカー」に関する企業動向を整理して表示、といったことが可能。こうして抽出された企業活動データベースをほかの企業データと組み合わせることで、企業活動の可視化や業界動向分析が行える。さらにNRIでは、企業リスク管理などの高次な加工分析アプリケーションへの応用も検討。同技術を企業内における情報整理や分析業務効率化のためのITソリューションとして、幅広く提供していく予定とのこと。


(川島 弘之)

2009/5/26 17:24