Enterprise Watch
最新ニュース

三菱電機、学習型フィルタを用いて機密情報を検出するソフトを開発

2009年度内の事業化を目指してシステム開発を継続

機密情報自動検出ソフトウェアの適用例

学習型フィルタによって高精度な検出を実現したほか、導入・運用時の手間も削減できるという
 三菱電機株式会社は3月25日、機密文書を高精度に識別する「機密情報自動検出ソフトウェア」を開発したと発表した。人手による複雑な条件設定を介さずに、高精度な検知を行える点が特徴。今後、三菱電機ではこのソフトを活用したシステムを開発し、2009年度内に製品化する予定という。

 機密文書を見分けて社外への流出を防止するソリューションは、現在でも数多く提供されているが、そのほとんどはキーワード検索とフィンガープリント技術のいずれか、ないしは双方を活用しているのが現状だ。しかし、「キーワード検索では、高い検出精度を得るのに必要なキーワードをどう選ぶかが難しく、またフィンガープリントでは、登録した文書、もしくは一部を改変した文書の検出のみが可能」(情報技術総合研究所 ビジネスプラットフォーム技術部 撫中達司部長)と、両方式とも課題を抱えた状態だという。

 そこで三菱電機では、キーワード検索と学習型フィルタを併用するソフトにより、検出漏れと誤検出の少ない、高精度な文書検出を実現した。その中で大きな役割を果たしている学習型フィルタでは、機密文書と非機密文書の双方から、文字列の出現頻度を統計的な特徴として学習する仕組みを採用。「人間の目で見れば類似していると思えるのに、登録文書と一致していないためフィンガープリント方式では検出できなかったものも、新たに見つけられるようになった」(撫中部長)という。

 また、キーワード検索のみで文書検出を行う場合は、相当数の単語を事前に登録しないと検出率を高められなかった。このため、機密情報の特性を理解した人間が、検出に必要なキーワードを部署ごとに洗い出す必要があり、容易に導入することは難しかったとのこと。しかし学習型フィルタを併用する場合は、統計的特徴を自動学習して検出するので、「(補完的に用いる)キーワード検索で登録するキーワードは、かなり少なくて済む」(撫中部長)ことも大きなメリットだとした。


フィンガープリント方式と比べ、広い範囲の機密情報を検出できる 情報技術総合研究所 ビジネスプラットフォーム技術部 撫中達司部長

99.9%の高い検出率を実現
 具体的な効果としては、キーワード検出法式の正規表現フィルタを利用していた従来が89.7%の検出率だったのに対し、99.9%の検出率を実現。一方で機密文書でないものを誤って検出してしまった割合は、従来の3.6%から1.3%へ減少していると説明している。

 なお、学習型フィルタにきちんとした効果を発揮させるためには、運用前に機密文書、非機密文書のサンプルを、保護したい分野ごとに登録し、フィルタエンジンに学習させておく必要がある。撫中部長によれば、「精度を得るためにはサンプルが多い方が望ましく、上記の検証時は1万3000のサンプルを利用しているが、500を超えたところくらいから効果がほぼ飽和するため、そのくらいの数でも効果は期待できる。また運用中も学習は継続されるため、効果は上がっていく」とのことである。

 三菱電機では、今回開発されたソフトをベースに、さまざまなシステムに組み込んで製品化したい考え。例えば、メールに含まれる機密情報を検知するシステム、PCやサーバー内の機密文書ファイルを検知するシステムなどが検討されており、2009年度内での事業化を目指して、製品開発を続けていくとしている。



URL
  三菱電機株式会社
  http://www.mitsubishielectric.co.jp/


( 石井 一志 )
2009/03/25 14:33

Enterprise Watch ホームページ
Copyright (c) 2009 Impress Watch Corporation, an Impress Group company. All rights reserved.