株式会社データ変換研究所は11月1日、Linux/UNIX対応のテキスト抽出ソフトウェア「DocCat Ver. 4.0」を発表した。
DocCatは、Microsoft Wordなど各種文書データを自動判別し、各種文書ファイルに含まれている文書のうちテキスト部分のみを高精度・超高速にテキス抽出処理を行うソフトウェア。最新版では、抽出処理プロセスの高速化などにより、旧バージョンに比べて約2倍以上の高速化を実現したという。また、対応OSとして新たにSUSE LINUX Enterprise Server 9をサポートしている。
対応文書は、Word、Excel、PowerPoint、一太郎、OASYS、Word Pro、テキストファイル、HTML、XML、SGML、PDF(別売オプション)。対応OSは、Linux、Solaris、FreeBSD。
価格は、DocCat Ver.4.0サーバー(1CPU)が483,000円から。DocCat Ver4.0 PDFオプション(1CPU)が483,000円から。同社では、中規模から大規模な全文検索システムを構築する必要のある一般企業や官公庁などを中心に、年間100サーバーライセンスの販売を目指すとしている。
■ URL
株式会社データ変換研究所
http://www.dehenken.co.jp/
プレスリリース
http://www.dehenken.co.jp/press/doccatV4041101.html
( 福浦 一広 )
2004/11/01 13:10
|