Enterprise Watch
最新ニュース

富士通、文字コードの差異を吸収する文字管理ミドルウェアを説明

「JIS2004の登場で文字環境はさらに複雑化」

ソフトウェア事業本部 データマネジメント・ミドルウェア事業部 第一開発部の野島伸一部長
 富士通株式会社は12月7日、文字管理ミドルウェア「Interstage Charset Manager(ICM)」に関する記者説明会を開催。Windows Vistaで採用された文字コード「JIS2004」の登場で、さらに複雑となった文字コード運用に対する富士通の取り組みが説明された。

 ICMは、SOAを支えるInterstageファミリーの中の“文字運用基盤”となる製品。ひと言でいえば、「OSやシステムごとの文字の違いを吸収するミドルウェア」(ソフトウェア事業本部 データマネジメント・ミドルウェア事業部 第一開発部の野島伸一部長)である。

 日本の漢字には、同音異字が多い。代表例には「わたなべ」の「辺」という文字があるが、この1字をとっても何通りものパターンがあり、名字を書く際に神経をすり減らした経験が誰しもにあるはずだ。この文字には、目を凝らして見比べないと違いが分からないようなものが10種類以上も存在し、非常に紛らわしい状況となっている。

 紛らわしいだけならまだいいが、問題は10種類以上も存在するうち、一般のPCで扱えるものが4つしか存在しないということ。これではITが社会に浸透した現在、情報をやり取りする上で名前すら満足に扱えない。そこで日本では、富士通をはじめとした日立、NECなどの各社が独自にJIS規格を拡張して、一般的ではないものを「外字」として定義することで対応してきた。

 これにより、IT環境の中で外字を扱うことができるようになった一方、不足文字を各社が独自に拡張してきたことで、同じ文字でもデザインや種類、コード上での配置が異なるなどの混乱を招く結果にもなってしまった。

 野島部長は、「保険・金融、私立学校などでは、外字は外字のまま利用するのが常識化している。これらの分野では“渡邊”は“渡辺”ではなく、“渡邊”と正しく表記しなくてはならない風潮なのだ」と説明。このためユーザーは、「文字化けを防ぐための対処や目的の文字が探せない、文字がWebブラウザ上で正しく表示されないなどの問題に直面している」(同部長)と語った。

 こうした混乱にさらに追い打ちをかけたのがJIS2004。この新しい文字コードでは、一部の文字の変化や新漢字の追加、さらには4バイト文字の採用など、「ある意味、文字コード運用をさらに複雑にするとして、一時、物議を醸し出した文字コードである」(同部長)。これまでの混乱に加えJIS2004が登場したことで、Windows Vista/XP間ですら、すでに非互換となるなど、文字コードの問題は複雑化してしまっているのだ。


文字にまつわる問題-必要な文字がPCで扱えない 文字にまつわる問題-各社が独自に拡張したため、外字の仕様が複雑に 文字にまつわる問題-4バイト文字も存在するJIS2004の登場で、文字環境はさらに複雑化

Interstage Charset Managerの概要
 そこで富士通が提供するのがICM。こうした複雑な文字コード問題を吸収するソリューションである。具体的には、複数のシステムで管理されている別々の文字資源を中央に配置されたサーバーで集中管理。一般的な辞書のほか、約9万語の外字データ集を搭載し、クライアントPC上での文字変換処理をすべて代行することで、OSなどによる文字の違いを吸収することが可能になる。最新版のICM V9.0では、JIS2004にも対応するのが特長。

 例えば、WebフォームでJIS2004で新たに追加された文字を入力したとしよう。システム側でJIS2004に対応していない場合、入力変換をすると同時にクライアント上で入力が制限されて、XPで使用されていた文字に自動で置き換えることが可能。JIS2004の追加文字をコピー&ペーストしてサーバーに送信しても、サーバー側でチェックをして想定外の文字の侵入を阻止することもできるという。

 こうしてあらかじめ使用可能な文字コードやフォントを集中管理しておくことで、バックエンドシステムへ機種依存文字などの危険な文字を送信するのを防ぎ、安全な文字のみで運用することが可能になるというわけだ。

 そのほか、簡単な外字検索・登録機能も備える。「市町村などで珍しい名前の住民情報を登録する際に、従来は膨大な紙ベースのコードブックから必要な文字を探しだして入力するといったことを行ってきたが、この手間が省ける」(同部長)とのこと。さらに、Web入力機能により、文字がWebブラウザ上で文字化けするといった問題も解消し、エンドユーザーにとって使いやすい入力環境を提供することも可能になる。

 価格は、集中管理用の「ICM Standard Edition」が50万円(税別)から、外字データ集の「ICM 外字データライブラリオプション」が180万円(同)から。Web入力機能を実現する「ICM Web入力 Agent」が140万円(同)から、など。


クライアントPC上で文字変換した際に制御がかかる 機種依存文字をクライアント、サーバー両方でチェック。クライアント上ではAjaxを利用するため、特別なソフトをインストールする必要はない エンドユーザーにとって使いやすい入力環境を提供


URL
  富士通株式会社
  http://jp.fujitsu.com/


( 川島 弘之 )
2007/12/07 16:14

Enterprise Watch ホームページ
Copyright (c) 2007 Impress Watch Corporation, an Impress Group company. All rights reserved.