電子辞書の標準データ形式LeXML (IEC 62605)

電子辞書のデータ形式LeXMLについて調べたので,情報として残す。

電子辞書のデータ形式としては,2010年頃まで世界標準となるような形式がなかった。

日本であれば,1990年頃からEPWING (JIS X 4081) があったが,これはあくまで国内でだけ通用するもので,世界で通用するものではなかった。

2011-07-11にLeXMLと呼ばれていたデータ形式がIEC 62605:2011として世界標準に登録された。IECに登録されるまでは,PT62605という名前のドラフトで参照されていた。その後,2016-02-10にIEC 62605:2016としてLeXML v3相当の内容と同期が取られた。

IECへ登録されるまでの経緯は「電子書籍交換フォーマットの現状と標準化」に詳しく書かれている。

LeXML (LEXicographical eXtensible Markup Language) はDigital ASSIST社が提案した,辞書及び時点類の構造化を目的としたXML仕様となっている。

最新版は,2015-09-29のv3.03となっている。Digital ASSIST社のホームページでLeXMLの仕様が公開されている。

LeXMLはXMLにいくつかのルールを決めたものとなっており,電子辞書の交換用データ・マスターデータを念頭にしたものとなっている。その他,配布用に使うことも可能になっている。

仕様自体は,100ページ以内程度で,シンプルなものになっている。

電子辞書のデータ形式としては,長らく世界標準と呼べるものがなく,市販の辞書のデータ形式であるStarDictなどが使われてきた。まだまだ普及してはいないが,今後はLeXML (IEC 62605) を使っていくのがいいだろうと思った。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です