電子辞書の標準データ形式LeXML (IEC 62605)
電子辞書のデータ形式LeXMLについて調べたので,情報として残す。
電子辞書のデータ形式としては,2010年頃まで世界標準となるような形式がなかった。
日本であれば,1990年頃からEPWING (JIS X 4081) があったが,これはあくまで国内でだけ通用するもので,世界で通用するものではなかった。
2011-07-11にLeXMLと呼ばれていたデータ形式がIEC 62605:2011として世界標準に登録された。IECに登録されるまでは,PT62605という名前のドラフトで参照されていた。その後,2016-02-10にIEC 62605:2016としてLeXML v3相当の内容と同期が取られた。
IECへ登録されるまでの経緯は「電子書籍交換フォーマットの現状と標準化」に詳しく書かれている。
LeXML (LEXicographical eXtensible Markup Language) はDigital ASSIST社が提案した,辞書及び時点類の構造化を目的としたXML仕様となっている。
最新版は,2015-09-29のv3.03となっている。Digital ASSIST社のホームページでLeXMLの仕様が公開されている。
LeXMLはXMLにいくつかのルールを決めたものとなっており,電子辞書の交換用データ・マスターデータを念頭にしたものとなっている。その他,配布用に使うことも可能になっている。
仕様自体は,100ページ以内程度で,シンプルなものになっている。
電子辞書のデータ形式としては,長らく世界標準と呼べるものがなく,市販の辞書のデータ形式であるStarDictなどが使われてきた。まだまだ普及してはいないが,今後はLeXML (IEC 62605) を使っていくのがいいだろうと思った。