ニュース

古文書の崩し字、あなたも読めます 画像から似た字検索


画像の似ている度合いを機械的に判断するため、人の目には似ていると思えない文字が示されることがあるそうだ。
これはシステムの精度が悪いということではな。
長い間判読できなかった文字がこのシステムのおかげで判別できた例があったそうだ。
なかなか面白い試みだと思う。

  • 崩し字の解読システムの仕組み



古文書の崩し字、あなたも読めます 画像から似た字検索
朝日新聞デジタル 3月27日(日)17時9分配信
 読めない崩し字を解読します――。漢字の画像を入力すると、木簡や古文書の中からよく似た字を探し出してくれるシステムの運用が25日、始まった。奈良文化財研究所と東京大史料編纂(へんさん)所が共同で開発。そうしたシステムは初めてで、研究者だけでなく、一般の人もインターネットで無料活用できる。
 両機関はこれまで、漢字入力によって木簡や古文書の文字を検索できる、二つのデータベース(DB)を共同で運用してきた。
 今回、それらのDBを援用。知りたい漢字1文字をデジタルカメラで写すなどして画像ファイルにし、ホームページ(HP)の所定欄に入れると、似た漢字の画像と出典、楷書体の漢字が表示される仕組みだ。
 収録しているのは、主に奈良時代の木簡の約650字(画像数5166)と、奈良〜江戸時代の手紙や記録、書物などの約5800字(同2万4296)。代表的な漢字を選んだという。
 「似ている度合い」を機械的に判断するため、人の目では似ているとは見えない字が示され、判読につながる可能性があるという。例えば、平城京にウリを届けた内容の木簡にあった「丁」に続く文字は長らく判読できなかったが、このシステムを使うと「仕」が示され、雑役を担う「仕丁」の意味らしいとわかったという。
 編纂所の井上聡助教は「古文書の読解に取り組む方々から問い合わせを頂くこともあるが、なかなか応じきれなかった。最先端の研究から趣味まで、広く役立つと思う」と話す。
 HPのURLは、http://mojizo.nabunken.go.jp/(栗田優美)
朝日新聞社
最終更新:3月27日(日)18時22分