古文書/くずし字をアプリ(みを、ふみのは)で解読、その正解率は?

古文書解読検定というのもある。

古文書解読検定 – あなたの解読力のレベルがわかる

3級、準2級、2級は1ヶ月かけて自宅で解くことができる。

 3級  4000円 全受験者の上位8割以上の成績 
準2級  5000円 上位7割以上
 2級  6000円 上位6割以上
準1級  8000円 上位5割程度
 1級  9000円 上位3割程度

合格判定は受験者の成績に応じて変わる相対評価になってる、何だそりゃ。

これ今の時代はAI使って解いたら簡単なんじゃねww

 

以前のAIの状況を調査した。

古文書読解に必須の「くずし字」を読む方法(アプリ&講習)
古文書を調べるにあたって裂けて通れないのが「くずし字」。今年扱った古文書には「くずし字」で書かれたものはなかったが、いつも読めずに苦労する。時々、古文書調査をしているものだから「ヘ...

あれから2年、大幅なアップデートを期待。

そもそも江戸時代が終わったのは160年前。その時代の文書すら読めない日本人って……

と思ったけど、当時は庶民は「くずし字」で言葉だと学んだからっぽい。逆に楷書は読めなかったとか……。

スポンサーリンク

AIくずし字認識スマホアプリ編

昨年、真打ちアプリが登場した。

2021年 みを(miwo)

2021年8月30日、Android版とiOS版のアプリが無料公開された。

開発者は特任助教である「カラーヌワット タリン」氏で、Kaggleくずし字認識コンペのホストであり国立情報学研究所特任研究員。

みを(miwo):AIくずし字認識アプリ

このアプリは世界初のAIくずし字認識アプリであり、2022年度グッドデザイン賞を受賞している。

なお2022年10月26日にバージョンアップして「1.1」となったが、そもそもアルゴリズムを国立情報学研究所が作った訳ではないので、今後のアップデートは期待できないだろう。

2023年 ふみのは(凸版印刷)

民間企業である凸版印刷が、ようやく2023年6月よりiOS版、10月よりAndroid版で「ふみのは」を提供し始めた。

くずし字解読アプリ「古文書カメラ」|トップ
「古文書カメラ™」は、トッパンが提供するスマートフォン用くずし字解読アプリです。トッパンの古文書解読とくずし字資料の利活用サービス「ふみのは®」が運営しています。トッパンの培ってきたOCR技術(自動文字認識)を活用し、くずし字資料の解読をサポートします。

さらに、2023年12月12日にアップデートを実施。

AI-OCRの再学習を実施し、解読精度の向上を実現するとともに、様々な条件下で撮影した画像に対応できるように、画像編集機能を搭載した。

また、解読機能の利用回数をこれまでの1日あたり10回から、30回に増加した。

実際に解かせてみよう

利用したのは1862年に書かれた斃馬証文。日本人は約160年前に日本語で書かれた文章さえ読めない。

白黒の方が精度が上がると思い予め画像処理済だ。

以書面相達候然者先達
而中差出し候斃馬證文
少々不文言有之書直し可申候
右二付明二日朝三判持参
我等付へ可罷出候其節此
書付持参可被相返候以上

さて、その結果。

アプリ 正解数 正答率
みを(miwo) 15文字/66文字 22.7%
ふみのは(凸版印刷)古典籍AI 22文字/66文字 33.3%

 
 

正答率 約3割

 
 

ポンコツかよ!

 

 

と思ってたけど「ふみのは」はAI選択が可能だ。

  • 古典籍AI(仮名多め、太さ均一)
  • 古文書AI(漢字多め、太さバラつきあり)

 

次は古文書AIで実施。

アプリ 正解数 正答率
ふみのは(凸版印刷)古文書AI 45文字/66文字 68.2%

 
 

正答率 約7割

 
 

おお!7割近い正答率を出した。

版本の判読には「古典籍AI」モード、古文書判読には「古文書」モードが適してる。

おわりに

7割は優秀だしアプリで古文書が読める時代がようやく来たと考えると素晴らしい。

そして無料で30回/日に利用も出来るのもありがたい。

 

とはいえ全く古文書を読めないためも認識結果が正しいか?すら分からないので未知の先祖の古文書の調査ができない。

古文書講習に通って学ぶしかないか……。

タイトルとURLをコピーしました