古文書を調べるにあたって裂けて通れないのが
「くずし字」。
今年扱った古文書には「くずし字」で書かれたものはなかったが、いつも読めずに苦労する。
時々、古文書調査をしているものだから
「ヘビみたいな文字(くずし字)も読めますか?」
と質問を受ける事がある。
あるブログにも次のように書いてあるしね。
解読文が添えられていなければそれらを読むことは困難だ。歴史上の有名歌人の碑や書物を自分で読めたらどれほど楽しいだろうか。
この人は読む事が目的となっているパターン。
私の場合は読む事は目的ではなく、先祖調査のために
文書中から調査対象の文字列を見つけ出す事
が目的。
だから、自分で読める必要は無いんだよね……。
今年は「古文書から名字を探す」作業を画像処理で凌いだ。
「くずし字」を理解するために少し調べてみるかーー。
そもそも「くずし字」って何?
「くずし字」とは、主に江戸時代以前の日本で使われてきたミミズの這ったような文字のこと。
現在、日本で「くずし字」を読みこなせる人の数は
人口の0.01%程度(数千人程度)
しかし、江戸時代以前の記録は基本的にはくずし字で記されている。
たとえば、上記の文献には次のように書かれている。
安芸郡仁保島
当分庄屋 原田十兵衛
庄屋 量平
同島の内淵崎浦
組頭 半助
長百姓総代 新八
同 清七
蛎師範代 平四郎(大浜)
同 七蔵(野島)
同 次右衛門(池田)
幾つか読める文字もあるんだけどね。
江戸時代のくずし字は「御家流」という統一された書体で記されており、私たちが文字を活字で習ったように、昔の人は楷書よりもまず「くずし字」の「形」を習う。
その証拠に寺子屋の教材をみると全て「くずし字」で書かれている。
メリットとして旧漢字は楷書で書くと「戀」と画数が多いので「くずし字」を学んでいたらしい。
つまり いい加減に文字を崩しているわけではない。
知らなかったーーーー。
だから辞典が存在するだね。
で、くずし字・変体仮名を読めるようになるには、よく使われる字母を覚える必要がある。
© 株式会社児玉総合情報事務所 映像部
でも面倒だなーー。
本業の知識も日進月歩で覚えることは沢山あるんだよ。
正直、将来性のない言葉を覚えたくない。
自動翻訳サービスが増えている
くずし字を機械学習(人工知能)を使って解く最先端の研究は以前紹介した。
あれから2年の時を経て、利用できるサービスが増えたので再度二つ紹介しておく。
【有料】凸版印刷「ふみのはゼミ」
ようやく商品化。
2021年2月16日、Webブラウザー上で古文書を解読するシステム「ふみのはゼミ」を発表した。
税別価格は、授業での利用が半期あたり10万円から、ワークショップ・イベントなどでの利用が1回あたり20万円から、翻刻会などでの利用が月額7万円から。
お試しサービスぐらいやれば良いのに、今の時代に即して無いビジネス展開だ。
精度に関する情報も何も見つからん、次!
【無料】アプリ「みを」
これ本命。
2021年8月30日、Android版とiOS版のアプリが無料公開された。
開発者は特任助教である「カラーヌワット タリン」氏。
氏は、Kaggleくずし字認識コンペのホストであり国立情報学研究所特任研究員。
I added a few functions. The app can transcribe Kuzushiji on image from camera or gallery. If you press on kanji, it will show dictionary, but for hiragana, it will show Kana variants and Jibo. I also added text output so you can edit, copy or paste the text inside the app. pic.twitter.com/ineJN70qrz
— tkasasagi 🐻 (@tkasasagi) March 14, 2021
「みを」は
- ROIS-DS人文学オープンデータ共同利用センターがAI物体検出技術を用いて開発した「KuroNetくずし字認識サービス」
- くずし字認識コンペティションである「Kaggleコンペティション」で1位となったくずし字認識モデル
2つを活用したアプリらしい。
確かに、現時点ではオープンソースの中では最高の精度を誇っていると言って過言では無いだろう。
期待が超膨らむ!
早速インストールして使ってみた。
うーん、誤認識が予想より大きい感はある。
オンライン・オフライン講習(セミナー)で学ぶ
コンピュータでの認識力が期待していたレベルに達して無いので、自分で読めるようになるしか無さそうだ……。
コロナのご時世もあり、オンライン講習も幾つかあった。
千葉県内の講習を紹介しておく。
無料のオフライン講習
千葉県内でも古文書講座が開催されており、募集した日に満員になるほどの人気ぶりだ。
レベル | 内容 |
---|---|
入門コース | 初めて古文書を学ぼうとする初心者の方を対象に、古文書の解読に必要な基礎用語や基礎知識を中心に学習します。 |
初級コース | 古文書の解読に必要な基礎的知識のある方を対象に、歴史的背景を読み解きながら解読法等を学習します。 |
初級コース | 古文書の解読に習熟した方を対象に、歴史的背景を検証しながら、より深く学んでいきます。 |
市政だより12号掲載の「初級古文書講座」のご案内
毎年申し込んでるが、今年はどうかな?
結果
応募者多数により、厳正なる抽選を行いました結果、誠に残念ではございますが、「選外」となりましたので、お知らせいたします。
今年も落ちたじゃねーーーか!!
無料のオンライン講習
船橋市の郷土資料館がWebで古文書講座を開いている。
テキストと動画で古文書を学べるらしい。
これ良いじゃん。
てか、オフライン講習を録画してオンラインでいつでも受講できるようにすれば良いのに……。
コロナで参加者減らすんじゃなくて、需要を満たす努力をしたら良いんじゃないかな?
まとめ
記憶というのは、どんどん忘れ去ってしまう。
まるで、手ですくってもすくっても指の隙間からサラサラと流れ落ちる砂のように。
変体仮名を覚えても、利用頻度が低いので、10年後には きっと記憶の片隅にも残らないだろう。
だからこそAI解読に期待していたけど、今のレベルでは目的の用途に耐えない。
日進月歩の技術だとは思うが、取り組んでる人が少なすぎだわ。
そして、セミナーに当選するのはいつの日か……。