古文書読解に必須の「くずし字」を読む方法(アプリ&講習)

古文書を調べるにあたって裂けて通れないのが

 

「くずし字」。

 

今年扱った古文書には「くずし字」で書かれたものはなかったが、いつも読めずに苦労する。

 

時々、古文書調査をしているものだから

「ヘビみたいな文字(くずし字)も読めますか?」

と質問を受ける事がある。

 
 

あるブログにも次のように書いてあるしね。

解読文が添えられていなければそれらを読むことは困難だ。歴史上の有名歌人の碑や書物を自分で読めたらどれほど楽しいだろうか。

 
 

この人は読む事が目的となっているパターン。

 

私の場合は読む事は目的ではなく、先祖調査のために

文書中から調査対象の文字列を見つけ出す事

が目的。

だから、自分で読める必要は無いんだよね……。

今年は「古文書から名字を探す」作業を画像処理で凌いだ。

古文書に先祖の名前が存在するかの調査方法(陰徳太平記に画像処理編)
前回のあらすじ。過日ご紹介した『陰徳太平記』や、そのもとになった『陰徳記』、更にそのもとになった『安西軍策』においても、「房田」と「保田/安田」の両面で確認すると良いかもしれませんね。...

「くずし字」を理解するために少し調べてみるかーー。

そもそも「くずし字」って何?

「くずし字」とは、主に江戸時代以前の日本で使われてきたミミズの這ったような文字のこと。

現在、日本で「くずし字」を読みこなせる人の数は

 

人口の0.01%程度(数千人程度)

 

しかし、江戸時代以前の記録は基本的にはくずし字で記されている。

 

DSC_0116

たとえば、上記の文献には次のように書かれている。

安芸郡仁保島
当分庄屋  原田十兵衛
庄屋    量平
同島の内淵崎浦
組頭    半助
長百姓総代 新八
同     清七
蛎師範代  平四郎(大浜)
同     七蔵(野島)
同     次右衛門(池田)

幾つか読める文字もあるんだけどね。

江戸時代のくずし字は「御家流おいえりゅう」という統一された書体で記されており、私たちが文字を活字で習ったように、昔の人は楷書よりもまず「くずし字」の「形」を習う。

その証拠に寺子屋の教材をみると全て「くずし字」で書かれている。

 

 

メリットとして旧漢字は楷書で書くと「戀」と画数が多いので「くずし字」を学んでいたらしい。

 

つまり いい加減に文字を崩しているわけではない

 

知らなかったーーーー。

だから辞典が存在するだね。

 
 

で、くずし字・変体仮名を読めるようになるには、よく使われる字母を覚える必要がある。

© 株式会社児玉総合情報事務所 映像部

 

でも面倒だなーー。

本業の知識も日進月歩で覚えることは沢山あるんだよ。

正直、将来性のない言葉を覚えたくない。

自動翻訳サービスが増えている

くずし字を機械学習(人工知能)を使って解く最先端の研究は以前紹介した。

人工知能で「くずし字」の文字認識の現状調査
日本人の多くは、日本人が150年前の文書が読めません。家系図調査は「除籍謄本」や「聞き込み」調査が完了したら、次は各研究機関や施設を訪ねて、江戸時代の古文書を調査することになります。古文書に書かれている字は一般的には「草書」...

あれから2年の時を経て、利用できるサービスが増えたので再度二つ紹介しておく。

【有料】凸版印刷「ふみのはゼミ」

ようやく商品化。

2021年2月16日、Webブラウザー上で古文書を解読するシステム「ふみのはゼミ」を発表した。

古文書解読サービス| 「ふみのは」| TOPPAN株式会社
「ふみのは®ゼミ」は、くずし字AI-OCRのアシストを受けながら、オンラインで古文書や古典籍などの歴史的資料を解読できるサービスです。複数人での共同解読にも対応しており、大学などの授業や研究発表・イベントにもご活用いただけます。

税別価格は、授業での利用が半期あたり10万円から、ワークショップ・イベントなどでの利用が1回あたり20万円から、翻刻会などでの利用が月額7万円から。

お試しサービスぐらいやれば良いのに、今の時代に即して無いビジネス展開だ。

精度に関する情報も何も見つからん、次!

【無料】アプリ「みを」

これ本命。

2021年8月30日、Android版とiOS版のアプリが無料公開された。

カラーヌワット タリン (Tarin Clanuwat) - マイポータル - researchmap
researchmapは、日本の研究者情報を収集・公開するとともに、研究者等による情報発信の場や研究者等の間の情報交換の場を提供することを目的として、国立研究開発法人科学技術振興機構(JST)が運営するサービスです。

開発者は特任助教である「カラーヌワット タリン」氏。

氏は、Kaggleくずし字認識コンペのホストであり国立情報学研究所特任研究員。

「みを」は

  • ROIS-DS人文学オープンデータ共同利用センターがAI物体検出技術を用いて開発した「KuroNetくずし字認識サービス」
  • くずし字認識コンペティションである「Kaggleコンペティション」で1位となったくずし字認識モデル

2つを活用したアプリらしい。

確かに、現時点ではオープンソースの中では最高の精度を誇っていると言って過言では無いだろう。

 

期待が超膨らむ!

 

早速インストールして使ってみた。

うーん、誤認識が予想より大きい感はある。

オンライン・オフライン講習(セミナー)で学ぶ

コンピュータでの認識力が期待していたレベルに達して無いので、自分で読めるようになるしか無さそうだ……。

コロナのご時世もあり、オンライン講習も幾つかあった。

千葉県内の講習を紹介しておく。

無料のオフライン講習

千葉県内でも古文書講座が開催されており、募集した日に満員になるほどの人気ぶりだ。

ご指定のページは見つかりませんでした/千葉県
レベル 内容
入門コース 初めて古文書を学ぼうとする初心者の方を対象に、古文書の解読に必要な基礎用語や基礎知識を中心に学習します。
初級コース 古文書の解読に必要な基礎的知識のある方を対象に、歴史的背景を読み解きながら解読法等を学習します。
初級コース 古文書の解読に習熟した方を対象に、歴史的背景を検証しながら、より深く学んでいきます。

市政だより12号掲載の「初級古文書講座」のご案内

千葉市立郷土博物館_初級古文書講座

 

毎年申し込んでるが、今年はどうかな?

 

結果

 
 

応募者多数により、厳正なる抽選を行いました結果、誠に残念ではございますが、「選外」となりましたので、お知らせいたします。

 
 

今年も落ちたじゃねーーーか!!

無料のオンライン講習

船橋市の郷土資料館がWebで古文書講座を開いている。

【郷土資料館】Webで古文書講座
自分のペースで古文書(こもんじょ)を読み解くコツを学べるテキストをダウンロードできます。「ふなばし生涯学習チャンネル」の解説動画も併せてご覧ください。

テキストと動画で古文書を学べるらしい。

これ良いじゃん。

てか、オフライン講習を録画してオンラインでいつでも受講できるようにすれば良いのに……。

コロナで参加者減らすんじゃなくて、需要を満たす努力をしたら良いんじゃないかな?

まとめ

記憶というのは、どんどん忘れ去ってしまう。

まるで、手ですくってもすくっても指の隙間からサラサラと流れ落ちる砂のように。

変体仮名を覚えても、利用頻度が低いので、10年後には きっと記憶の片隅にも残らないだろう。

だからこそAI解読に期待していたけど、今のレベルでは目的の用途に耐えない。

日進月歩の技術だとは思うが、取り組んでる人が少なすぎだわ。

 

そして、セミナーに当選するのはいつの日か……。

タイトルとURLをコピーしました