古文書に先祖の名前が存在するかの調査方法(陰徳太平記にOCR編)

先月「古文漢文オワコン論」が話題となった。

ひろゆき氏は19日にツイッターで「古文・漢文は、センター試験以降、全く使わない人が多数なので、『お金の貯め方』『生活保護、失業保険等の社会保障の取り方』『宗教』『PCスキル』の教育と入れ替えたほうが良い派です」と提言。続けて「古文漢文はやりたい人が学問としてやればいいだけで必須にする必要ないかと」と私見と綴った。

2021年02月22日 11時57分

 
 

高校の古文読解の知識では、江戸時代の軍記物語すら読めない。

中途半端で役に立たないなら選択科目で良い。中学生時代に基礎は学んでいるしね。

このニュースを見て ふと 二年前に宿題にしていた古文書調査を思い出した。

[先祖調査] 昔は武士・豪族という方面から推測する
新型コロナウイルスの拡大を受けて、自宅に籠もる人も多い中、私は外に遊びにいってます。が、「三密」を守ってます。やれることはサッカーとか、バトミントンとか虫取りぐらいですが・・・。完全に話は変わ...

軍記物語「陰徳太平記」に先祖の名字が記載されているかの調査だ。

 

日記が長編になったので、2回にわたって調査報告をする。

続きはこちら

古文書に先祖の名前が存在するかの調査方法(陰徳太平記に画像処理編)
前回のあらすじ。過日ご紹介した『陰徳太平記』や、そのもとになった『陰徳記』、更にそのもとになった『安西軍策』においても、「房田」と「保田/安田」の両面で確認すると良いかもしれませんね。...

軍記物語「陰徳太平記」の調査の発端

先祖調査において、江戸時代に

庄屋(町名主)

をしていた家系であれば

武士から帰農

の可能性がある。

要するに安芸広島藩領であれば、次のような君主の家臣だった可能性が出てくる。

  • 大友氏の元家臣、毛利氏に降参し帰農
  • 毛利氏、安芸吉川氏の元家臣、上級家臣の元陪臣
  • 安芸武田氏の元家臣で、浅野氏の移封で帰農
  • 福島氏に附随して来広したが、改易に伴い帰農
  • 大内氏の元家臣で、浅野氏の移封で帰農

で、安芸の武士に関する情報は次の軍記物語に書かれており、この文献に先祖の名字が載っているかもしれない。

陰徳記 万治3年(1660年)ごろの成立とみられる軍記物語。大内、尼子、毛利、大友氏ら群雄の興亡の歴史
陰徳太平記 永正8年(1507年)頃から慶長3年(1598年)頃までの軍記物語

 
 

と、アマチュアで先祖調査をされている方からアドバイスをもらった。

 
 

過日ご紹介した『陰徳太平記』や、そのもとになった『陰徳記』、更にそのもとになった『安西軍策』においても、「房田」と「保田/安田」の両面で確認すると良いかもしれませんね。

 
 

陰徳太平記いんとくたいへいきは、81冊と1冊の目次からなる本だ。

室町幕府13代将軍足利義輝(1507年)から戦国時代(1598年)までを描いた軍記物。

岩国藩が出版していて、内容が検閲されているため、内容は毛利家に都合のように変更されている。

著者は香川正矩。その息子(次男)の香川景継(=梅月堂宣阿)が加筆、編纂した。

元禄11年(1698年)岩国領の検閲を経て、宝永3年(1706年)出版許可、享保2年(1717年)出版された。

陰徳太平記に描かれる毛利元就の適当な伝記

毛利元就は最初、大内義隆の部下だった。

しかし、大内が
 

芸術文化への投資にハマり

同性愛(衆道)にハマった

 

ことで内部崩壊していった。

 

(C)藤本 ケンシ/何度、時をくりかえしても本能寺が燃えるんじゃが!?

 

その大内義隆を部下の陶隆房(のちの陶晴賢すえはるかたが謀反を起こして自害に追い込む。

その陶隆房を倒し、安芸国を手中に納めたのが毛利元就だった。

具体的には天文24年(1555年)、毛利が表舞台に出てくるキッカケとなった厳島の戦いが勃発。

その結果、陶隆房は35歳の若さで戦死。

 
 

現代語訳は発売されている。

でも、これは「陰徳太平記」の完全ではなく主要箇所のみを現代語訳したもの。

だから、今回の目的に役立たない。

オンラインで見れる陰徳太平記

とっくの昔に著作権は切れているので、多くのネットサービス上で閲覧できる。

 
 

 
 

で、文書はこんな感じ。

右の部分だけを抽出すると、次のようになる。

助は先陣に閧の聲の間近く聞えける間、 心許なしとて物見を遣はしけるに味方打負け引退くと聞て策にあぶみを合わせて馳せて行き為資と一に成らんとする所に藤井行吉等散々に成て逃げ來り敵雲霞うんかの如く追ひ駈けたるを見て、為資取て返へし命を際に戦ひけるに村田も一手に成て突て懸る、され共暗夜の事なれは何れを敵味方と知り難く名乗る聲相詞をしるべにて走り懸り々々打合り、敵は兼ねてちょうし合わせしこと也、味方は不意の戦いなればついに叶ふべき様もなくさしもの穂田為資も打負けて引退く。家親之を見て北くるをふことびんなれば行吉取て返して討死す、藤井も爰を最後と振舞ける程に薄手重手三箇所負たれは郎等に助けられて逃退きけり。かかる程に穂田は手の者分散して稍々しょうしょう唯一一騎猿掛ノ城にぞ入にける。家親も勝て冑の緒を締めよ深入すなとて引返し討取る首共點檢するに村田掃部助行吉某、池上七郎四郎加藤十兵衛を先として百七十餘とぞ記しける、穂田家親方便はたかられたり今一度合戦して鬱懐うっかいちらせんと思ひけれども味方に野心の者あれはこそはかりごとの漏れたるらめと狐疑こぎの心を生し、又家親も今度は一定穂田を討取へかりしに彼道より引返すこと、味方の兵、敵に志を通じて告知すなめりと心を置ければ互に跡を九淵の底に潜め重ねて戦はんともせざりけり。かくて為資一々と思慮を廻すに元就に矛盾に及ふ事、終には當家滅亡の端たるべしと思ひぬかずいて降人になり人質を差出す其後元就の命によりて、三村穂田、私の宿恨氷消してかえっ爾汝じじょの交をなし。家親の嫡子元祐を請うて養子とし家事を譲りて隠居せり。

この中身を理解する事が目的であれば大変だ。

高校の古文知識だけでは太刀打ちできないし約1000ページあるからね。

陰徳太平記から名字を検索する

やりたい事は中身を理解したいわけじゃない。

この文献に先祖と名字が同じ人物が存在するかを明らかにすれば良い。

OCRを使って文字を抜き出し、テキスト検索する

思いついたのは、81冊(約1000ページ)にOCR(Optical Character Recognition:光学文字認識)をかける方法だ。

最近のOCRの精度は高いし、テキストが抽出できたら文字検索するだけだからね。

 

では、実際にOCRにかけて結果をみてみよう。

有料版の精度は知らないが、無料の範囲なら「Google ドキュメント」が一番精度が高かった。

 

手順としては、画像をGoogle DriveにUploadして右クリック。

そして「Googleドキュメントで開く」を選択すると、OCRが自動的にかかったドキュメントが開く。

 
 

超便利で簡単!

で結果は次のようになった。

助先陣姆,陛,間近,叫少小元 – 宁物見予選》少加味方打負引退下開刀。 策】短才七了行為药<一> n成》tx儿行吉等散成逃來身。敬n 體, 懸气加才為資取了匹》……

正解はこっち。

先陣に閧の聲の間近く聞えける許なしとて物見を遣はしけるに味方打負引退くと聞て策にあぶみわせてせて資と一に成らんとする井、行吉等散々にり敵うんかの如くひ駈けたるをて、為資取て返へし

 

うーん、多少漢字は拾っているが精度50%ぐらいかな……。

振り仮名、レ点、常用漢字以外が使われてるためOCRでは文字認識が難しい。

この精度のテキストから文字列検索を行っても名字の発見漏れに繋がるだけだ。

 
 

OCRに耐えうる高精細な画像が存在しないか?

機械学習使った高精度なOCRがないか?

 
 

と探しているうちに

 
 

 

二年の月日が経過した……

 

このままじゃ私の命が尽きちゃう!

まとめ

「ハハ、無理だよ……未来の子孫達に託すよ」

 
 

という無責任な日記だったら公開しない。

 

実は、この日記を書いている最中にアイデアが思いついた。

続きはこちら。

古文書に先祖の名前が存在するかの調査方法(陰徳太平記に画像処理編)
前回のあらすじ。過日ご紹介した『陰徳太平記』や、そのもとになった『陰徳記』、更にそのもとになった『安西軍策』においても、「房田」と「保田/安田」の両面で確認すると良いかもしれませんね。...
タイトルとURLをコピーしました