死海文書に2人目の書き手、AIが見破る 筆跡から筋肉の運動を解析
「ヒンジ」の解析で、文字から筋肉の運動を読み解く
博士たちは真相を究明すべく、次のような手順で解析を進めた。まずはイザヤ書のデジタルスキャン画像を入手し、ディープラーニングの手法を用いて二値化した。すなわち、紙質によるノイズと背景を取り除き、文字の部分だけを抽出する工程だ。
続いてチームは、ヒンジの分析作業に取りかかった。ヒンジとは個々の手書き文字に表れる微細なクセのことだ。書き手は無意識にペンを速めたり遅くしたりしており、文字にはこうした筋肉運動の形跡が残されている。
例えば線が曲がる箇所では必然的に速度が落ちていたことが想定され、その曲率が急であるほどペンを走らせる速度は遅かったことになる。このような特性をパターン認識の力を借りて分析し、サンプルの文字ごとにベクトルで表現した。
さらに研究チームは、文字の細部だけでなく、文字単位での特性も考慮したいと考えた。そこでチームは、イザヤ書に登場する全ての書き文字を収集し、ヘブライ文字の各アルファベット1つに対し、数十の代表サンプルを作成した。代表サンプルの作成には、ニューラルネットワークの一種である自己組織化マップと呼ばれる手法を用いている。
自己組織化マップは、機械学習の一種だ。同じアルファベットを書いた大量のサンプルを投入すると、とくに評価ルールを人為的に決めなくとも、全サンプルの違いを最もよく表現できる評価軸2つが導き出される。さらに、特徴が似たサンプル同士でグループに分類される。手書き文字は複雑で数値化しにくいものだが、似た筆跡同士の文字を人間の先入観なしにグループ分けし、さらに各群の特徴を2つの数値で表わせるという寸法だ。
最後にチームは、ヒンジと自己組織化マップ、さらにこれらを混合した結果を、統計的手法を用いて解析した。すると、各手書き文字のサンプルは、明らかに異なる特性を持つ2つの群に分類された。そしてそれらの群は、それぞれイザヤ書の前半と後半の文字に由来していることが判明した。こうして博士たちは、文書の半ばを境に明らかに異なる2つの筆跡を観測し、イザヤ書の背後には2人の書き手が存在したとの結論に至った。
Credit: Mladen Popovic
Credit: Mladen Popovic
視覚的な検証で結果を裏付け
さらに博士たちは、この結果を視覚的にわかりやすい形で別途検証している。チームは文書の前半と後半からアルファベットごとの文字サンプルをすべて収集し、拡大縮小してサイズを合わせたうえで、各個の重心を揃えるようにして重ね合わせた。
これらを画像処理し、多くのサンプルで共通して線が通っている箇所ほど濃く浮かび上がるようにすると、「ヒートマップ」と呼ばれる画像ができあがる。いわば、数十の文字を合成した、その書き手による代表例だ。イザヤ書前半から作成したヒートマップと後半のヒートマップを比べると、明確な差異が確認された。
ポポヴィッチ博士は今回の研究により、写本を製作した古代の人々が、個人ではなくチームで作業に当たっていたことが示されたと結論づけている。また、酷似した文字で綴られていることから、学校あるいは家庭における教育制度が存在し、そうした場所で同じ訓練を受けた者同士による共同作業だとも考えられるという。
タイムズ・オブ・イスラエル紙は、「筆跡の違いにより個々の書き手を同定することで、これ以外の巻物の断片同士の関連性について全容を明らかにし、その起源についての理解を一層深めることができるかもしれない」と述べ、今後の応用にも期待を寄せる。死海文書には、複数の断片に分かれてしまっているものも多い。どの断片同士が元々一つの文書だったかを検証するうえでも、強力な手掛かりになりそうだ。