源氏物語成立過程に関する

コンピューター解析


                                                琉球大学工学部講師    上田裕一
                                                統計数理研究所        村上征勝
                                                                     上田英代
 近年、国語学国文学の分野でのコンピューター利用はめざましく、各研究機関でも様々な文献の本文データーベース作りや、語彙索引の自動作成など試みられている。又、古来より「源氏物語」に関する諸研究は夥しい数にのぼっている。こうしたこれまでの研究成果をふまえた上で、「源氏物語」の成立過程、複数作家説をコンピューターにより解析、検証を行なってみたい。今回の発表は、その途中経過報告である。

<コンピューター解析の目的>
 「源氏物語」は、作品構成、人物描写、心理描写等々の点に於て、他に類をみない長編である為、古来より紫式部一人による作品ではなく複数の作家によって書かれたとする説があり、特に作品中の和歌が巧みになる宇治十帖に関しては娘の大弐三位著作説などが有力である。これに関しては最初の統計分析が昭和32年、産能大学の安本美典氏によって行なわれた。
 更に和辻氏は、作品自体の構図の弱さを指摘して、同一作家によることへの疑問や、執筆順序への疑問より、「源氏物語」が序々に拡大された物語だとした。又作品への人物の登場の仕方や心理描写の違いなどを分析することによって各巻の執筆順序が、従来の巻順通りではないことを指摘した青柳説、武田説などについて、論議がかわされたが未だ結論はでていない。又この論を発展させ、単に巻毎の執筆順序を検討するのみでなく『夕顔』の巻の構成を調べることによって巻の内部ですら執筆順が違うことを述べた甲斐説等もある。我々も巻内部の各節の執筆順が異なることを主張している。
 これらの諸説について、コンピューターによる詳細な計量分析を行うことによって結論を求めてみたい。

<解明の方法と途中経過>

  1. 機械可読文献の作成
     データ入力に際してはOCR(富士電機XP−50S)を使って読み取り、テキストは池田亀鑑編著「源氏物語大成」を使った。「源氏物語大成」を使った理由は、諸本による校異が整っていること、語彙索引が完備していること、平がなによる表記が多く原文に近いこと等による。
     機械読み取りのミスはワープロで修正し、多くの空行の削除、余分な部分の読み取りの削除等も行なった。

     次に「日本古典文学大系」を参照して、テキストに句点をつけていった。文の長さが重要な情報の一つとなるからである。


  2. 品詞分解とデータ解析
    a.でできたデーターベースを単語分割してゆき、更に別の修正エディターにかけて、一語ずつ品詞コードを付けていった。(図1,2,3)
    これを解析プログラムにかけた結果が、図4,5,6,7である。これを全部の巻にかけてゆく。

<今後の展開>
 前期までで、各巻に必要な文法情報は整備されるので、これをもとに、各巻の特徴を計量分析する。前半44帖と宇治十帖の違いを明らかにし、宇治十帖他作家説、安本説を検証する。更に、青柳、武田説の検証、甲斐、上田説の検証を行う。その際に必要とされる文法情報は更に整備してゆくつもりである。