源氏物語の計量分析(4)


○上田英代*、村上征勝**、今西祐一郎***、樺島忠夫****、藤田真理*****、上田裕一******
(*古典総合研究所、**統計数理研究所、***九州大学、****神戸学院大学、*****東電学園、******もとぶ野毛病院)


  1. はじめに
     著者等は昨年までに、品詞の出現率や、異なり語の情報を用いて、「源氏物語」と「手枕」「雲隠六帖」「山路の露」との文体の比較を、統計的計量分析の方法を用いて行い、当学会でも報告している。
     昨年度は、『源氏物語大成校異篇』本文の品詞情報付データベースに、さらに活用語には活用計情報を付加し、複合語中の付属語も抽出可能なデータとして再構築した。これにより、付属語及び補助動詞に関する情報が精密になり、検索したい語彙の前後の語に、活用形情報まで付加されたKWICが、容易に出力出来るようになった。それ故、語と語の接続関係が文法上も明確になり、細部にわたる計量分析が可能になった。このデータベースを用いて、一昨年度の『源氏物語語彙用例総索引・自立語篇』に引き続き、『付属語篇』を完成した。 語認定や品詞・活用形情報はすべて『源氏物語大成索引篇』に準拠している。
     「源氏物語」は平安時代の語彙の宝庫であり常に用法の引用例とされる作品である。しかし、作者が物語執筆の初期から完成時まで、全く同じ文体を維持するものかどうか、また五十四帖の各巻の内容と文体はどのような関係になっているのか、等の分析はなされていない。 古来より「宇治十帖」の文体が、それまでの文体と少なからず異なることは指摘されながら、その違いが何によるものなのか等も、詳細には分析されていない。
    今回は、付属語の情報を使って各巻の文体を分析する。

  2. 助詞の種類と出現率
     「源氏物語」に使用されている助詞の種類は『大成索引篇』助詞助動詞の部の見出し語に準拠すると、56種類である。ただし、「ゆふつかた」の「つ」のような一語中に含まれている助詞も含めると57種類である。
     これらの助詞の総語数に対する種類別出現率は、表1のとおりであり、これを各巻別に求め、主成分分析し散布図に描くと図1となる。

    助詞の総語数に対する種類別出現率
              
    0.048760.00530だに0.00156かは0.00046 0.00017ものか 0.0000186
    0.04264こそ0.004970.00153ものを0.00043 0.00011なんど 0.0000160
    0.03804なむ0.00479まで0.00135やは0.00042なむ 0.00011ものかは0.00000798
    0.032170.004520.00134ものから0.00037がな0.00007450.00000532
    0.02838より0.003580.00126して0.00034から0.0000745ものゆゑ0.00000532
    0.02555つつ0.00212ながら0.001110.00025てしかな0.0000691かも0.00000266
    0.02381のみ0.001960.001010.00024して0.0000612
    0.01464かな0.00178さへ0.000860.00024づつ0.0000372
    など0.01023ばかり0.00158とも0.00067ども0.00024ものの0.0000372
    0.00647かし0.001560.00055ばや0.00023にしかな0.0000346
    表1

    図1

     これを見ると、宇治十帖はある程度のまとまりをなしている。
     さらに個々の助詞の中で出現率の高いものから順に相関係数の高い組み合わせを挙げると以下のとおりである。

           相関係数
       @「の」と「と」 -0.73761
       A「の」と「ば」 -0.67077
       B「て」と「も」 -0.60565
       C「と」と「ば」 +0.63463

      @ABCについて各巻の分布を図にすると、図2,3,4,5である。
     @ACについて、「の」は体言に多く付属し、「と」と「ば」は用言に多く付属するので、体言と用言の各巻の出現率によって逆相関となり、「と」と「ば」については順相関となる。 「て」と「も」については詳細に検討しなければならない。これらの結果を踏まえて更に細かい分析を行なってゆく予定である。

     

     


戻る

古典総合研究所ホームページへ