TOP

成果・報告 Results Reports

HOME > 成果・報告 > 近藤みゆき(2000) nグラム統計処理を用いた文字列分析による日本古典文学の研究  ―『古今和歌集』の「ことば」の型と性差―

近藤みゆき(2000) nグラム統計処理を用いた文字列分析による日本古典文学の研究  ―『古今和歌集』の「ことば」の型と性差―

千葉大学『人文研究』2000年3月(29号)pp.187-238

1 はじめに一検索利用から計量分析ヘー

日本古典文学のデータベース環境は、ここ数年、急展開を遂げている。1990年に完成した長瀬真理の「日本語―英語対照「源氏物語」のテキスト・データベース」(1)を先駆的業績として、その後、CD― ROMやオンライン(2)において、各種の古典籍データベースが公開されてきた。特に1999年には、4月に国文学研究資料館による日本古典文学本文データベース(実験版)試験公開の開始、7月に国文学研究資料館データベース古典コレクション『二十 一代集〔正保版本〕CD― ROM』、『源氏物語(絵入)〔承応版本〕CD― ROM』(3)刊行、下半期には『角川古典大観 源氏物語』CD― ROMが刊行(4)、大型の企画が相次いで完成・公開を見ており、国内の研究者にとっては古典文学研究のためのデータベース環境の基礎は、和歌および仮名散文の分野では、ほぼ固まつたといつてよい。こうした環境の充実は、近年の研究に着実に反映しており、特に和歌の分野では、1996年の『新編国歌大観C D― ROM版』(5)の刊行以後、歌ことばの研究、あるいは歌人同士の表現摂取の様相などに焦点をあてたような研究は、用例の博捜という点において、精密の度を加えてきた。歌風論・歌人論のいずれにおいてもデータベース化の促進がもたらした成果は計り知れないと言えるだろう。だが、しかし、用例検索を徹底した研究の増加が、一方で、和歌の表現研究にある種のステロタイプ化をもたらしつつあることも、現在、私を含めて多くの研究者が抱く所感に違いない。テキストデータベースの活用が、「用例を検索する」という、いわば研究の補助手段にとどまる限り、表現研究のあり方も固定的になり、やがては歌語研究や表現研究自体の魅力の低下を引き起こすのではないかという危惧もまた、少なからず抱かれるのである。補助手段としての検索利用とは別に、言語と文化のデータの集積ともいうべき文学作品を計算機によって総合的に分析研究することを目指し、そのために日本の古典文学作品の分析に適した方法やツールそれ自体を検討する研究が、和歌研究者自身の手によつて、開始されるべき時期に来ていると言えるのではないだろうか。特に、前述の国文学研究資料館の公刊データに代表されるように、利用者側が如何ようにも加工出来るフルテキストデータベースの提供が本格的に開始された事は、そうした時代の到来を予感させる。情報処理研究のサイドではすでに、古典和歌を対象として、データ分析という観点からの研究が始まっている。山崎真由美(6)、竹田正幸(7)らの共同研究がそれで、最長共通部分文字列 (LCS)や最小記述長(MDL)方式といった方法によって、類似歌や特徴パターンの自動抽出を可能にしようとするもので今後の進展が期待されるが、残念ながら現段階では和歌研究者側にはあまり知られるに至っておらず、実際の和歌研究でどう展開されるかはこれからの課題であろう。

本稿は、和歌研究者の立場から、平安和歌研究の一環として、古典和歌研究のデータ分析の方法を新しく提案し、あわせて、それによった研究を試みるものである。新しく提案する分析法とは、nグラム統計処理とlINIXの標準ツールcommを組み合わせた文字列総比較によって表現の種々相を分析する方法であり、またそれによって試みたい研究とは、性差からみた『古今和歌集』の「ことば」(歌ことば・表現)の分析である。ここでまず、『古今和歌集』の「ことば」(歌ことば・表現)を性差の観点から考察することの意義、またそれを特に計量分析によって行うことの意義について述べておこう。和歌という表現形式の特質の一つに、それが一人称の言語表現であり、かつ作品内に仮構された性も含めて詠歌世界において主体となっているものの性―男性の歌であるのか、女性の歌であるのか―を、大きく反映する文学様式であるということがある。折口信夫以来多くの論考が重ねられている「女歌」論は、この問題をめぐる研究を代表するものだが、近年、特に平安和歌では、後藤祥子の「女流による男歌―式子内親王歌への一視点」(8)よって大きな問題提起がなされた。後藤の論は「女流による男歌」という、発想を転換した観点で古今から新古今時代までを縦断して分析することで、従来「女歌」側に集中していた問題を相対化し、詠歌世界における性の倒錯や錯綜が、代作・題詠・物語取りなどの和歌史的諸問題といかに切り結ぶかを鮮やかに分析してみせたものであつて、式子内親王の代表歌「玉の緒よ絶えなば絶えねながらへば忍ぶることの弱りもぞする」を源氏物語取の歌で、しかも男の立場(作中の柏木)の恋を歌つたものとするかつて無い結論とあわせて、多くの反響を呼んだ(9)。同論は、詠歌世界での男装の式子という、センセーショナルな指摘もさることながら、論証過程において、たとえば「忍恋」の詠み手は古今以来圧倒的に男性であることを明らかにするなどといったように、古今以後の和歌世界に「男歌」という発想。表現の型があるということ、いうなれば和歌の発想や表現に潜む「男性性」という問題を、具体的に浮かび上がらせることになった点でも、斬新かつ従来にない着眼を提供するものであつたと思われる。時に男性歌人が擬装する「女歌」 という型があり、一方で女性歌人が、代作として模倣したり、題詠世界で成り変わつてみせ得る「男歌」という型があるのだとしたら、平安期の人々は、その位相差をどう認識していたのだろうか。そもそも彼らが「王朝和歌」という表現形態において、共通に認識していた性差の「型」の枠組みとはどのようなものだったのだろうか。歌の「型」とは、言うまでもなく、「ことば」によって形成される。そこで本稿では、「ことば」に密着してこの課題について考えてみたい。具体的対象とするのは、以後の王朝文学の「ことばの規範」となり、広い意味での王朝の表現文化の基盤でもあった『古今和歌集』である。恋歌だけではなく、四季、覇旅など歌の領域全体に範囲を広げ、この『古今和歌集』において、性差が、表現や発想をどう規定していたのか、男性の言葉と発想の型。女性の言葉と発想の型との関連から、その「ことば」の型を明らかにすることを目指してみたい。特に、『古今和歌集』では、1100首のうち、作者名などから女性の歌と確実視出来るのは87首を数えるに過ぎない。和歌が、対漢籍という意味においていかに女性的契機を持つ文学形式であるにしても、「古今的表現」とは、その意味で、紛れもない男性の形成した文化的言語表現に他ならない。そうした男性の視点は文芸としての和歌にどう反映し、またこれを機制したのか、従来の女歌論の立場だけにとらわれず後藤論の示唆するところから、更に展開すべき問題は多々あると考えられるのである。

それにしても、平安時代の言葉や表現を、個別例に即して男性性。女性性の観点で判別していくことは、容易なようでいて、実は全く容易ではない。山口仲美は、客観分析に徹する時、『源氏物語』作品中から、「女性語」「男性語」を、網羅的に識別。抽出することが、いかに困難な作業でもあるかを述べているが(10)、『古今和歌集』において、男性が頻繁に用いるのに女性には用例がない表現を、いくつか具体的に示せと問われたとき、たとえ熟達した和歌研究者をもってしても、主観で即答することは難しいだろう。語感。ニュアンスというレベルにおいて、平安和歌とは、現代語の話者としての我々研究者にとって内省のほとんど通用しない領域であるという立場を一旦は取るべきであろう。そこで内省に代替する、あるいは内省を超える客観分析に適した手段として、有効と考えられるのが、和歌のフルテキストデータを計算機で分析する計量分析である。・・・・・

続きは以下のダウンロードリンクから