研究推進

自然な日本語を書くための、文の構造と長さや頻度の関係の研究
―語彙と文法をつなぐ日本語の計量的分析―

フンボルト財団総会にて(於ベルリン)_真田 治子

プロフィール

経済学部 経済学科 教授(日本語表現法担当):真田 治子 Haruko Sanada

平成26年から28年までドイツ教育研究省直轄のアレクサンダー・フォン・フンボルト財団の研究費を得て国際共同研究を行いました。同財団には世界中から研究費の申請がありますが、この時は日本から選抜された6名のうちの一人でした。28年夏にはドイツ大統領官邸中庭で開催された財団の総会に招待されました。

日本語の自然さは、文法の正しさだけではなく、文の構造や語の長さ、語順とも深い関係がある

関係の解明は、将来、外国人の日本語学習や機械翻訳に役立つ

フンボルト財団の標語「卓越性がつながる」_真田 治子
目的
日本語における「長さの自然さ」を明らかにする

日本語学習者が書いた文や機械翻訳が生成した文の中は、文法上は正しいのに、日本語としての自然さに欠けているものがあります。その違和感の一つが、文を構成する要素(語やいわゆる文節、節)の長さの不自然さです。どれも極端に短いと物足りなく、極端に長いと冗長な感じになります。「この文は長すぎてわかりにくいから2つに分けよう」ということです。では、どこまでは1文でよくて、どこからは長すぎるのでしょうか? 母語話者は言語要素の長さについて許容できる範囲がおおよそ決まっています。例えば英語よりもドイツ語の方がしばしば長い複合語が見られます。この言語的要素の長さは文の構造の中での位置や頻度等によっても違いがあるだろうと推定されています。日本語の「長さの自然さ」を文の構造等や要素の個数等の計量的性質の観点から明らかにするのがこの研究の目的です。

内容
計量言語学の分析手法を用いて文の構成要素を調べる

新聞のデータベースから約700の節、5600語余りをサンプルとして抽出し、節の長さと節を構成する要素の長さや個数の分布を調査して統計分析を行いました。また文節の出現順序の確率等も調査しました。また「長い節を構成する要素は短い」というMenzerath-Altmann(メンツェラート・アルトマン)の言語法則が日本語に適用できるかどうかも調査しました。

展望・成果
日本語にはまだ未知の性質がある

欧米の言語では既に研究が進んでいたMenzerath-Altmannの言語法則を日本語で調査した結果、文の長さと節の長さは法則通りに反比例の関係になりましたが、節の長さと文節の長さは凹型の関係になりました。これは、節がある一定の限度を超えると情報をすべてそこに詰め込もうとする意識が働くためではないかと考えられます。また日本語の文の中の語順は比較的自由だと言われていますが、実際は主語、時間、場所、目的語、述語の順に要素が配置され、その間に理由や状況を示す副詞等が入り、さらに主語や目的語は文脈によっては省略可能であるため、語順が緩やかであるように見えることがわかりました。これらの結果は、インパクト・ファクターという高い評価を持った国際学術誌Journal of Quantitative Linguisticsに2回、ベルリンのGruyter社とアムステルダムのJohn Benjamins社から刊行された言語学の専門書に3回、日本の専門学会誌『計量国語学』に1回掲載される等、これまでに11本の論文として発表されています。

  • フンボルト財団の標語「卓越性がつながる」_真田 治子

    フンボルト財団の標語「卓越性がつながる」

  • 総会でスピーチをするガウク大統領(当時)_

    総会でスピーチをするガウク大統領(当時)

キーワード

#日本語、#計量言語学、#文の長さ、#語順、#Menzerath-Altmann’s Law、#Journal of Quantitative Linguistics

研究者からのメッセージ

言語の計量的研究は言語データを数値化して分析するため、日本語の国際的な対照研究を行うことが出来る、発展性のある研究分野です。基礎研究の成果は、ツイッターのつぶやきを収集した流行語探索、インターネットの検索サイトの予測入力、翻訳機能など、マーケティングの分野や機械翻訳の分野にも応用されています。

共同研究者

ドイツ・トリア大学 名誉教授:Prof. em. Dr. Reinhard Koehler

ページの上部へ