macroscope

( はてなダイアリーから移動しました)

滞在強い

「空耳、空目、誤変換」の「誤変換」は日本語のキー入力から漢字への変換のまちがいをさすつもりだったのだが、言語間の機械翻訳の変換のまちがいも同類なので、この分類に含めることにしよう。

2013年9月30日、nofrillsさんによる「NAVERまとめ」の「英語圏で有名な『無料ウェブ翻訳』は、どうして日本語では使い物にならないのか。その一例」http://matome.naver.jp/odai/2138049314204219101 で述べられている件だ。

東日本大震災のあとまもないころに、スウェーデンのグラフィック デザイナー Viktor Hugossonさんが作った画像には、日本の人々への応援のメッセージが添えられていた。英語で「Stay strong.」というのはもっともなのだが、さらに日本語で「滞在強い」と書かれていたのだ。英語の「stay」「strong」のそれぞれの訳語をならべたものになっている。機械翻訳の結果を日本語の意味がわからないまま使ってしまったようだ。

Google translateでは「Stay strong.」は「強い滞在」となる。これは上記の訳語を、日本語としてありそうな順序にならべかえたものと考えられる。これは「滞在強い」よりもまずい(というnofrillsさんの意見にわたしも賛同する)。翻訳がうまくいっていないのにそれが読者に伝わらなくなるおそれがあるからだ。【ただし10月1日にわたしがためしたところ、同じようにやった場合の結果は同じだが、ピリオドなしの「Stay strong」だと「強いままでいる」となった。命令形ではないが動詞句の意味は正しくとれている。もしかすると、最近おおぜいの人がこの事例を試したのでGoogleのシステムがいくらか学習したのかもしれないが。】マイクロソフトのBing translator (中身はバベルフィッシュらしい)では「強力なご滞在します。」となるそうだ。これはもっとまずい。自動詞で「ご...になる」でなく「ご...する」という用語法はふつうでなく、それを正当化できる文脈も思いつかない。

しかし機械翻訳がみんなこの文を処理できないわけではない。わたしが、Logovista社のパソコン用有料ソフトウェアでためしてみると、「強い状態でいろ。」になった。また、nofrillsさんによれば、http://honyaku.yahoo.co.jp/ (Cross Language)では「強いままでいてください。」になるそうだ。これならば、日本語としての表現はともかく、意味はとれている。(なお、http://www.excite.co.jp/world/english/ (The 翻訳エンタープライズ)では「強く続けてください。」となるそうだ。これは命令法であることは認識できているが、意味がとれていない。)

この違いを、nofrillsさんは、日本語話者が開発にかかわっている翻訳エンジンではわりあいうまくいっている、と解釈している。しかし、この例の場合、おもな問題は、日本語ではなく、英語の構文の解釈にあると思う。

言語の文は、時間の順にならんだ単語の列であるとともに、文法構造に従った単語の配置でもある。違う言語の間では語順の違いがある。翻訳の際には、時系列と文法構造の両方を保つことはできず、少なくともどちらかを変えなければならない。

Google翻訳が始まったころに聞いた説明によれば、Google翻訳は、入力言語と出力言語の例文をたくさん集め、文法構造の解析をあまりせずに単語列と見て、意味の対応のデータベースを作っている(とわたしは理解した)。このしくみで、語順の近い(同じような文法的役割をする語が出てくる位置がほぼ同じ)言語どうしならば翻訳がうまくいくことが多いが(それでも否定表現の見落としで意味が逆になるおそれもあるが)、語順が大きく違う言語の間でうまくいかないことが多いのは当然だと思う。

他方、Logovistaのソフトウェアは入力言語の文法構造解析を重視するものだ。英語から日本語への機械翻訳には英語の文法構造解析が必要なのだと思う。ただし、文法構造の対応によって構成した訳文の語の順序は原文と大きく変わってしまい、時間軸上の情報の流れとしては不自然になることがある。わたしがLogovistaの出力を参考にして自分の訳文を作る際には、原文の情報の流れを復活するように、文法構造を変えてでも意味を大きく変えない表現をさぐることが多い。

Logovistaのソフトウェアは久野 翮(くの すすむ)博士の研究に基づいているそうだ。

わたしは少年のころ、まだパソコンがなかった1970年代なのだが、数学の応用の話題に関する本を読んでいて、機械翻訳をめざした自然言語の研究があることを知った。その中で例としてとりあげられていた、英語の「Time flies like an arrow.」という文はことわざとして知られたのと全然違った解釈もできる、という話題が印象に残った。おとなになってから確認してみると、これは計算機科学者のエッティンガー(Oettinger)博士による解説で、言語についての例は久野博士の研究にもとづくものだった。この例文の第2の解釈はわりあいよく知られていると思う。わたしも[別記事]の表題に使った。

ところがエッティンガー博士の解説には第3の解釈もあったのだ。第1の解釈ではfliesが動詞、第2の解釈ではlikeが動詞だが、第3の解釈はtimeが動詞だとするものだ。競走のような競技で時間をはかることをさす動詞で、日本語で「タイムをとる」というのにあたる。この動詞が命令法で使われていて、主語は明示されない you だと考えるわけだ。【考えてみるとこの解釈はさらに2つに分かれる。「like an arrow」はtimeにかかる副詞句かもしれないしfliesにかかる形容詞句かもしれないのだ。エッティンガー博士の解説で示されていたのはそのうち前者だったと思う。】

(Logovistaに限ることはないのだが)このような知識がある人が作ったソフトウェアならば、"Stay strong." という文に出会えば複数の文法構造の解釈を試み、そのうちには動詞stayが命令法で使われている可能性も含めるだろう。複数の解釈が可能な場合にどれを選ぶかは、完全に機械化はできず、人がかかわる必要があると思う。【わたしが昔もっていたLogovistaのソフトウェアでは機械出力の文法構造解釈がまちがっていてもユーザーが修正することができなかったが、今もっているものでは品詞を指定することができるようになっている。これが旧版と新版の違いなのか、安い製品と高い製品の違いなのかは確認していないが。】

文献

  • A.G. エッティンガー(Oettinger): 科学におけるコンピュータの利用。サイエンティフィック アメリカン 編 (1968), 遠山 啓 監訳, 宮本 敏雄, 松野 武 訳 (1971): 未来社会と数学 (現代数学の世界 6), 講談社, 233 -- 265. (このページ番号は単行本版のものだが、この本はブルーバックスでも出版された。)