バイドゥが機械翻訳で新手法、「同時通訳」実現への道開く
バイドゥが、より自然でリアルタイムな機械翻訳の新手法を開発した。
「同時」翻訳システムの開発はこれまで一筋縄ではいかなかった。言語が違うと単語の並び方が違ってくるからだ。たとえば、次の文を英語、そして中国語で考えてみよう。
The US president meets with the English prime minister.
美国总统与英国首相会务.
英語では「meets」という単語は文頭近くに置かれる。しかし、対応する中国語の単語「会务(huiwu)」は、文の最後に置かれる。このため商用の「リアルタイム」翻訳システムは、話者が文を最後まで話し終わるまで翻訳できない。その結果、ぎこちない遅れが生じ、ユーザーの使い勝手があまりよくないのだ。
バイドゥの新しい手法は、話者が文を話し終わる前に翻訳を始めることで、その遅れを短縮しようというものだ。たとえば、このシステムが上記の文を中国語から英語へ翻訳する場合を考えてみよう。システムは、中国語の文の最初の部分を聞いた後、米国大統領が誰かと会うという見込みに基づいて英単語の「meets」を予測する。このアイデアは、人間の通訳が話者の話す速度に対応するために通常使っている予測手法からヒントを得たものだ。
予測機械学習モデルと同様に、このシステムも膨大な量の類似した構文を持つ言語データで訓練を重ねて妥当な正確さで翻訳する。そのため、システムを広範に展開するにはまだかなりの制約がある。バイドゥの研究者は、中国語から英語への翻訳実験で従来の翻訳システム(文が完結してから訳す)に比べて5単語分遅れることに気がついた。しかし、研究者は新たな方向性を見出したことに興奮している。「同時通訳は、人間の通訳にとって非常に骨が折れ、負担の大きい仕事です」とバイドゥ・リサーチ(Baidu Research)のリャン・ホワン主任科学研究員は話す。「ですから機械の導入で、専門職や消費者にとって、同時通訳というサービスをもっと利用しやすいものにしていきたいと考えています」。