10億人以上のユーザーが毎日Facebookを利用している。だが、ランダムに選ばれた2人のユーザー同士は、恐らくお互いの言葉で話せない。ところがFacebookは、こうして選ばれた2人でも、共通の話題で語り合えると考えている。
Facebookの新機能は、自動翻訳ソフトでユーザーが同時に複数の言語でFacebookに投稿できるようにする。こうして投稿された内容は、これまでの使用言語や設定によって、ユーザーが読めるはずの言語で表示される。
新機能は、投稿に含まれるスラングやその他の会話表現を、自社の翻訳プログラムが言語間で変換するときの学習データになり、フェイスブックの役に立つ。この繰り返しにより、Facebookは、日常言語が異なる友だちの、ちょっとした投稿やコメントなどを自動翻訳するときの品質を向上できる。
フェイスブックで翻訳ソフトの開発を指揮するファジル・アヤンさんは、1日から利用可能になる「多言語投稿オプション」(主に英語版で開放されている)は、実際に多くのユーザーが複数の言語で投稿している事実がヒントになったという。今まで、ユーザーは投稿内に別の言語でメッセージを書き分けるか、言語別に投稿していたから、誰かが返事をくれる機会を逃していただろう。
Facebookで投稿するとき、新機能が役に立つ。クリックするだけで別の言語も追加できるからだ。もちろんすべて自分で書いてもいいし、フェイスブックの翻訳ソフトが生成した翻訳文に手を加えてもいい。なお、このツールの前バージョンは、今年の初めからFacebookページを公開していたユーザーや企業に提供されていた。
アヤンさんは、新機能は、より多くのユーザーが複数の言語で投稿するきっかけになり、フェイスブックの翻訳ソフトが、ユーザーが投稿でよく使う言葉を翻訳するときの精度を高めると期待している。
フェイスブックはすでに複数の言語で書かれた投稿を分析して、自社の翻訳ソフトに学習させている。その結果、フェイスブックのシステムは誕生日のお祝いの言葉である「HBD friend! (Happy birthday friend!)」を「Feliz cumpleaños amigo!」というスペイン語に翻訳できるが、Google翻訳では「HBD」はそのままである。また、今年初めにフェイスブックのシステムは、フランス語ユーザーが英語の「wow」を「uau」に書き換えていると学んだ (”Facebook Plans to Boost Its Translations Using Neural Networks This Year“参照)。ユーザーが自動翻訳された投稿を編集し、どこを変えたかを新機能が学ぶことで、さらに多くのデータが集まり、翻訳精度はさらに高まるだろう。
オタワ大学のダイアナ・インクペン教授は、実際のユーザーから集めたデータは、優れた口語的感覚を備えた翻訳ソフトを開発するための最高の機会だという。
既存の翻訳システムは、ビジネス、政治、法律、ニュースなどの文書から表現を学習する。だが、そういった文書はプロの翻訳者が翻訳しているため、形式張った言葉になりやすい。グーグルの翻訳システムは自動翻訳の結果をユーザーが編集できるが、それでも、やはり堅苦しくなるとインクペン教授はいう。
「Facebookのアイデアはすばらしいです」(インクペン教授)
スタンフォード大学のクリストファー・マニング教授も同意見だ。
「同じ文書を別の言語で表現するFacebook投稿のデータが十分に集まれば、ずっと多くの日常会話表現を、ずっとよく翻訳できるでしょう」
ただしマニング教授は、クラウドソーシング的に集めたデータは無料だが完璧ではない、と補足した。Facebookのユーザーはスラングを上手に翻訳できる保証はなく、システムが間違った訳文を学ぶこともあり得る。フェイスブックも、システムがユーザーから収拾した翻訳文を、すぐに、そのまま使うわけではない、としている。