すでにTOEIC960点越え、日本の第一人者に「国産」機械翻訳について聞いた
――(NICTがシステムを提供する)翻訳エンジンTexTra(テキストラ)やVoiceTra(ボイストラ。AI通訳機「ポケトーク」にもこの技術を提供)は、技術を公開すると同時に技術向上のために情報も集めているのか。
音声情報を集めている。アナウンサーのようなきれいな発音、正しい文法だけに対応するのでなく、活舌が悪かったりいい加減な話し方だったりしても音声認識機能を上げられるよう、リアルな音声データを集める。
ただし、GAFAは「コンテンツ」情報も見ている。利用者がどういうことに興味があるか、どういう単語を使っているか、を調べて広告を売るためにも情報を集めているが、NICTはシステムを向上させるためだけにデータを集めている。
――現在のところ、自動翻訳で事足りるのはどんな場面か。
生活一般のところは自動翻訳で賄える。ビジネスに関しては、交渉に使えるようになるのはあと10年後ぐらいだろう。さらに言えば、対面なら少し間違いがあっても相手の反応で分かるが、電話など(相手の反応が見えない状況)だと、今の技術ではまだ難しい。
――ニュース記事や文学作品の翻訳については、自動翻訳でできるようになるのか。
文学作品は、(自動翻訳では)永遠にできないだろう。特許や製薬などの文章は、非文学的で味もそっけもなく、正確であれば直訳でもいい。こうした文章はたくさんのデータがあれば「平均値」が出る。文学はこれとは真逆で、「平均的」ではないので永遠に自動翻訳ではできない。
新聞記事について言えば、文章の前のほうで述べたことに後半の文章が依存する。機械翻訳は1文ずつしか翻訳できないので、これを処理するのが難しい。だが、いずれコンピューターの能力が上がり、文脈処理までできるようになれば、新聞記事の翻訳も可能になるかもしれない。
――今後、自動翻訳はどの程度進化する?
データの量が多ければ、そして良いアルゴリズムがあれば、性能は上がり続ける。しばらくは、性能の限界は来ないだろう。
一方で、天気予報と同じようにたくさんのデータから明日の天気を計算しているだけなので、当たるときもあれば当たらないときもある。その程度だと思って使うのがいい。とはいえ、日常的に天気予報をある程度信用して見ているのと同じように、機械翻訳もある程度信用して使うと効率を上げることができる。
コンピューターが誤訳することを知らないで使っている人が多い。(翻訳文や通訳音声が)けっこうきれいなので(勘違いしてしまいがちだが)、たまに誤訳が入ることに注意しなければならないことを知ってもらいたい。
※インタビュー後編では、自動翻訳をどのように活用すればいいか、今後はどのような英語学習が必要とされるかについて、NICTの隅田フェローについて聞いている。
2020年3月3日号(2月26日発売)は「AI時代の英語学習」特集。自動翻訳(機械翻訳)はどこまで使えるのか? AI翻訳・通訳を使いこなすのに必要な英語力とは? ロッシェル・カップによる、AIも間違える「交渉英語」文例集も収録。