すでにTOEIC960点越え、日本の第一人者に「国産」機械翻訳について聞いた
本誌3月3日号(2月26日発売)は特集「AI時代の英語学習」 Warchi-iStock
<自動翻訳の今のレベルは? グーグル翻訳と何が違う? ビジネスやニュース記事の翻訳に使える? AI通訳機「ポケトーク」にも技術を提供する情報通信研究機構(NICT)の隅田英一郎フェローにインタビューした>
英文和訳でも和文英訳でも、機械翻訳にかけると「笑っちゃうようなひどい文章」が出てきたのは、一昔前の話。2016年に人工知能(AI)のディープラーニング(深層学習)を活用した「ニューラルネットワーク翻訳」の実用化が始まって以来、自動翻訳の質は劇的に向上している。
今や平均的な日本人の英語力をはるかに超えた(TOEICなら960点との測定結果も)とされるAI翻訳が、今後も進化していくのは確実だ。
そんな未来を見て見ぬふりして、ビジネスマンはTOEICスコアを上げようと英会話学校に通い、小学生は必修英語の授業で元気に会話文を復唱......で大丈夫?
自動翻訳(機械翻訳)はどの程度進み、今後はどこまで行くのか。AI翻訳にできること、できないことは。将来的に語学学習はどうあるべきなのか、AIを使いこなして英語強者になるコツは――本誌は3月3日号(2月26日発売)で、新時代の英語戦略について総力特集した。
本誌特集ではさまざまな専門家に取材しているが、その1人、日本の機械翻訳システム開発の第一人者で、アジア太平洋機械翻訳協会(AAMT)会長も務める国立研究開発法人「情報通信研究機構(NICT)」の隅田英一郎フェローのインタビューをここに掲載する。
――実際のところ、今の自動翻訳のレベルはどのくらいなのか。
(翻訳システムを提供する企業)みらい翻訳(東京)のエンジンは、昨年TOEIC960点越えを達成し、東京大学教授が「東大生より機械翻訳の翻訳のほうがレベルが高い」と言っている。ただし、機械は(文章の)「意味」は全く理解できない。
――機械翻訳の精度を飛躍的に向上させたニューラルネットワーク翻訳とは何か。
華々しく世に出たのは2016年で、ここから機械翻訳の潮目が変わった。AIの深層学習を活用し、過去の誰かが翻訳したデータをたくさん読ませるうちに学習するようになる技術だ。
ニューラル翻訳以前は、単語と文法を機械に教え込み、こういう条件の時にはこういう訳語になる、とシステムを作っていった。文法規則に基づくのでこれを「ルールベース」と言ったが、ニューラル翻訳はこれとは全く違うシステム。ニューラル翻訳の中では文法とか対訳辞書などはない。「この文はこう翻訳しなさい」というのを機械に教え込む。
――NICTは「国産」の翻訳エンジンを開発し、技術提供をしているが、グーグル翻訳などのGAFAが提供する機械翻訳との違いは?
GAFAは1つのシステムで全てを賄い、言語や分野ごとに専門のシステムを作っていない。だが、料理の用途によっては万能包丁ではうまく切れず、パン切りナイフや刺身包丁を使ったほうがいいこともある。
NICTは日本語対10言語に限定し、分野も例えば製薬の分野に限定したもの、というふうにシステムを構築する。そうすると性能が上がり、パン切りナイフでパンを切るような切れ味にできる。こうして使ってもらうのが、本来の自動翻訳のあり方だ。