人工知能が加速させるボイス革命

2016年06月06日（月）17時00分

　対話エンジン技術のベンチャー、VocalIQ社によると、対話エンジンは主に４つの技術で成り立っているという。まずは音声を認識してテキストに変換する「音声認識」技術。テキストを「理解」する技術。理解に基いて、どのような応答をするのか決める「判断」技術。応答テキストを音声に転換する「音声転換」技術、の４つだ。

　同社のCEO、Blaise Thomson氏によると、音声認識の部分はDeep Learningの応用で急速に進化している。しかしそれ以外の技術は、想定シナリオをベースにした受け答えにとどまっているのが現状。想定される質問がくれば、それなりに受け答えができるが、想定外の質問にはまったく答えられない。

　iPhoneのsiriでも「今日の東京の天気は？」というような、ありがちの質問をすると的確に答えてくれる。しかし何にでも答えられるわけではなく、siriが想定しない質問をすると「すみません。理解できません」という答えが返ってくる。現状では、答えられない問いの方が多いくらいだと思う。

　同社は、その「理解」「判断」の技術の部分にもDeep Leaningを応用しようとしている。大量のデータを読み込ませれることで、「理解」「判断」の領域でも人工知能が成果を上げるはずだという。

Amazonに「待った」をかけることができるか

　４月にコラムを書いてから、この領域でのテック大手各社の動きが活発になってきている。

　Facebookはこのほど、Deep Learnignをテキスト解析に応用するための人工知能エンジン「DeepText」を開発したと発表した。対話エンジンの「音声認識」「理解」「判断」「音声変換」のうち、Facebookに投稿されたテキストを使って「理解」の領域の人工知能を賢くさせようというわけだ。

　Googleは5月に、Google Homeと呼ばれるスマートホームのプロジェクトを発表。核になるのは対話エンジンを搭載した卓上スピーカーで、Amazon Echoに対抗する製品を年内に発売する見通しだ。スマートホームの覇権争いではAmazonに遅れを取った形だが、音声認識ではAndroidケータイを持つGoogleに一日の長がある。音声認識の精度のよさでAmazonに追いつき追い越すことができるのだろうか。要注目だ。

次のページ音声認識に強いグーグル

この筆者のコラム

AppleとOpenAIの提携は何を意味するのか 2024.06.13

AIは今後も急速に進化する？進化が減速し始めた？ 2024.06.05

AI自体を製品にするな＝サム・アルトマン氏からスタートアップへのアドバイス 2024.05.29

汎用AIが特化型モデルを不要に＝サム・アルトマン氏最新インタビュー 2024.05.27

マーク・ザッカーバーグ氏インタビュー「なぜAIを無料公開するのか」 2024.05.14

AIエージェントの時代はどこまできているのか 2024.05.07

生成AIでネット広告はどう変わるのか 2024.04.25

記事一覧へ

プロフィール

湯川鶴章

AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算２０年間の米国生活を終え２０００年５月に帰国。時事通信編集委員を経て２０１０年独立。2017年12月から現職。主な著書に『人工知能、ロボット、人の心。』（2015年）、『次世代マーケティングプラットフォーム』（2007年）、『ネットは新聞を殺すのか』（2003年）などがある。趣味はヨガと瞑想。妻が美人なのが自慢。