- HOME
- コラム
- 湯川鶴章のテクノロジーフィクション
- 人工知能が加速させるボイス革命
人工知能が加速させるボイス革命
対話エンジン技術のベンチャー、VocalIQ社によると、対話エンジンは主に4つの技術で成り立っているという。まずは音声を認識してテキストに変換する「音声認識」技術。テキストを「理解」する技術。理解に基いて、どのような応答をするのか決める「判断」技術。応答テキストを音声に転換する「音声転換」技術、の4つだ。
同社のCEO、Blaise Thomson氏によると、音声認識の部分はDeep Learningの応用で急速に進化している。しかしそれ以外の技術は、想定シナリオをベースにした受け答えにとどまっているのが現状。想定される質問がくれば、それなりに受け答えができるが、想定外の質問にはまったく答えられない。
iPhoneのsiriでも「今日の東京の天気は?」というような、ありがちの質問をすると的確に答えてくれる。しかし何にでも答えられるわけではなく、siriが想定しない質問をすると「すみません。理解できません」という答えが返ってくる。現状では、答えられない問いの方が多いくらいだと思う。
同社は、その「理解」「判断」の技術の部分にもDeep Leaningを応用しようとしている。大量のデータを読み込ませれることで、「理解」「判断」の領域でも人工知能が成果を上げるはずだという。
Amazonに「待った」をかけることができるか
4月にコラムを書いてから、この領域でのテック大手各社の動きが活発になってきている。
Facebookはこのほど、Deep Learnignをテキスト解析に応用するための人工知能エンジン「DeepText」を開発したと発表した。対話エンジンの「音声認識」「理解」「判断」「音声変換」のうち、Facebookに投稿されたテキストを使って「理解」の領域の人工知能を賢くさせようというわけだ。
Googleは5月に、Google Homeと呼ばれるスマートホームのプロジェクトを発表。核になるのは対話エンジンを搭載した卓上スピーカーで、Amazon Echoに対抗する製品を年内に発売する見通しだ。スマートホームの覇権争いではAmazonに遅れを取った形だが、音声認識ではAndroidケータイを持つGoogleに一日の長がある。音声認識の精度のよさでAmazonに追いつき追い越すことができるのだろうか。要注目だ。
AppleとOpenAIの提携は何を意味するのか 2024.06.13
AIは今後も急速に進化する? 進化が減速し始めた? 2024.06.05
AI自体を製品にするな=サム・アルトマン氏からスタートアップへのアドバイス 2024.05.29
汎用AIが特化型モデルを不要に=サム・アルトマン氏最新インタビュー 2024.05.27
マーク・ザッカーバーグ氏インタビュー「なぜAIを無料公開するのか」 2024.05.14
AIエージェントの時代はどこまできているのか 2024.05.07
生成AIでネット広告はどう変わるのか 2024.04.25