- HOME
- コラム
- 湯川鶴章のテクノロジーフィクション
- 人工知能が加速させるボイス革命
人工知能が加速させるボイス革命
German-iStock.
<テクノロジー界の次の覇権争いが始まった。狙うのは音声技術の市場。キーボードやスマートホンより速くて容易な入力技術として期待を集める。音声の認識率も、AIのおかげで数年前の70%から現在の90%に向上。これが99%に達すれば、世界が一変すると言われている>
米シリコンバレー関係者が大注目するMeekerリポートが今年も発表された。Meekerリポートとは、シリコンバレーの著名ベンチャーキャピタルKleiner Perkins Caufield Byersに所属するベンチャーキャピタリストMary Meeker氏が毎年発表している「インターネット・トレンド」と呼ばれる調査報告書のこと。詳細なデータをベースに行う未来予測として、最近では米国の産業界全体で注目されるほど評価が高くなってきている報告書だ。
今年の報告書の中で同氏は、特に機械と人間の接点部分である「インターフェース」領域で2つの技術分野に注目し、詳細なデータで近未来を予測をしている。その2つとは音声と自動走行車だ。
音声技術に関しては、2ヶ月前にこの連載コラムで取り上げ、少々フライング気味ではあるものの、その覇権争いの行方まで大胆予測した。(次のキーテクノロジーは音声、次の覇者はAmazon)
今回音声技術がMeekerリポートに取り上げられたことで、音声技術に対する産業界の注目はさらに高まることになりそうだ。
そこで今回のコラムでは、1)Meekerリポートが音声技術をどのように取り上げているのか、2)4月のコラム執筆の時点から今までの2カ月間でどのような動きがあったのか、について報告したい。
iPhoneは山を超えた。次はAmazonの時代
今回のMeekerリポートは、音声認識に関しては「人間とコンピューターのインタラクションの新たなパラダイムとして音声を考える」と題し約20枚のスライドで詳細に解説している。
それによると、音声認識技術はここ数年で性能が格段に向上しており、Googleの音声認識技術の認識率を見ても2010年には70%だったのが2016年には90%にまでなっているという。
【参考記事】グーグルの通訳フォンに重大な疑問
性能の向上に伴い利用する人も増えているようで、米国で音声アシスタントを利用するユーザーの割合が2013年には30%だったのが、2015年には65%に伸びている。
確かに私自身の感覚としても、iPhoneのsiriやGoogleNowの音声認識率はここ数年でかなり性能がアップしている。なのでLINEのやりとりも、最近はキーボードで入力するよりも音声で入力することのほうが増えてきている。
同リポートによると米国での音声認識技術の利用シーンとしては、「家庭内」と答えた人が最も多く43%で、次いで「自動車の中」が36%だった。以前のコラムでも取り上げたAmazonのスピーカー型バーチャルアシスタントのEchoは、その家庭内のニーズにうまく応えたことで大ヒットしているわけだ。
AppleとOpenAIの提携は何を意味するのか 2024.06.13
AIは今後も急速に進化する? 進化が減速し始めた? 2024.06.05
AI自体を製品にするな=サム・アルトマン氏からスタートアップへのアドバイス 2024.05.29
汎用AIが特化型モデルを不要に=サム・アルトマン氏最新インタビュー 2024.05.27
マーク・ザッカーバーグ氏インタビュー「なぜAIを無料公開するのか」 2024.05.14
AIエージェントの時代はどこまできているのか 2024.05.07
生成AIでネット広告はどう変わるのか 2024.04.25