Siriを超える音声認識の世界

2017年10月2日（月）16時25分

ケビン・メイニー（本誌テクノロジーコラム二スト）

70年代に入ると米国防総省傘下の防衛先端技術研究計画局（DARPA）が大規模な音声認識システムの開発に取り組み、約1000語を理解できるようになった。21世紀の現アメリカ大統領と似たような語彙力だが、実用化には程遠かった。

音声認識技術で知られるドラゴンシステムズは、90年に最初の消費者向け口述筆記ソフトを発売したが、値段は9000ドル。使うほどに不満がたまる代物だった。98年に私がIBMの研究チームに確認したときも、音声認識技術は日常生活で使うにはまだ不十分だった。

創造のプロセスが変わる

技術が大きく飛躍したのは07年以降だ。グーグルやアマゾンが運営する巨大なデータセンターが、携帯端末やクラウドサービスで交わされる膨大な量の会話を使って言語を「学習」できるようになった。

私たちが話し掛けるたびに、アレクサやワトソンは少しずつ人間の話し方を覚える。いずれ標準的な人間よりシステムのほうが、人間の話を理解できる日も来るだろう。

そこまで賢くなれば、世の中は劇的に変わる。買い物の習慣どころか、思考回路さえ変わるかもしれない。

私たちは数十年をかけて、キーボードとマウスを使って考えるようになった。ドラゴンシステムズのジョエル・グールドは98年に、「口（マウス）を使って考える」時代になれば「創造のプロセスが変わる」と予言している。

ある意味で、脳が本来の機能に立ち返るとも言える。人間は数千年の間、ペンもタイプライターもワープロも使わずに物事を考え、創造した。叙事詩『イリアス』を紡いだホメロスにキーボードは必要なかった。

音声認識が普及すれば、読み書きができなくても人並みの生活を送れるようになる。グーグルの音声認識サービスが途上国の言語に次々と対応しているのは、これまで手の届かなかった市場を見据えているからだ。

読み書きができないか、インターネットが使えない成人は全世界で7億8100万人。彼らは安価な携帯電話に話し掛けるだけで、公共サービスに登録し、銀行口座を開設して、猫の動画を見られるようになる。

さて、私はアレクサに「2つのターンテーブルと1つのマイクロホンって何のこと？」と質問した。答えは――「さあ、分かりません」。

ちなみに、正解はベックの90年代のヒット曲の歌詞。アイスクリームと間違えなかったことは褒めておこう。

【お知らせ】ニューズウィーク日本版メルマガリニューアル！
　ご登録（無料）はこちらから＝>>

[2017年10月 3日号掲載]

今、あなたにオススメ

ニュース速報

ワールド

トランプ氏、米軍制服組トップ解任　指導部の大規模刷

2025.02.22

ワールド

アングル：性的少数者がおびえるドイツ議会選、極右台

2025.02.22

ワールド

アングル：高評価なのに「仕事できない」と解雇、米Ｄ

2025.02.22

ビジネス

米国株式市場＝3指数大幅下落、さえない経済指標で売

2025.02.22

ニュース速報一覧

今、あなたにオススメ

PICK UP

DeepSeekショックでNVIDIA転落...GPU市場の行方は？専門家たちの見解

2025.01.28

健康

有害なティーバッグをどう見分けるか？...研究者のアドバイス【最新研究･続報】

2025.01.21

海洋保全

ネコも食べない食害魚は「おいしく」人間が食べる...対馬の海を「磯焼け」から救う、ある女性の戦い

2025.01.24

健康

世界初の研究：コーヒーは「飲む時間帯」で健康効果が異なる【最新研究】

2025.01.25

新着

SNS

深夜の防犯カメラ写真に「幽霊の姿が！」と話題に...車の助手席に座る「白い顔の女」の正体は？

2025.02.22

SNS

【動画】「能面のような真っ白の顔の女」が助手席に...防犯カメラ写真に「幽霊が写っている」と話題に

2025.02.22

Surviving The Trump Era サム・ポトリッキオ

日米首脳会談で「ホームラン」を打った石破首相、そこに潜む深刻な懸念材料

＜アメリカの知日派が石破訪米を絶賛する一方で、トランプが本当に重視するのは「空気が読めるか」どうかではない＞日本人の「

2025.02.22

最新記事

Siriを超える音声認識の世界

創造のプロセスが変わる

関連ワード