【徹底解説】DeepSeek革命のすべて
これまでIC産業におけるアメリカ企業と中国企業の差は大きく、中国はICの輸入に関税をかけていないので、中国の国産ICは苦戦してきた。しかし、アメリカがICの輸出規制を強めると、かえって中国のIC産業の発展を促す「幼稚産業保護政策」として機能してしまう可能性がある。
では、DeepSeekは、OpenAIなどに比べて性能が劣るICしか入手できない状況のなかで、いかにしてそれらより効率的に生成AIを作ることができたのだろうか。
OpenAI側はDeepSeekのモデルはOpenAIのモデルを不正に「蒸留」して作成したものだと非難している(『Gigazine』、2025年1月30日)。
ただ、もともと生成AIの訓練にはインターネット上にある膨大な情報を集めて学習するので、DeepSeekの訓練過程で学習した中にはChatGPTが生成した文章などもある。生成AI同士がそうやって互いに参照しあうのはこの業界の常識だという指摘もあるし、果たしてそうしたことだけでライバルの性能を上回るものを作れるのかという疑問もある(『ITmedia AI+』2025年2月7日、劉・屈、2025)。
結局のところ、DeepSeekのモデルがより優れていたからこそ、低コストでGPT-4oなどを上回る成績を上げることができたのではないだろうか。
モデルの概要についてはDeepSeekのウェブサイトに掲載されているテクニカルレポート(DeepSeek-AI, 2025)に書かれている。その内容を理解して紹介する能力は残念ながら私にはないが、Multi-head latent attention とDeepSeekMoEの二つが重要な技術らしい。
【徹底解説】DeepSeek革命のすべて 2025.02.15
EVと太陽電池に「過剰生産能力」はあるのか? 2024.05.29
情報機関が異例の口出し、閉塞感つのる中国経済 2024.02.13
スタバを迎え撃つ中華系カフェチェーンの挑戦 2024.01.30
出稼ぎ労働者に寄り添う深圳と重慶、冷酷な北京 2023.12.07
新参の都市住民が暮らす中国「城中村」というスラム 2023.11.06
不動産バブル崩壊で中国経済は「日本化」するか 2023.10.26