DeepSeekのマイナーAIアップデート、Googleの主力モデル性能にひっそり匹敵

中国のAIスタートアップの「マイナー」アップデートが推論能力に大きな飛躍をもたらす

DeepSeekの最新R1モデルがGoogleの主力AIに静かに匹敵する競争相手として浮上、人工知能の推論におけるクローズドソースLLMの優位性に挑戦

急速に進化する人工知能の分野において、わずかな改善が世界の技術的リーダーシップに多大な影響を与える中、中国のスタートアップDeepSeekは、業界観測筋が「戦略的控えめ表現の達人技」と評する発表を行った。5月28日、同社はR1推論モデルの「マイナーバージョンアップ」と称するものをリリースしたが、その表現は、包括的な評価から明らかになりつつある実質的な性能向上とはますます矛盾しているように見える。

我々の社内ベンチマークに基づくと、R1-0528と名付けられた更新モデルは、GoogleのGemini 2.5 Proの正当な代替品として静かに位置付けられ、技術移転と国家安全保障を巡る地政学的緊張が続く中で、中国のAI能力にとって重要な節目となる。Hugging Faceで寛容なMITライセンスの下で公開されたこの6,850億パラメータのオープンソースモデルは、利用しやすい研究ツールであると同時に、主要なクローズドソース競合他社の価格戦略に挑戦する強力な商用製品でもある。

「マイナー」改善の裏に隠された静かなる革命

DeepSeekの控えめな広報にもかかわらず、社内の性能指標は、主要なAI能力全体にわたる革新的なアップグレードを示している。同社のやり方—公式なプレスチャネルではなくユーザーコミュニティを通じてリリースを発表する—は、注目を最小限に抑えつつ技術的影響を最大化するための意図的な戦略を示唆している。

我々の自社ハードウェアで実施したテストに基づくと、このモデルのコストは100万出力トークンあたり約2.5ドルと推定され、Gemini 2.5 Pro Preview 05-06の価格よりも大幅に低い。しかし、その要求される計算負荷は明らかである。1秒あたり約32.4トークンを生成し、平均完了時間は数分を超えるため、高度な推論タスクの複雑さが浮き彫りになる。

我々の社内技術評価によると、R1-0528は以前のバージョンを悩ませていた根本的な弱点、特に数学的推論とコード生成において改善されていることが明らかになった。モデルの出力容量は約20,000トークンに倍増し、複雑なクエリに対してより包括的な応答を可能にする一方で、大規模なアプリケーションにおける使用コストも同時に増加させる。

業界リーダーとの性能差を縮める

AI推論モデルの競争環境はますます階層化されており、GPT o3およびClaude 4は概ねトップティアを占めている。R1-0528の性能プロファイルは、DeepSeekが推論能力において「ファーストティア」に位置することに成功し、GPT o3 high/medium、Claude 4 Sonnet/Opusに次ぐ位置にあることを示唆している。

数学的推論—これまでオープンソースAIモデルの弱点であった—において、R1-0528は顕著な改善を示している。以前のバージョンが計算精度に苦戦していたのに対し、更新されたモデルはハルシネーション率を大幅に低減し、より信頼性の高い問題解決アプローチを示している。プログラミング能力も同様に進歩しており、より思慮深く保守しやすい出力を示唆している。

このモデルの文章作成能力は、おそらく最も興味深い進歩である。評価者は、感情的な共鳴と文学的な洗練度においてGoogleのGemini 2.5 Proとの驚くべき類似点を指摘しており、これはAI開発における一般的だが論争の的となる慣行である、Gemini 2.5 Proからの潜在的な知識蒸留について推測する向きもある。

グローバルAI競争における戦略的含意

DeepSeekのアプローチは、オープンソースAI開発におけるより広範なトレンドを反映しており、企業は主要なクローズドソースモデルの性能に匹敵しつつコスト優位性を維持することにますます注力している。MITライセンスの決定は、特に基盤技術への自信を示しており、無制限の商用展開を可能にする。

しかし、依然として大きな課題も残る。モデルには安定性の問題があり、コード生成はテストケースの一部でしか一貫した結果を出していない。論理的推論タスクにおける出力のばらつきは最大27%にもなる可能性があり、本番環境への展開には継続的な改良が必要であることを示唆している。

推論プロセス中にモデルが他の言語から時折英語に切り替わる傾向は、AIトレーニングにおける複雑な言語的ダイナミクスを浮き彫りにしている。そこでは、モデルの意図する市場に関わらず、英語データがトレーニングセットを支配することが多い。

市場ポジショニングと経済的ダイナミクス

商業的な観点から見ると、R1-0528は業界観測筋が「強力なモデルより安く、安価なモデルより強力」と評する興味深い市場ポジションを占めている。このポジショニングは、トップティアのクローズドソース代替品のプレミアム価格なしに、高度な推論能力を必要とするコスト重視のアプリケーションにとって特に魅力的であると証明される可能性がある。

このモデルの計算集約度—かなりの処理能力と長時間の完了時間を必要とする—は、リアルタイムアプリケーションへの適用可能性を制限するかもしれない。しかし、速度よりも精度が重要となるバッチ処理、コンテンツ生成、複雑な分析タスクにおいては、R1-0528は魅力的な価値提案となる。

オープンソースAI開発の今後の展望

DeepSeekが今回のリリースに対してとった慎重なアプローチ—実質的なアップグレードをルーティンメンテナンスとして扱う—は、市場ポジショニングと競争ダイナミクスに関する洗練された戦略的思考を示唆している。同社は積極的なマーケティングキャンペーンではなく、段階的な能力の実証とオーガニックな採用に焦点を当てているようだ。

業界アナリストは、今回のリリースがより重要な発表への準備段階であり、現在の改善が将来の画期的な進歩の基礎となっている可能性を示唆している。確立されたクローズドソースモデルとほぼ同等の性能を達成しながらコスト優位性を維持する同社の能力は、市場への浸透拡大に有利に働く。

R1-0528は単なる通常のソフトウェアアップデート以上の意味を持つ—野心的な実験段階から洗練された実行段階へと移行する中国のAI能力の成熟を具現化している。最高のクローズドソースモデルと比較するとまだギャップはあるものの、その軌跡は世界のAI開発センター間での能力の加速的な収束を示唆している。

AIソリューションを評価する企業ユーザーにとって、R1-0528は、地理的起源が性能、コスト、特定のアプリケーション要件よりも重要でなくなる、ますます多極化するAIの状況を垣間見せる。このモデルが確立されたクローズドソース製品に対する信頼できる代替品として登場したことは、明確な階層ではなく、有能な代替品によって特徴づけられるグローバルAI競争の新たな段階を示唆している。

我々は、より広範で独立した性能の視点を得るために、LiveBench.aiのようなさらなる第三者評価をまだ待っている。