DeepSeekの新しいAIモデルV3.1-Terminus、複雑な推論でGoogle Geminiを凌駕し、価格は40分の1に

著者
CTOL Editors - Lang Wang
9 分読み

DeepSeekのV3.1-TerminusがAI推論の強力な担い手として登場

中国のAI開発企業による最新リリースは、複雑な推論タスクにおいて大幅な進歩を示し、企業におけるAI導入のあり方を再形成する可能性のある積極的な価格戦略を維持している。

DeepSeekは2025年9月22日、V3.1-Terminusを発表した。これは、同社のハイブリッドモデルアーキテクチャにおける実質的な強化を意味し、業界専門家は、より高性能な推論システムへの世界的移行を加速させる可能性を示唆している。強化されたモデルは、ツールベースのタスクにおいて目覚ましい改善を示し、同時に西側競合他社にすでに圧力をかけてきた同社の破壊的な低価格構造を維持している。

画期的な性能指標が新たな競争環境を示唆

初期ベンチマークによると、V3.1-Terminusは複雑な推論能力において劇的な飛躍を遂げ、HLE(高度専門知識)スコアは15.9ポイントから21.7ポイントに上昇した。これはGoogleのGemini 2.5 Proを上回り、OpenAIのGPT-5(25.32ポイント)に次ぐ、世界で2番目に高性能なシステムとしてモデルを確立している。

最も顕著な性能向上は、ツール活用シナリオで現れた。BrowseCompスコアは30.0ポイントから38.5ポイントに上昇し、Terminal-benchの性能は31.3から36.7に向上した。これらの改善は、多段階のウェブ検索や複雑なエージェント駆動型タスクにおける能力強化を反映しており、これらは重要なエンタープライズユースケースを構成する。

しかし、最適化プロセスでは興味深いトレードオフも明らかになった。英語でのウェブブラウジング性能は大幅に向上した一方で、中国語でのウェブブラウジング性能は49.2ポイントから45.0ポイントへとわずかに低下した。技術アナリストは、この原因をDeepSeekが以前に広範なクエリ解釈によって意図しない検索上の利点を作り出していた言語混合問題の解決に起因するものと見ている。

ニューラル・シンボリック統合によるアーキテクチャの革新

このモデルの性能向上は、Knowledge Interaction Protocol (KIP) との統合に一部起因している。KIPは、現在のLLMアーキテクチャにおける根本的な限界に対処する斬新なフレームワークである。従来のベクトルデータベースやキーバリューストアとは異なり、KIPは概念と命題が相互接続されたノードと関係として存在するグラフネイティブな設計原則を採用している。

当社のCTOLエンジニアリングチームの一員は、このシステムを「忘れっぽい天才から知識豊富なパートナーへの根本的な転換」と表現し、プロトコルがインタラクション全体にわたって構造化された永続的なメモリを維持する能力を強調した。このフレームワークは、知識カプセル—分散型知識共有と、これまでの本番AIシステムでは利用できなかったバージョン管理機能を可能にする、アトミックで冪等な単位—を導入している。

このプロトコルの自己ブートストラップアーキテクチャにより、スキーマがグラフ構造自体の中で進化することが可能となり、外部インフラの依存なしに継続的な学習を可能にする可能性がある。初期の実装は、これがAIエージェントを静的なプログラムから、クロスドメイン推論と協調的な知識開発が可能な動的に進化するシステムへと変革する可能性を示唆している。

価格戦略が西側モデルに対し競争圧力を維持

DeepSeekは積極的な価格構造を維持し、100万出力トークンあたり1.68米ドルを請求している。これは、GPT-5とClaude Opus 4.1の100万トークンあたり75.00米ドルという料金を劇的に下回る。APIは高度なキャッシュメカニズムを実装しており、キャッシュヒットの場合は100万トークンあたり0.07米ドル、キャッシュミスの場合には0.56米ドルを請求し、反復タスクを伴う企業導入においてコスト効率を生み出している。

この価格設定アプローチは、中国のAIエコシステム内におけるより広範な戦略的ポジショニングを反映している。そこでは、国家支援が、西側競合他社が利益率を維持しながら対抗するのに苦慮するような積極的な市場浸透戦略を可能にしている。このモデルは、中国のAIシステムに典型的な国家検閲要件の対象となるため、機密性の高い企業環境での導入を制限する可能性があるものの、一般的なビジネスアプリケーションへのアクセスを拡大している。

技術アーキテクチャが戦略的設計上の決定を明らかにする

V3.1-Terminusは、DeepSeekが8月に導入したデュアルモードアーキテクチャに基づいて構築されており、異なるタスクカテゴリに最適化された、個別の「思考」モードと「非思考」モードを維持している。思考モードは、多段階推論を必要とする複雑なツールベースの操作を処理し、非思考モードは、単純な会話型インタラクションを管理する。

両モードとも128,000トークンに拡張されたコンテキストウィンドウをサポートしており、更新されたトークナイザーとプロンプトテンプレートを使用して、追加の8400億トークンで学習されている。この学習アプローチは、完全なアーキテクチャの抜本的改革ではなく、反復的な改善というDeepSeekの手法を反映しており、システム安定性を維持しながら迅速な展開を可能にしている。

アプリ、ウェブ、APIインターフェースを含む複数のプラットフォームでのモデルの利用可能性と、Hugging Faceを通じてMITライセンスの下で配布されるオープンソースのウェイトは、幅広いアクセス可能性と開発者による採用に対するDeepSeekのコミットメントを示している。

DeepSeekが次世代の大規模言語モデルを発表する準備を進める中、V3.1-Terminusは現行世代の魅力的な結論を示している。推論タスクにおけるこのモデルの画期的な性能は、ハイブリッドなニューラル・シンボリックアーキテクチャと破壊的な価格戦略と相まって、企業が本番AIシステムに期待できるものの新たなベンチマークを確立する。業界オブザーバーは、V3.1-Terminusがこの世代の能力を決定的に示すものとして機能する可能性があると示唆しており、DeepSeekの今後のリリースが競争環境を再び再定義する可能性を秘めている。これは、AIの進化の急速なペースが減速の兆しを見せず、業界が次の進化の飛躍に備えていることを示している。

本分析は、現在の市場データと確立された性能指標に基づいています。投資判断には、地政学的要因、規制の動向、および個々の組織の要件を考慮する必要があります。読者の皆様は、パーソナライズされた投資アドバイスについて、資格のあるファイナンシャルアドバイザーにご相談ください。

あなたも好きかもしれません

この記事は、 ニュース投稿のルールおよびガイドラインに基づき、ユーザーによって投稿されました。カバー写真は説明目的でコンピューターにより生成されたアートであり、事実を示すものではありません。この記事が著作権を侵害していると思われる場合は、 どうぞご遠慮なく弊社まで電子メールでご報告ください。皆様のご協力とご理解に感謝申し上げます。これにより、法令を遵守し、尊重あるコミュニティを維持することが可能となります。

ニュースレターに登録する

最新のエンタープライズビジネスとテクノロジー情報をお届けします。さらに、新しいサービスや提供物をいち早く独占的にチェックできます。

当社のウェブサイトでは、特定の機能を有効にし、より関連性の高い情報を提供し、お客様のウェブサイト上の体験を最適化するために、Cookieを使用しています。詳細については、 プライバシーポリシー および 利用規約 で確認できます。必須情報は 法的通知