Google AIの不振:Gemini 2.5 Pro 06-05が批判を招き、謎の「Kingfall」モデルが登場
Googleの人工知能部門は現在、困難な状況に直面している。最新の「Gemini 2.5 Pro 06-05」のリリースが、前バージョンと比較して劣悪なパフォーマンスを提供したとして開発者コミュニティから広範な批判を招いている一方、「Kingfall」とコードネームが付けられた謎のモデルが流出し、同社のAI戦略を再構築する可能性のあるゲームチェンジャーとして浮上している。
2025年6月5日にリリースされたGemini 2.5 Pro Preview 06-05は、開発者コミュニティから厳しい批判を浴びている。包括的なベンチマークデータは、それが置き換えた5月6日版のモデルと比較して、複数の重要な指標において大幅なパフォーマンス低下を示している。LiveBench.aiの評価によると、新しいモデルの全体平均スコアは71.99から69.39に下落し、全体的な能力の懸念すべき低下を示している。
ご存知でしたか? Googleの広報リリースによると、GoogleのGemini 2.5 Pro Preview(2025年6月5日リリース)は、LMArena(1470 Elo)やAider Polyglot(86.2%)で際立った結果を出し、業界トップのベンチマークにおいて最先端のパフォーマンスを誇るとされています。Google史上最もインテリジェントなモデルとして称賛されており、開発者向けの「思考バジェット」のような革新的な機能も搭載しています。しかし、これらの印象的な指標にもかかわらず、多くのユーザー(私たちも含め)は、コーディングの信頼性、コンテキスト維持、応答品質に関する問題を挙げ、実際の使用においては期待外れであると発見しました。これは、AIにおける繰り返される課題、つまり「優れたベンチマークスコアが必ずしも満足のいくユーザー体験につながるとは限らない」ことを浮き彫りにしています。さらに、どのベンチマークが有効性を失ったかについて、私たちに貴重な洞察を与えています。
アップグレードがダウングレードに:数字が示す厳しい現実
パフォーマンスの低下は、エンタープライズユーザーや開発者にとって最も重要な複数の主要分野に及んでいる。最も劇的なのは、エージェント型コーディング能力が30.00からわずか13.33へと急落したことである。これは壊滅的な56%の減少であり、多くの自動化されたコーディングワークフローを機能不全に陥らせている。数学のパフォーマンスも同様に88.63から83.33に低下し、実用的なAI展開の要である指示遵守能力は83.50から78.54に低下した。
あるAI研究者は、「エージェント型コーディングの退行は、モデルがエンタープライズアプリケーションに不可欠な複雑な多段階プログラミングタスクを処理する能力に影響を与えるため、特に懸念される」と述べている。
技術コミュニティは、生の数字以上の品質問題について特に声を上げている。開発者らは、コード出力におけるハルシネーション(誤情報生成)の増加を報告しており、モデルが以前よりも頻繁に存在しない関数や変数を生成しているという。複数ファイルにわたるコーディングプロジェクトや段階的なコード修正の信頼性が著しく低下し、多くのチームが以前の5月バージョンに戻らざるを得なくなっている。
開発者の反乱:コミュニティからの反発が強まる
ユーザーからのフィードバックは、パフォーマンス指標を超えた複数の重大な問題点に集約されている。モデルのコンテキスト維持能力が著しく悪化しており、長時間のセッションにおいて、会話履歴を維持したり、ユーザーの指示を記憶したりする頻繁な失敗が報告されている。この不安定さは、詳細への継続的な注意を要する複雑なワークフローにおいて特に問題であることが判明している。
大いに宣伝された「Max Thinking」モードは、強化された推論能力として位置付けられていたが、期待に応えられなかった。ユーザーは、意味のある改善された結果をもたらすことなく速度が低下したと説明しており、一部のユーザーは、標準モードよりも実際には不正確な出力を生成すると報告している。
あるエンタープライズAIコンサルタントは、「新バージョンは多弁だが中身がないと感じる。より多くの言葉を生成するが、実用的な洞察は少なく、これはエンタープライズクライアントが求めるものとは真逆である」と述べた。
インターフェースの変更もユーザーベースをさらに苛立たせており、重要な機能が入れ子になったメニューの奥に隠され、カスタマイズオプションの削減が、確立されたワークフローを妨げている。パフォーマンスの低下とユーザビリティの課題が相まって、GoogleのAI開発の軌道に対する信頼の危機と一部で評されている状況を生み出している。
Kingfallの謎:Googleの未来への偶発的な垣間見
この論争の最中、6月初旬にGoogle AI Studioを通じて、機密のGoogleモデル「Kingfall」が約20分間、誤って公開されたことがAIコミュニティの想像力を掻き立てた。この短時間のリークが、意図的なマーケティングか真のミスかに関わらず、Gemini 2.5 Proの現在の制限とは著しく対照的な能力を明らかにした。
Kingfallは、洗練されたマルチモーダル能力を発揮し、約65,000トークンのコンテキストウィンドウでテキスト、画像、ファイルを処理する。最も興味深い機能は、リソースを大量に消費する複雑な問題に対する段階的な推論を可能にする、設定可能な「思考バジェット」である。初期テスターはコーディングタスクで優れたパフォーマンスを報告しており、単一のHTMLファイルで機能するMinecraftクローンなどの洗練されたアプリケーションを生成することも可能であった。
KingfallのSVG生成能力はAnthropicのClaude 4をも凌駕すると報じられている一方、デバッグと多段階ロジック処理は、短時間の公開中にアクセスした限られたグループから賞賛を集めた。これらの能力は、KingfallがGemini 2.5 Proの完全版であるか、あるいは全く新しい企業向けバリアントのいずれかを示唆している。
戦略的意味合い:GoogleのAIチェスゲーム
AIの状況がますます競争的になる中で、これらの進展のタイミングは戦略的に大きな意味を持つ。Googleは、迅速な反復の必要性と品質維持の義務の間に挟まれているようであり、このバランスは6月5日のリリースで明らかに不利な方向に傾いてしまった。
業界アナリストは、Kingfallのリークは、OpenAIが間もなくリリースすると予想されるo3 ProへのGoogleの対抗策を表す可能性があると示唆している。Kingfallは、エンタープライズ市場における主要な差別化要因として高度な推論能力を位置付けている。モデルのアーキテクチャは、自動化とビジネスプロセス最適化への意図的な注力を示唆しており、これらは需要が継続的に急増している分野である。
しかし、現在のGemini 2.5 Proの退行は、Googleの開発およびテストプロセスについて疑問を投げかける。複数の指標にわたる大幅なパフォーマンス低下は、不十分な検証手順か、ユーザーに不評であることが判明した意図的なトレードオフのいずれかを示唆している。
市場の動向と競争上の位置付け
AIモデルの状況はますます細分化されており、異なるプロバイダーが特定のドメインで優位に立っている。Googleの現在の窮状は、広範な能力を維持しながら、高度な推論やマルチモーダル処理といった新たな能力の境界を押し広げることの難しさを浮き彫りにしている。
年間1500億ドル以上の価値があり、前年比40%で成長しているエンタープライズAI市場は、信頼性と一貫性に対して特に敏感である。Googleの予期せぬモデル更新やエンドポイント変更に関する評判は、すでにエンタープライズ顧客の間で警戒心を生み出しており、今回の退行は特に損害が大きい。
投資の見通し:AI市場の変動を乗り切る
Gemini 2.5 ProとKingfallの異なる軌跡は、AIに特化したポートフォリオにとって複雑な投資環境を提示している。GoogleのGemini 2.5 Proでの直近の失策は、短期的なパフォーマンスに圧力をかける可能性があるものの、Kingfallが示した高度な能力は、適切に実行されれば市場を大きく変革する可能性を示唆している。
投資家は、Googleの広大な計算インフラと研究能力が、この逆境から比較的迅速に回復するのに有利な立場にあると考えるかもしれない。歴史的なパターンを見ると、主要なAIプロバイダーは画期的な改善を達成する前に一時的な退行を経験することが多く、現在の弱点が、長期的なポジションにとって魅力的な機会となる可能性がある。
エンタープライズAI市場の継続的な拡大と、マルチモーダルおよび推論能力を備えたモデルに対する需要の増加は、信頼性の高い高度な機能を提供できるプロバイダーに有利に働く可能性がある。Googleの課題は、Kingfallが示した革新性と、エンタープライズでの採用に必要な安定性を両立させることにある。
市場参加者は、現在の批判に対するGoogleの対応時期、Kingfallの公式発表戦略、および開発またはテスト手順の変更を監視すべきである。同社が現在の懸念に対処しつつ、Kingfallの潜在能力を最大限に活用できるかが、急速に進化するAI市場における競争上の位置付けを決定する可能性がある。
過去のAIモデル開発の実績は将来の結果を保証するものではなく、AIセクターへの投資については、その技術に内在するボラティリティと急速な進化を考慮し、財務アドバイザーに相談すべきである。