OpenAIがGPT-5-Codexを発表、7時間連続でコードを記述。開発者たちは性能劣化したAnthropicのClaudeを見限る

著者
CTOL Editors - Ken
16 分読み

OpenAI、数時間にわたりコーディングを続けるGPT-5-Codexを発表。開発者ツール市場の軍拡競争が激化

思考時間を動的に調整する画期的なモデル、280億ドル規模のプログラミング市場におけるGitHubの支配を脅かす

2025年9月15日 — OpenAIは、7時間を超える自律的なコーディングセッションが可能な専門AIモデル「GPT-5-Codex」を発表しました。これは、急成長する開発者ツール市場における主導権争いを大きく激化させるものです。

サンフランシスコに拠点を置く同社の最新の提供は、AI支援プログラミングにおける根本的な転換点となります。このモデルは、タスクの複雑さに基づいて計算リソースを割り当てる動的な「思考時間」機能を特徴としています。簡単なリクエストには最小限のリソースを使い、複雑なリファクタリング操作には多大な処理能力を投入します。

今回のリリースは、世界の開発者人口が2,900万人に迫り、AIコーディングアシスタントがソフトウェア開発ワークフローの中心的な存在になりつつある中で行われました。このタイミングは特に重要で、OpenAIは、最近までClaude CodeとCursorでこの分野を支配していたAnthropicから、エージェント型プログラミングの王座を奪還したように見えます。業界筋の報告によると、今日の発表より前から、Claude Sonnet 4およびClaude Opus 4.1の最近のパフォーマンス問題により、開発者のAnthropicのClaude Code/CursorからOpenAIのCodexプラットフォームへの大幅な移行が既に進んでおり、OpenAIの提供する製品への勢いが移っていたことが示唆されます。

機械が夜勤を引き受ける時代へ

従来のコーディングアシスタントが提案やスニペットを提供するのに対し、GPT-5-Codexは最小限の人間による監視で、複数ステップにわたるエンジニアリングタスクを自律的に実行できます。社内テストでは、システムが7時間以上連続で稼働し、実装を繰り返し、テストの失敗を修正し、機能的なコードを生成する事例が確認されました。

このモデルの適応型アーキテクチャは、従来の常識から逸脱しています。計算リソースを事前に割り当てるのではなく、GPT-5-Codexはタスクの途中で分析を延長することを決定できます。これにより、当初5分で解決しようとした問題に1時間かけることも可能です。

簡単なインタラクションでは、システムは前モデルと比較して計算トークンを93.7%削減します。一方で、難易度が上位10%の複雑なタスクでは、推論時間を倍増させ、業界専門家が力任せの処理ではなく「真の課題解決の粘り強さ」と評する能力を発揮します。

基盤となるGPT-5モデルのコーディング能力は、この競争の変革において決定的な役割を果たしています。CTOL.digitalのエンジニアリングチームは、GPT-5の思考モードが日常の開発タスクにおいてAnthropicのClaude Opus 4.1やGoogleのGemini 2.5 Proを大幅に凌駕し、より正確なコード生成、優れたデバッグ支援、そして信頼性の高い大規模なリファクタリングを提供する利点を報告しています。

眠らないコードレビュー

おそらくより即座に影響を与えるのは、GPT-5-CodexのGitHubのプルリクエストワークフローへの統合でしょう。このシステムは、コード変更がドラフトから本番環境に対応する状態へと移行する際に自動的にレビューを行い、構文だけでなく、意図された内容と実際の実装との整合性を分析します。

静的解析ツールとは異なり、このAIエージェントはコードベース全体をナビゲートし、依存関係を推論し、テストを実行して動作を検証します。OpenAIの社内開発における早期導入データによると、このシステムは現在、同社のプルリクエストの大部分をレビューしており、人間によるレビューが始まる前に毎日何百もの潜在的な問題を特定しています。

ソフトウェアエンジニアリングマネージャーは、開発サイクルを遅らせるレビューのボトルネックに長年苦しんできました。経験豊富なエンジニアが「非常に影響力の高い」と評価するフィードバックを提供しつつ、誤検知を減らすこのシステムの能力は、技術的解決策が困難だった重要なワークフローの制約に対処します。

OpenAI、エージェント型コーディングの王座を奪還

OpenAIがターミナル、統合開発環境(IDE)、GitHub、およびモバイルアプリケーション全体で積極的な機能統合を進めていることは、単なる漸進的な改善以上の意味を持ちます。これは、かつてClaude CodeとCursor(主にClaude LLMを基盤としていた)でこの重要な分野を支配していたAnthropicから、同社がエージェント型プログラミングのリーダーシップを成功裏に奪還したことを示しています。

この変化は、今日の発表の数ヶ月前から始まっていました。開発者たちは、GitHub Copilotの限定的な提案ベースのモデルを次第に放棄し、最近のパフォーマンス低下を理由にClaude CodeやCursorからも移行していったのです。業界オブザーバーは、より洗練されたエージェント型の代替ツールの登場により、GitHub Copilotは本質的に時代遅れになったと表現しており、また、開発者が実際のエンジニアリングタスクにおいてGPT-5の優れたパフォーマンスを発見したことで、Anthropicの自律型コーディングにおけるかつての支配的な地位は失われました。

Cursorが年間5億ドルの収益率に急上昇したことは、AIネイティブ開発環境への市場の旺盛な需要を裏付けました。しかし、その成功は皮肉にも、純粋な技術的能力よりも統合されたワークフロー実行が重要であることを示しました。この領域において、OpenAIの包括的なプラットフォームアプローチが今や決定的な優位性を提供しています。

技術的優位性が開発者移行を加速

業界ベンチマークは目覚ましい進歩を示しており、OpenAIはSWE-bench Verifiedでの改善と、大規模リファクタリングタスクでの大幅な向上を報告しています。さらに重要なことに、今日のリリース前から加速していたAnthropicのClaude CodeからOpenAIのCodexプラットフォームへの開発者の大幅な移行は、ベンチマークスコアを超えた実世界での性能優位性を反映しています。

エンジニアリングチームは、GPT-5の思考モードがコーディングタスク全般にわたり、Claude Opus 4.1およびGemini 2.5 Proと比較して格段に優れた結果をもたらすと一貫して報告しています。この技術的優位性は、Codexの統合されたワークフローアプローチと相まって、エージェント型プログラミングのリーダーとしてのAnthropicの短い支配を事実上終わらせました。

同社の7時間におよぶ自律的なコーディングセッションに関する主張は、開発者たちが既に経験し始めていた能力の論理的な延長線上にあるものです。絶え間ない指示を必要とした以前のAIアシスタントとは異なり、GPT-5-Codexは文脈を維持し、最小限の人間の介入で複雑な目標を追求できます。この能力は、開発者を競合プラットフォームから引き離す上で決定的な要因となりました。

セキュリティ研究者は、OpenAIがサンドボックス型実行と設定可能なネットワークアクセス制御を重視している点に注目しており、AIエージェントが潜在的に有害なコマンドを実行する可能性に関する企業の懸念に対処していると指摘しています。このシステムはデフォルトでネットワークが無効化されており、インターネットアクセスやシステム変更には明示的な許可が必要となります。

市場再編は技術的現実を反映

今回のタイミングは、AIコーディングアシスタントの初期の波(GitHub Copilotの提案ベースのアプローチに代表される)が、より洗練されたエージェント型システムに取って代わられたという、より広範な業界認識を反映しています。OpenAIによる市場リーダーシップの奪還は、優れた基盤モデルと包括的なワークフロー統合を組み合わせた統合プラットフォームへの決定的な移行を示しています。

ソフトウェアの複雑さがエンジニアリング人材の可用性を上回る速度で増大する中、開発チームの生産性はCEOレベルの懸念事項となっています。今日の強化されたリリースよりも前から発生していたClaude CodeからCodexへの大幅な移行は、開発者が以前の好みや組織の慣性に関わらず、優れた代替ツールが登場すれば迅速に既存のツールを放棄することを示しています。

競争状況は今や明確な階層を示しています。OpenAIの統合型Codexプラットフォームは、かつてAnthropicのClaude Codeが占めていた最上位の地位を取り戻し、GitHub Copilotのかつての支配的な市場シェアは、Cursorや新たなエージェント型プラットフォームといった、より高性能な代替製品に大きく再分配されました。

投資への示唆と市場統合

機関投資家にとって、OpenAIによるエージェント型プログラミングの王座奪還は魅力的な機会を提供する一方で、このセクターの変動しやすい競争ダイナミクスを浮き彫りにしています。Claude CodeからCodexへの開発者の急速な移行は、技術的能力が大きく乖離すると市場ポジションがいかに迅速に変化するかを示しています。

GitHub Copilotの提案ベースモデルの明白な陳腐化と、エージェント型コーディングにおけるAnthropicの短い優位性の喪失は、この市場における持続可能な競争優位性が、流通チャネルや先行者利益よりも、優れた基盤モデルのパフォーマンスから生まれることを示唆しています。

OpenAIのCodexプラットフォームのような、実証的に優れた技術的能力と統合されたワークフローアプローチを持つ企業は、市場が少数の技術的に差別化されたリーダーに統合されるにつれて、プレミアムな評価を得る可能性があります。しかし、開発者の嗜好の急速な変化は、現在の市場リーダーが永続的な競争障壁を維持すると仮定することへの警鐘を鳴らしています。

クラウドインフラプロバイダーは、計算需要の増加から恩恵を受ける可能性があります。特に、GPT-5-Codexのようなエージェント型コーディングシステムは、従来の提案ベースのツールよりも大幅に多くの処理リソースを必要とするためです。これらの先進的なAIコーディングシステムのための基盤となるハードウェアアクセラレーション要件は、この技術的進化の潜在的な間接的な受益者となります。

人間的要素は残る

目覚ましい技術的能力にもかかわらず、GPT-5-Codexや同様のシステムは、本番環境での導入には人間の監視が必要となります。OpenAIは、システムを人間による判断の代替ではなく、追加のレビュー担当者として扱うことを明示的に推奨しています。

同社のこの姿勢は、AIが日常的なコーディングタスクを処理し、技術的な問題を特定できる一方で、ソフトウェア開発は最終的に人間の創造性、ビジネス理解、倫理的判断を必要とし、これらは現在の技術では再現できないという業界全体の認識を反映しています。

開発チームがこれらのツールを日常のワークフローに統合するにつれて、最も成功する導入は、AIの効率性と人間の監視を組み合わせ、人間と人工知能の両方の強みを活用するハイブリッドなアプローチを生み出す可能性が高いでしょう。

投資判断は、個々の状況とリスク許容度に関する包括的な分析に基づいて行われるべきです。テクノロジー株の過去のパフォーマンスは将来の結果を保証するものではなく、読者は投資判断を行う前に資格のあるファイナンシャルアドバイザーに相談すべきです。

あなたも好きかもしれません

この記事は、 ニュース投稿のルールおよびガイドラインに基づき、ユーザーによって投稿されました。カバー写真は説明目的でコンピューターにより生成されたアートであり、事実を示すものではありません。この記事が著作権を侵害していると思われる場合は、 どうぞご遠慮なく弊社まで電子メールでご報告ください。皆様のご協力とご理解に感謝申し上げます。これにより、法令を遵守し、尊重あるコミュニティを維持することが可能となります。

ニュースレターに登録する

最新のエンタープライズビジネスとテクノロジー情報をお届けします。さらに、新しいサービスや提供物をいち早く独占的にチェックできます。

当社のウェブサイトでは、特定の機能を有効にし、より関連性の高い情報を提供し、お客様のウェブサイト上の体験を最適化するために、Cookieを使用しています。詳細については、 プライバシーポリシー および 利用規約 で確認できます。必須情報は 法的通知