シリコンバレーの新たな戦場:NVIDIAがAIの神経系を再構築する大胆な戦略
MetaとOracleがSpectrum-Xイーサネットを採用。これは人工知能のアーキテクチャを再構築し、一企業の支配力の限界を試す動きとなる可能性がある。
カリフォルニア州サンノゼ — 今日の人工知能ブームを牽引するデータセンターは、壁に突き当たっている。ニューラルネットワークは肥大化の一途を辿るが、それらを繋ぐデジタルな「パイプ」が追いつかないのだ。
月曜日、NVIDIAはMetaとOracleの両社が、その大規模なAIインフラストラクチャ全体でSpectrum-Xイーサネットスイッチを導入する計画を明らかにした。この動きは、NVIDIAの支配力をチップを超えて、機械学習システムが思考し、相互に通信するための結合組織にまで拡大させるものだ。

両社にとってこれは大きな意味を持つ。ただし、その理由は異なる。オープンソースのマルチベンダーアプローチで知られるMetaと、緊密なオールインワン統合で知られるOracleは、めったに同じ道を歩まない。両社がNVIDIAに示した共通の信頼は、NVIDIAのジェンスン・フアンCEOが「AI工場」と呼ぶものをテクノロジー大手がいかに構築するかにおいて、転換点となる可能性がある。
しかし、この興奮の裏には業界全体の疑問が横たわっている。AIの未来は、単一ベンダーが所有する厳密に管理された垂直統合型システムの上で動くのか、それとも市場の競争力を保ち、購入者が主導権を握るオープンで柔軟な標準の上で動くのか?
ネットワークがボトルネックになるとき
問題は物理学に帰着する。今日の言語モデルが数兆のパラメータに膨れ上がるにつれて、それらは数千ものGPUが絶えずデータ(勾配更新、モデルウェイトなど)を交換することに依存する。この絶え間ないやり取りが、膨大な量のトラフィックの急増でネットワークを溢れさせるのだ。
従来のイーサネット機器は、このような負荷に耐えるようには作られていなかった。アナリストの推定によると、一般的なデータセンターネットワークはAIトレーニング時に約60%の実効スループットしか達成できない。残りは混雑、バッファ遅延、トラフィック衝突によって失われる。失われたパーセンテージポイントのそれぞれが、アイドル状態のGPUを意味する。数百万ドルものハードウェアが、デジタルな指をこねくり回しながら座っているようなものだ。
NVIDIAは、そのSpectrum-Xシステムがこの計算を変えると主張する。専用に構築されたスイッチをカスタムネットワークカードとAIに最適化されたソフトウェアと組み合わせることで、同社は利用率を95%まで押し上げられると述べている。このプラットフォームは混雑が発生する場所を予測し、問題になる前にデータを再ルーティングする。NVIDIAによると、これらの数値は同社のスーパーコンピューターから直接得られたものだが、実際のマルチベンダー環境における外部検証はまだ限られている。
ハイパースケーラーの方程式
両社の中でも、Metaの動きはより注目を集める。同社はオープンネットワーキングの規範を確立したと言っても過言ではなく、Broadcom、Aristaなどの機器を組み合わせてベンダーロックインを回避してきた。そのため、MetaがNVIDIAの技術をMinipack3NスイッチとFacebook Open Switching Systemソフトウェアに統合するのを見ることは、何か重要なことを示唆している。つまり、NVIDIAのハードウェアが本当にそれほど先行しているか、あるいはMetaがAIの性能とネットワーク設計をもはや切り離して扱えないと判断したかのどちらかだ。
業界関係者は、Metaが全てを捨て去るわけではないと囁く。むしろ、既存のBroadcomインフラと並行してSpectrum-Xを運用し、選択肢を残しつつリスクを分散する可能性が高いという。
対照的に、Oracleの動きはいつものパターンに合致する。同社はNVIDIAとの深い協業をクラウド戦略の中心に据えてきた。Spectrum-Xの採用は、次世代の「Vera Rubin」アーキテクチャと連携するものであり、パートナーはこれを「ギガスケールAI工場」と呼ぶものに数百万のGPUを連結するよう設計している。Oracleにとっての論理は単純だ。速度と信頼性が最も重要である場合、統合は常にモジュール性を上回る。
マーチャントシリコンの反撃
NVIDIAの勢いは見過ごされていない。インターネットの大部分のバックボーンを形成するチップを提供するBroadcomは最近、自社のイーサネット最適化設計に基づき、OpenAIとの主要なAIネットワーキング契約を獲得した。Ciscoは、大陸間のデータセンターを結ぶ長距離接続向けにSilicon One P200チップを推進しており、MicrosoftとAlibabaはすでにこれを採用している。
一方、AMD、Arista、Broadcom、Cisco、Intel、Meta、Microsoftを含む主要企業連合であるUltra Ethernet Consortiumは、1.0仕様を発表した。その目標は? 顧客を単一ベンダーにロックインすることなく、NVIDIAの性能に匹敵することだ。言い換えれば、これはプロプライエタリなスタックに対する協調攻撃である。
賭け金はこれ以上ないほど高い。アナリストは、AIデータセンターネットワーキングが今後5年間でスイッチ売上で800億ドルから1000億ドル(約12兆円から15兆円)を生み出すと予想している。イーサネット速度が800Gbpsから1.6Tbpsに跳ね上がる中、NVIDIAの課題は明確だ。他の業界が追いつこうと競争する中で、リードを維持することである。
性能主張の分析
その95%対60%のスループット主張は印象的に聞こえるが、文脈が重要だ。NVIDIAの数値は、理想的な条件と、その機器に最適化されたワークロード下での、同社のテストラボからのものである。実際の環境—ネットワークが雑然としていて、混在し、予測不可能である—では、結果は大きく異なる可能性がある。
競合他社もその話を完全に信じているわけではない。BroadcomのJericho4導入に詳しいエンジニアは、適切に調整すれば、そのシステムは80%台後半の効率を達成できると述べている。彼らの主張では、残りのギャップはハードウェアよりも、ネットワークのアーキテクチャと最適化の仕方に関係しているという。
それでも、NVIDIAの統合における優位性は否定できない。そのネットワークカード、スイッチ、ソフトウェアライブラリ、そして輻輳制御はすべて、一つのまとまった有機体として機能する。これは、複数のベンダーが協調しなければならないオープンエコシステムでは再現が難しい。顧客がそのパフォーマンス向上と引き換えに柔軟性を犠牲にすることを受け入れるかどうかは、彼らが速度よりも自由をどれだけ重視するかによるだろう。
スケールアクロス戦略
次のフロンティアは単に大きなモデルだけでなく、それらを分散させることだ。NVIDIAの新しいSpectrum-XGS技術は、データセンター全体を統合されたグローバルなトレーニングクラスターに接続することを目指す。モデルが単一のサイトには大きすぎ、電力消費の激しいGPUファームが地域を超えて手頃なエネルギーを求めるにつれて、大陸間でトレーニングを調整する能力が重要になる。
ここで、NVIDIAはCiscoと真っ向から対決する。Ciscoのディープバッファシリコンは、長距離AIトラフィックのために特別に作られている。この戦いは単なるスペックではなく、各プラットフォームが分散トレーニングジョブに伴う遅延と障害をどれだけうまく処理できるかによって決まるだろう。数千マイル(約数千キロメートル)にわたってGPUを同期させる場合、わずかな中断でも全体が失敗に終わる可能性があるからだ。
投資の見通しと将来の兆候
投資家やアナリストにとって、ビジネスの角度は明確だ。ネットワーキングはNVIDIAの次の大きな収益源となる可能性がある。スイッチ自体だけでなく、ネットワークカード、光部品、そしてそれら全体を結びつけるソフトウェアにも収益の機会がある。アナリストによると、NVIDIAがAIイーサネット市場のわずか10〜20%を獲得するだけでも、2027年までに年間売上高で数十億ドル台前半(100億ドル台)を達成し、30%台半ばの魅力的なマージンも得られる可能性があるという。
しかし、競争は急速に激化している。BroadcomのOpenAIとの提携は、マーチャントシリコンが依然として重要であることを証明している。Ultra Ethernet Consortiumがオープン標準を推進することで、性能の同等性が達成されれば、今後2〜3年以内にNVIDIAの価格決定力が圧迫される可能性がある。歴史的に見ても、Metaのようなハイパースケーラーは複数の供給元から購入することを好むため、バックアッププランなしにNVIDIAに全権を委ねることはないだろう。
機器メーカーにとって、波及効果は様々だ。NVIDIAのハードウェアがArista Networksの領域と重複するため、同社は最も深刻な脅威に直面している。Ciscoは長距離接続でニッチな市場を見出すかもしれないが、迅速な行動が必要となるだろう。Broadcomは、特定のAI分野で一部のシェアを失ったとしても、多様な顧客基盤のおかげで回復力を維持している。
注目すべき主要データポイントは、MetaとOracleの実際の導入がどのように機能するか、1.6テラビット光部品の需要がどのように変化するか、そして規制当局がNVIDIAの拡大するエコシステム支配に疑問を呈し始めるか、である。
そして、いつものように投資家は覚えておくべきだ。過去のパフォーマンスは将来を保証するものではない。半導体ネットワーキング業界は、技術革新、競合他社の予期せぬ動き、そして変化する標準によって急速に変化する。情報収集を怠らず、分散投資を行うことは賢明であるだけでなく、不可欠である。
未解決の問い
結局のところ、核心的なジレンマは残る。AIインフラは、性能の最後の1滴まで追求する緊密に統合されたプラットフォームに集約されるのか? それとも、オープンで分散型で競争的なままであるのか?
月曜日の発表は振り子を統合へと傾けつつあるが、同時にオープンスタンダード陣営に火をつけた。両陣営とも、この競争は単なる生の速度だけでなく、AI時代のアーキテクチャそのものを誰が支配するのかに関わることを知っている。
MetaとOracleがこれから何を構築するのか、そして彼らが代替案への扉を開いておくかどうかは、このギガスケールインテリジェンスの新時代において、どちらのビジョンが勝利するかを我々に教えてくれるだろう。
投資助言ではありません
