マイクロソフト、AIチップ内部に液冷システムを開発:現行技術の3倍の熱除去性能を実現

著者
CTOL Editors - Ken
18 分読み

マイクロソフトの画期的な冷却技術が、1000億ドル規模のAIインフラ競争の勢力図を塗り替える可能性

マイクロソフトの静かな研究室で、研究者たちは人工知能の発展を妨げる最大の課題の一つを解決した可能性があります。その解決策は華々しいものではありません。新しいチップ設計や特殊な合金ではなく、驚くほどシンプルなものです。それは、チップの内部に髪の毛ほどの細い溝を直接彫り込み、その中を液体で冷却するというものです。

マイクロ流体冷却として知られるこのアプローチは、AIの経済性を変革する可能性があります。なぜでしょうか?それは、チップが高速化するほど、発熱量が増大するためです。そして熱は、AIのスケーリングにおける最大の障壁となっています。マイクロソフトは、今期だけで300億ドル以上をインフラ拡張に投じる予定です。この冷却技術がその投資に見合う成果をもたらすかどうかの鍵を握っているかもしれません。

Microsoft (wikimedia.org)
Microsoft (wikimedia.org)


誰も無視できない熱問題

もしノートパソコンが膝で熱くなっているのを感じたことがあるなら、それを千倍にした状況を想像してみてください。それが今日のAIプロセッサが直面している状況です。ハイエンドGPUは現在、1つあたり500~700ワットを消費します。次世代では1,000ワットを超える見込みです。比較のために言えば、電子レンジは約1,200ワットで動作します。

従来の冷却システムは、チップに押し付けられた金属プレートと、隠されたパイプの中を循環する液体に依存しています。問題は、これらのプレートが複数のパッケージング層の上に配置されていることです。これは、スプーンを直接入れて冷やすのではなく、カップの外側からコーヒーを冷やそうとするようなものです。機能はするものの、効率は良くありません。

「従来のコールドプレート技術に大きく依存している限り、行き詰まるでしょう」と、マイクロソフトのクラウドオペレーション&イノベーション部門のシニアプログラムマネージャー、サシ・マジェティ氏は説明します。彼は誇張しているわけではありません。業界は急速に「熱の壁」に近づいています。

これは単なる技術的な問題ではありません。冷却性能が、データセンターの各ラックに搭載できるチップの数を決定します。チップが少ないと、効率が低下し、コストが増大します。テック大手がAIに数千億ドルを投じている中、冷却性能のわずかな向上でも、状況を大きく変える可能性があります。


自然の戦略を模倣する

この問題を解決するため、マイクロソフトは自然からヒントを得ました。チップの背面にエッチングされた新しい溝は、葉や蝶の羽に見られる複雑な葉脈パターンに似ています。進化は、流体を効率的に移動させるためにこれらの構造を設計し、マイクロソフトのエンジニアは同じアイデアを応用しました。

その結果、髪の毛ほどの細さの微細な溝が、シリコン上を直接冷却液が流れるようになりました。熱が実際に蓄積されるのはそこです。パッケージング層をなくすことで、液体がより効果的に機能し、より高温で動作させながらも、熱を除去し続けることができるようになりました。

しかし、それだけではありません。マイクロソフトは、各チップの熱署名を監視し、冷却液の流れをリアルタイムで調整するAIシステムを追加しました。固定された設定ではなく、ワークロードの変動に即座に反応するスマートで適応性のある冷却システムが実現するのです。

その数値は驚くべきものです。実験室でのテストでは、コールドプレートと比較して最大3倍の熱除去効果が示されました。チップの温度は65%低下しました。数百のサービスが関わるシミュレートされたMicrosoft Teams通話中も、パフォーマンスはスムーズに維持されました。従来のシステムでは、スロットリング(性能抑制)が作動していただろう状況です。


絶妙なタイミングでの300億ドル規模の賭け

タイミングは重要です。マイクロソフトは、AI能力を拡大するために300億ドル規模の巨額投資の真っ只中にあります。既製のチップを購入する競合他社とは異なり、マイクロソフトは独自のプロセッサ(CobaltとMaia)を設計しているため、この新しい冷却方法をアーキテクチャに直接組み込むことができます。

この垂直統合はゲームチェンジャーとなる可能性を秘めています。アナリストは、今後5年以内に熱的な限界が深刻な問題となると予測しており、熱問題を最初に解決した企業が圧倒的な優位性を獲得するだろうと考えています。冷却効率が向上すれば、データセンターは同じスペースにより多くの電力を詰め込むことができ、大都市近郊で不動産の確保が困難になる中、これは特に大きな意味を持ちます。


競合他社も手をこまねいているわけではない

もちろん、この競争においてマイクロソフトだけが先行しているわけではありません。GoogleはTPUチップ向けに高度な冷却技術をテストしていますが、シリコンレベルではありません。Amazonは、特殊な液体にシステム全体を浸す液浸冷却に注力しています。Metaは持続可能性とエネルギー効率により重点を置いています。

チップメーカーも独自の課題に直面しています。AIチップ市場の約80%を支配するNVIDIAは、同様のアプローチを模索しているものの、本格的な展開には至っていません。IntelやAMDも実験を行っていますが、実世界での導入においては遅れをとっています。

さらに、製造上の課題もあります。TSMCやIntelのようなファウンドリは、歩留まりを損なわずに微細な溝を持つチップを量産する方法を見つけ出す必要があります。実験室でのデモンストレーションから工場規模の生産へ移行することが、常に最も困難な飛躍となります。


投資家にとっての意味

ウォール街は、マイクロソフトがここで開発しているものを完全に評価していないかもしれません。冷却は華やかではありませんが、AIの容量を直接的に拡大します。アナリストは、AIのおかげで、データセンター冷却市場は2028年までに年間150億ドル規模になると予測しています。マイクロ流体冷却は、現在のチップ製造における先進パッケージングのように、その市場のプレミアムな部分を占める可能性があります。

マイクロソフトが追加の電力を消費せずにAIシステムから5~10%の性能向上を実現できれば、利益率は跳ね上がります。そして、同社は設計から展開まですべてを管理しているため、その利益はサプライヤーと共有されることはありません。

投資家は手がかりに注目すべきです。チップファウンドリとの提携に関する発表、Azureデータセンターでの試験的導入、冷却機能が統合された新しいプロセッサモデルなどです。これらのいずれかが、マイクロソフトの競争上の地位を一変させる可能性があります。


熱の壁を打ち破る

最もエキサイティングな点は?この冷却方法は、まったく新しいチップ設計の可能性を切り開くことです。エンジニアは、プロセッサをハイテクな超高層ビルのように三次元的に積層することを夢見てきましたが、熱が常にその実現を阻んできました。シリコンの中を直接液体が流れることで、それらの設計が最終的に実用化されるかもしれません。

データセンター運営者にとって、そのメリットは明確です。冷却性能が向上すれば、エネルギーの無駄が減り、ラック密度が高まり、新たな建物の建設も少なくなります。スペースが希少な混雑した都市市場では、それは非常に価値があります。

マイクロソフトは、この技術を独占するつもりはないと明言しています。同社は、マイクロ流体冷却が業界全体の標準となることを期待しています。もしそうなれば、マイクロソフトは二重の利益を得るでしょう。まず、先駆者としての利益、そして市場全体の方向性を形成する利益です。

AIの需要が急増し続ける中、熱のような最大の障害を取り除く企業が、未来を形作るでしょう。マイクロソフトの新しいアプローチは、同社をまさにその陣営に位置付けており、そのおかげで、今後10年間のAIは大きく異なるものになる可能性があります。

社内投資論文

カテゴリ概要詳細
株式情報 (MSFT)米国株式。価格:$510.77 (変動:-$3.68)。始値:$513.69。出来高:5,224,732株。高値:$516.70、安値:$510.47。最終取引:火曜日、9月23日、17:46:50 +0200。
経営陣の見解単なる実験室の好奇心ではなく、信頼性のある技術的ブレークスルー。Maia/Cobaltシリコンに展開され、サードパーティサプライヤーに採用されれば、Azureに構造的なコスト/性能優位性をもたらす可能性。メリット:ラック密度向上、オーバークロックの余地、冷却エネルギー削減。ダイレベル冷却においてマイクロソフトを競合他社より優位に立たせる。
実証済み技術チップ内マイクロ流体冷却: AIに最適化された、生体に着想を得た溝がダイ裏面にエッチングされている。結果: コールドプレートと比較して最大3倍の熱除去、シリコン上の最大温度差が約65%低下。Teamsのシミュレートされたワークロードで実証済み。意図: 将来の自社製チップおよびAzureデータセンター向け生産に統合。
経済的重要性1. 性能: 次世代アクセラレータ(1-1.4 kW)のより高いクロックを実現。5-10%の性能向上でも大きな意味を持つ。
2. 密度とPUE: より高い吸気温度を可能にし、PUE(電力使用効率)とラックあたりの電力(kW/rack)を改善し、サイトのROIC(投下資本利益率)を向上させる。
3. 設備投資の活用: 建物あたりの計算密度を高め、現在の制約を緩和する。
4. 3Dチップ: 熱管理が障害となる将来の3D IC(集積回路)の実現を可能にする。
市場規模液浸冷却市場は数十億ドル規模、20-25%以上の成長。広範な冷却/電気インフラ市場は2028年までに1000億ドルを超える。マイクロ流体冷却はそのプレミアムセグメントとなるだろう。
競争環境マイクロソフトがリード: チップ内冷却に関するシステムレベルでの実証された準備状況において。競合他社(Google/AWS/Meta): DLC(ダイレクト液浸冷却)/液浸冷却には積極的だが、同程度の成熟度でチップ内デモは公表されていない。チップベンダー(Nvidia/AMD): プログラムを通じて模索しているが、生産には至っていない。専門企業(Corintis, JetCoolなど): 関連技術を推進しているが、チップ内統合ではない。
リスクと課題1. 製造可能性/歩留まり: ダイ強度の低下/反りのリスク。複数年にわたるファブ(製造工場)認定。
2. 信頼性: 液漏れ防止パッケージング、目詰まり、腐食、サービスフローの再設計。
3. 冷却材/規制: PFAS系流体に関する潜在的な問題。調達の複雑性。
4. ベンダー連携: Nvidia/AMDが対応SKUを提供しない場合、規模は自社製チップに限定される。
5. タイムライン: Azureでの本格生産まで2-4年と推定される。
それでも価値がある理由非対称な利益: Azureにとって、複数年にわたる密度/性能上の優位性の可能性。複数のメリット: 研究開発がより優れたDLC設計と熱を考慮したスケジューリングに貢献。エコシステムへの影響: 層間冷却を必要とする3D ICのファウンドリロードマップと整合。
注目すべき主要マイルストーン1. ファウンドリ提携の詳細(TSMC/Intel)。
2. AzureリージョンでのMaia/Cobaltチップでの試験的導入。
3. ベンダーSKU(Azure専用のNvidia/AMD製チップ内冷却対応品)。
4. Open Compute Project (OCP) を通じた標準規格の公開。
5. PUEおよび密度改善に関する具体的な開示。
ポートフォリオへの影響MSFT: AIのユニットエコノミクスを改善し、高水準の設備投資(四半期あたり300億ドル超)の中で利益率をサポート。インフラサプライヤー(例:Vertiv): 液浸冷却の成長から恩恵を受けるが、価値は時間の経過とともにパッケージング/ファブに移行する可能性。化学品: PFASフリー誘電体液体の需要。ファウンドリ/OSAT: プロセスステップ追加によるパッケージングASP(平均販売価格)の増加。
結論技術的に優れており、商業的にも意義深い。AzureのTCO(総所有コスト)と容量に大きなメリットをもたらす可能性。製造と信頼性のリスクがあるため確定事項ではないが、マイクロソフトは現在、ハイパースケーラーの中でチップ内冷却においてトップに立っている。

免責事項:本記事は投資に関する潜在的な影響について論じていますが、投資助言ではありません。投資判断を行う際は、必ず有資格のアドバイザーにご相談ください。

あなたも好きかもしれません

この記事は、 ニュース投稿のルールおよびガイドラインに基づき、ユーザーによって投稿されました。カバー写真は説明目的でコンピューターにより生成されたアートであり、事実を示すものではありません。この記事が著作権を侵害していると思われる場合は、 どうぞご遠慮なく弊社まで電子メールでご報告ください。皆様のご協力とご理解に感謝申し上げます。これにより、法令を遵守し、尊重あるコミュニティを維持することが可能となります。

ニュースレターに登録する

最新のエンタープライズビジネスとテクノロジー情報をお届けします。さらに、新しいサービスや提供物をいち早く独占的にチェックできます。

当社のウェブサイトでは、特定の機能を有効にし、より関連性の高い情報を提供し、お客様のウェブサイト上の体験を最適化するために、Cookieを使用しています。詳細については、 プライバシーポリシー および 利用規約 で確認できます。必須情報は 法的通知