FG Free Report NVIDIA GB200 NVL72の登場による、CSPのインフラ再設計(4月28日号抜粋)

Facebook
Twitter
INDEX

Reasoning AIの到来を受け、トークン経済が始まる今の時代に必要不可欠な存在となったのが、NVIDIAの最新※サーバーラック「GB200 NVL72」です(※2025年4月現在)。

しかしこの「GB200 NVL72」の登場により、世界の主要なクラウドサービスプロバイダー(CSP)各社は、インフラ設計の全面的な見直しを余儀なくされています。

今回は、トークン経済がもたらすAI半導体業界の構造変革について、クラウドサービスとNVIDIAの関わり方という側面からプロのファンドマネージャーが解説します。

投資での資産形成をお考えの方も、既に投資を始められている方も、ご自身の知識と照らし合わせながらご覧ください。

(Fund Garage編集部)

トークン経済という「地殻変動」がもたらした、CSPの戦略転換

Reasoning AIの推論は、従来のGPUでは間に合わない

かつてインターネットが情報流通の構造を根本から変えたように、現在AIによって「トークン」が新たな経済圏を創り出しつつある。

従来、AIが生み出す情報は「答え」や「検索結果」という形で価値を生んできた。しかし、特にReasoning AIの時代においては、「問いに対して推論を重ね、意味ある成果物(=トークン)を生み出すこと」が経済的価値を持つようになる世界へと変化する。

ここで重要なのは、このReasoning AIは従来の生成AIよりも格段に高い推論負荷がかかるため、より膨大で精密なインフラ(GPUリソース)を必要とするという点だ

そのGPUが、NVIDIAの最新サーバーラック(”AIファクトリー”)である「GB200 NVL72だ。事実すでにクラウドサービスプロバイダー(以下CSP)各社が「GB200 NVL72」を導入・稼働準備に入っているという。

つまり、H100世代インフラや旧世代「推論モデル」の延長線上で世界を語る者は、すでに時代遅れになりつつあるのだ。

この現実こそ、トークン経済のインフラ整備が始まったことの証左であり、投資家が真に注目すべき大変革であるということを忘れずに今後の投資活動を行っていこう。

「GB200 NVL72」“AIファクトリー”と言われる所以については、以前の無料記事「エヌビディアの『Blackwell』を知る」で分かりやすく図解しているのでぜひご覧いただきたい。NVL72とは「NVIDIA Blackwellが72個搭載されている」状態であることを、視覚的にご理解いただけるはずだ。

主要CSPの「再設計」〜AIファクトリー時代に向けて〜

先述の通り「GB200 NVL72」という新たな“AIファクトリー”の出現によって、主要CSPはインフラ設計の全面的な見直しを迫られている。これは単なるハードウェアの更新にはとどまらず、言うなれば、AI推論を通貨とする新しい経済圏に対応するためのサプライチェーンそのものの作り替えなのだ。

以下、CSP主要4社(Microsoft ・Azure AWS・Google Cloud・Oracle Cloud)がどう動いているかを整理していく。

1. Microsoft Azure:「最速でGB200インフラを標準化」

GTC2025で、ND GB200 v6シリーズを正式に発表。AzureはもともとOpenAIとの連携を通じて、AI需要の爆発的な伸びを体感してきた。そのため、推論負荷の激変を最も早期に認識し、データセンター設計自体をNVL72対応型へと先んじて再構築している。「トークン消費インフラ化」レースの実質的なトップランナーはAzureだと言えそうだ。

2. AWS:「GPU最適化と自社チップシフト」

もともとNVIDIA H100を中心としたインフラ拡張を急いでいたAWSも、”Reasoningショック”を受けて戦略を急転換。GPUリソース最適化のための社内プロジェクト「Project Greenland」では、

  • Trainiumチップ強化(推論にも活用、Inferentia開発停止)
  • GB200世代インフラへの移行(液冷対応DC設計強化)

という、自社AIチップ戦略を持ちながらも、推論負荷に耐える現実的な選択肢としてGB200世代インフラを見据える方向性を示した。

3. Google Cloud(GCS):「GB200対応とソブリンAIへの布石」

NVIDIA HGX B200を搭載したA4 VMの一般提供開始と、NVIDIA GB200 NVL72を搭載したA4X VMのプレビュー提供開始を発表。さらに、2025年4月に開催されたGoogle Cloud Next 2025では、Sovereign AI(ソブリンAI)構想の一環として、

  • Google Distributed Cloud上でのGeminiモデルのオンプレミス展開
  • NVIDIA Blackwellプラットフォームとの統合
  • Confidential Computingによるデータの安全性確保

という3つの取り組みを公表した。​

4. Oracle Cloud:「規模は小さくとも深いNVIDIA連携」

Oracleは、AWS・Azure・GCSに比べるとCSP規模では劣る。しかし、GTC2025ではNVIDIAと極めて密接な提携を強調した。特にAIファクトリー用途に特化した「超高密度GPUサーバークラスター」をOracle Cloud上で展開すると発表規模拡大ではなく、「AIファクトリー特化型クラウド」として差別化を図る戦略だ。

NVIDIAの「中央銀行化」とRubin世代への展望

トークンが通貨化するということは、GPUリソースが鋳造能力を持つと言い換えられる。そしてもちろん、その中心にいるのはNVIDIAだ

NVIDIAが築き上げた支配力というのは、単なる市場シェアの問題ではなくもっと根本的な構造に基づいている。

1.AIインフラ全体の設計思想を握る

  • GPUチップ単体ではなく、GB200 NVL72ファクトリー全体を設計&提供
  • 冷却方式(液冷)・電源設計・通信網(NVLink Switch System)まで一体化
  • もはやデータセンター設計そのものを握るポジションに

2.エコシステムを事実上、NVIDIA仕様に染め上げた

  • CUDAを基盤とする巨大なソフトウェア開発者群(DPUs・SDKs・AIフレームワーク)
  • DGX CloudやNVIDIA AI Enterpriseなど、クラウド/オンプレミス問わず統一プラットフォーム提供
  • 最新アーキテクチャ(Blackwell)も、各クラウド事業者がほぼ標準採用 →Blackwell世代(とりわけGB200 Superchipクラス)は、1ユニットあたり10万ドル前後という超高価格帯

つまり、NVIDIAはハードウェアの「供給者」であると同時に、インフラ設計者であり、プラットフォームオーナーであり、さらには経済的資源(推論通貨)の供給量を制御できる「中央銀行的存在」になったと言えよう。

そしてこのNVIDIAの進化は、なおも加速し続けている。Blackwell Ultra(GB300)という、現行Blackwell(B200)の推論性能をさらに高めたバージョンがすでに販売を開始した。さらにその次の世代として、2026年後半にはRubinアーキテクチャが投入される予定だ。

Rubin世代では、

  • Blackwell Ultra比で約3.3倍の推論性能
  • より高効率な電力消費
  • Reasoning AIに最適化された超並列推論能力

が実現される見込みであり、さらにその次には、2027年後半にRubin Ultra(推論性能2倍)が控えている。

Rubin世代の到来は、

推論トークンの供給量が爆発的に増大 → トークンコストが低下 → AI推論がインフラサービス化

という流れを生み、「推論経済圏」の拡大へ大いに貢献することが予測できる。この新しい世界では、トークン発行能力=推論キャパシティの支配こそが、経済力そのものとなり、その中核的な役割を担うのがまさしくNVIDIAという推論通貨の中央銀行なのだ。

まとめ

  1. Reasoning AIの到来によって、推論の負荷が激増したため、冷却・電力供給・演算資源すべての次元上昇を可能にするインフラ(GPU)が求められている。
  2. そこで主要CSPは、NVIDIAのGB200世代インフラへの移行を余儀なくされ、実質的にトークン経済のインフラ整備が世界で始まった。
  3. Microsoft Azureは、業界最速でGB200インフラを標準化し、データセンター設計自体をNVL72対応型へと先んじて再構築した。
  4. AWSは、自社チップの強化を進めながらも、GPU最適化の選択肢としてGB200世代インフラへの移行を同時に行っている。
  5. Google Cloud(GCS)は、B200を搭載したA4 VMの一般提供開始と、ソブリンAIへの取り組みを発表。
  6. Oracle Cloudは、他3社に比べて規模は小さいものの、NVIDIAとの密な連携により「AIファクトリー特化型クラウド」として差別化を図る戦略を取っている。
  7. トークン経済の中心に立つのはいうまでもなくNVIDIAだが、その役割はハードウェアの「供給者」にとどまらず、インフラ設計者でもあり、プラットフォームオーナーでもあるという、いわば「中央銀行的存在」となっている。

 

いかがだっただろうか。

これまでの無料記事で何度も説明をしてきた通り(くどいようだが…)、

推論負荷爆増→トークン生成量の爆発的拡大→GPUリソース需要の非連続的増加→データセンターの物理再設計(GB200/NVL72時代へ)

という流れを理解することが、今のAIとGPUの変革の全容を見るために最も大切だ。この構造を理解しているかしていないかで投資結果に大きな差が生まれることはほぼ間違いがない。

FundGarageの無料/有料レポートは週に1度追っていただければ、AI時代の投資活動のお役に立つ内容となっているのでぜひご参考になってほしい。

☆こちらの無料記事は2025年4月当時の有料記事を編集したものであり、今回ご紹介した「GB200 NVL72」は2025年10月現在、最新の製品ではないことをご了承ください。このようにたった半年という期間でも技術進歩や情勢変化が盛んな時代ですので、最新情報をお知りになりたい方は有料版記事のご購読をぜひご検討ください。☆

編集部後記

こちらは、Fund Garageプレミアム会員専用の「プレミアム・レポート」の再編集版記事です。
公開から半年以上経った記事になりますので、現在の情勢とは異なる部分がございます当時の市場の空気と、普遍的な知見の皆様にお届けできれば幸いです。
また、こちらは無料版記事のため、最新の情報個別企業の解説についてはカットしております。
<FG Free Report では割愛>となっている箇所に関心をお持ちになられた方は、是非、下記ご案内よりプレミアム会員にお申し込みください。

有料版のご案内

Fund Garageのプレミアム会員専用の「プレミアム・レポート」では、個別銘柄の買い推奨などは特に行いません。
これは投資家と銘柄との相性もあるからです。「お宝銘柄レポート」とは違うことは予めお断りしておきます。お伝えするのは注目のビジネス・トレンドとその動向がメインで、それをどうやってフォローしているかなどを毎週お伝えしています。
勿論、多くのヒントになるアイデアは沢山含まれていますし、技術動向などもなるたけ分り易くお伝えしています。そうすることで、自然とビジネス・トレンドを見て、安心して長期投資を続けられるノウハウを身につけて貰うお手伝いをするのがFund Garageの「プレミアム会員専用プレミアム・レポート」です。