FG Free Report TPUでNVIDIAは終わるのか? GPUとASICの関係性を読み解こう(12月1日号抜粋)

Facebook
Twitter
INDEX

「ASIC(TPU)が伸びたら、NVIDIAは終わる」——このような論調を耳にしたことはありませんか。

しかし本当に重要なのは、GPUとASICの単純な優劣ではなく、AIファクトリーの中で両者がどう役割分担するかという点です。

今回は、TPU騒動を手がかりに、これからのAIインフラ構造について、プロのファンドマネージャーが整理します。

投資での資産形成をお考えの方も、既に投資を始められている方も、ご自身の知識と照らし合わせながらご覧ください。

(Fund Garage編集部)

TPU騒動から見るこれからのAIファクトリー構造

GoogleのTPUでNVIDIAが終わる?

今週(2025年11月26日)の日本経済新聞は、NVIDIA、AI半導体独走に変化の兆し Google設計「TPU」が台頭 』といった見出しで、Googleが独自に設計し自社で利用してきたASICである「TPU」の台頭を報じた。MetaがNVIDIAの最重要大口顧客であることも相まって、PV数を稼ぐには格好のキャッチコピーになり得たと言えよう。実際に、市場のマジョリティはこの話題に敏感に反応した。

一方で、半導体に関する基礎的な構造理解を持つ市場参加者の間では、当初からクエスチョンマークも同時に上がっていた。なぜなら、TPUはGPUではなく、あくまで特定用途向けのASICだからだ

記事の筋立ては明快だ。Gemini 3が外部ベンチマークで高い評価を得たことや、TPU上で高性能モデルが動いていることを背景に、「もはや高価なNVIDIA GPUに頼らなくても高度なAIは作れるのではないか」という見方が広がっている、というものだ。たしかに分かりやすい構図ではあるが、ここにはいくつかの飛躍も含まれている。モデル性能の話と、半導体の市場構造、さらには投資判断を一気につないでしまっているからだ。

もちろん、こうした論調が完全に的外れというわけではない。TPUや自社ASICの活用が広がれば、AIのコスト構造が下がり、GPUの取り分が相対的に削られる領域が出てくる可能性は否定できない。しかし、ここで本当に問うべきなのは、「AIファクトリーの中で、どの仕事をGPUが担い、どの仕事をASICが担うのか」、「その中で、エヌビディアがどのポジションを維持または拡張し得るのか」という具体的な構造の話である。

だからこそ、見出しの強さだけで「NVIDIA終焉」と結論づけるのではなく、まずはGPUとASIC、そしてTPUの違いを整理しておく必要がある。

GPUとASIC(TPU)のAIファクトリーにおける役割

今回のTPU騒動を理解するうえで最も重要なのは、GPUとASICは単純な代替関係にはないという点である。「TPUの方が安くて速い」「自社開発チップの方が効率が良い」という表面的なフレーズだけを並べれば、「高価なGPUはやがて駆逐される」という結論に誰しも飛びつきたくなるだろう。しかし本来、GPUとASIC(TPUを含む)の関係はそのようなゼロサム(一方の利益が他方の損失となる)の構図ではない。本質は、AIファクトリーの内部でどう役割分担しながら共存していくか、という話なのだ。

GPUは、もともと画像処理のために生まれた「行列・ベクトル演算に強い汎用プロセッサ」である。大量の演算が必要なAI向けの仕事と親和性が高いが、GPUの最大の特徴はその「汎用性」にある。モデルの構造やフレームワークが変わっても、ライブラリや開発環境を更新すれば幅広い処理を動かせる。画像生成だろうがLLMだろうが、「とりあえずGPUに載せれば何とかなる」が成立するのはこの「汎用性」の力に他ならない。

一方、ASIC(Application-Specific Integrated Circuit)は特定用途向けの専用チップである。TPUはここに分類される。設計の段階から「この種類の計算」「このアクセスパターン」に狙いを絞り込み、その範囲に限って言えば、汎用GPUよりもはるかに高い性能と電力効率を発揮できるのがASICの強みだ。ただこれは言い換えると、「うまくハマる仕事」に対しては驚くほどのコスト削減と省電力を実現できる代わりに、「想定外の仕事」に対しては柔軟性をほとんど持たない、というトレードオフとなる。

この観点からTPUを見直すと、その性格がはっきりする。TPU(Tensor Processing Unit)とは、Googleが自社のAIワークロード(検索・広告・YouTubeなど)に合わせて設計したASICだGoogleが想定するタイプのモデルに対しては、GPUよりも高い電力効率とスループットを実現できる局面がある

しかしここで注意したいのは、その設計思想の深い部分が「Google流のモデル構造とツールチェーン」に結びついていることだ。つまりそれは、AIファクトリー全体の設計思想にGoogleの流儀を招き入れることを意味する。なので、単に「TPUの方が安いからGPUと差し替えよう」という話ではないのだ。

結局のところ、ハイパースケーラーの最適解は、GPUかASICかの二者択一とはならない。実際の現場では、GPUと自社ASIC、場合によっては他社ASIC(TPUなど)を組み合わせるケースが、今や標準になりつつある。GPUは新しいモデルの試作・実験、変化の速いワークロード、マルチモーダルな処理の受け皿として機能し、自社ASICやTPUは「設計が固まり、長期間にわたって大量に回し続けることが確定した特定ワークロード」を効率よくさばく役割を担う。抑えるべきは、「汎用工場(=GPU)」と「専用ライン(=ASIC,TPU)」のどちらが、AIファクトリー全体の設計思想とOSを握るか、という点なのだ。

推論というブラックボックスを分解する──どの計算が何で動くのか

TPU騒動を眺めていると、そもそも「推論」という言葉の中身が、あまりに大雑把に扱われているように思えてならない。多くの論調は、AIの計算を「学習/トレーニング」と「推論」の二つに分け、そのうち推論については、あたかも単一の箱の中で同質な計算が行われているかのように前提している。しかし現実のAIファクトリーでは、「推論」という一言の中に、性格の違う複数の仕事が折り重なっているのだ

第一に、ユーザーからの入力を受け取り、内部表現に変換する前処理がある。テキストならトークナイズ(文章をトークンに分解すること)や埋め込み生成、画像ならリサイズや特徴抽出といった処理だ。ここではCPUや汎用GPU、場合によっては従来型のアクセラレータが混在し、I/Oと軽めの行列演算、データ整形が主役になる。

第二に、モデル本体の計算がある。大規模言語モデルや画像生成モデルの中で行われる巨大な行列演算がここにあたり、TPUのようなASICが最も力を発揮しやすい。

第三に、モデル本体の外側で動く周辺アルゴリズムだ。ランキング、ベクトル検索、マルチモーダル処理、外部ツールの呼び出しといった周辺処理がここに入る。ここでは、モデルごとの計算だけでなく、メモリアクセスや分岐が多くなり、GPUとCPU、場合によっては専用の検索エンジンなどが入り乱れる

第四に、全体を制御するオーケストレーションとエージェントである。これは、ユーザーのリクエストごとに、どのモデルを何回呼び出し、どのツールやデータベースを参照し、どのように最終回答にまとめるか、といった制御ロジックだ

この四層のうち、TPUのようなASICが直接的に最大の効果を発揮し得るのは、第二層(モデル本体の巨大な行列演算)にほぼ限られる。ところがGPUは、これら4層の多様な仕事を丸ごと引き受けることができるのだ

ここで問題になるのが、「トークン当たりコスト」という単一指標で議論をまとめてしまうことの危うさである。多くの比較は、第二層のモデル本体にかかる計算コストだけを取り出し、TPUや自社ASICがGPUより何割安いといった議論を展開しがちだ。しかし実際のサービス全体で見れば、ユーザーからの入力受領から最終応答の返却までに要する計算・通信・ストレージのコストが総和として効いてくる。前処理や周辺アルゴリズム、オーケストレーションで発生するコストは、「一回の推論」に対して決して無視できない。そこをGPUがどこまで巻き取るか、どこからをCPUや他のアクセラレータに任せるか、という設計こそが、AIファクトリーの勝負どころなのである。

ハイパースケーラーの立場に立てば、合理的な答えはおおむね明らかである。すなわち、第二層のうち極度に定型化され、一定期間にわたって膨大なトラフィックが保証される部分については、自社ASICやTPUのような専用ラインを敷く価値がある。一方で、新しいモデルや機能を試す段階、需要やアルゴリズムがまだ安定していない領域、マルチモーダルやエージェント的な振る舞いが求められる部分については、汎用性の高いGPUクラスタを使い続ける方が合理的である。

このように、推論というブラックボックスを分解してみると、「推論=単一の計算」「その計算コストが安いハードに乗り換えれば、旧来のハードは不要になる」という線形な物語は、実際のAIファクトリーの複雑さをほとんど反映していないことがわかるはずだ。

※トークンに関する詳しい解説は、以前の無料記事『これからのAI市場~トークン経済の秘密~』を参照。

「AIインフラの最小公倍数」としてのエヌビディア

ここまでの説明を踏まえて、日経新聞が報じた「NVIDIA、AI半導体独走に変化の兆し」が本当なのかに話を戻そう。

結論から言うと先述の通り、TPUや自社ASICの台頭をもって、すぐに「NVIDIA一強の終焉」と結論づけるのは早計だ。なぜなら、現実に起きているのは、GPUとASICが役割分担しながら、AIファクトリー全体を支える構造への移行なのだから。

その上で、エヌビディアをどう位置づけるべきか。ここで重要なのが、「AIインフラの最小公倍数」という見方だ。ここで言う「最小公倍数」とは、個々の企業・国・サービスごとにAIの使い方や専用チップの設計思想が分岐していっても、なお共通して依存せざるを得ないハードウェアとソフトウェアの組み合わせ、という意味である。

GPUというハードウェアだけを見れば、競合は明確に存在する。AMDもあれば、GoogleのTPUのような専用ASICもある。それでもなお、エヌビディアの強みは、GPUそのものだけではない。その理由は、GPUそのものに加えて、NVLink/NVSwitch/Spectrumといったネットワーク製品群、CUDAを中核とするソフトウェアスタック、そしてそれらを前提に組まれたAIファクトリーの設計思想が、現時点で事実上の標準になっているからだ。

新しいモデル、新しいワークロード、新しいAIサービスが生まれるたびに、「とりあえずNVDAスタックで動かす」という暗黙の前提が今も共有されている。この状況が続く限り、GPUとASICのミックスがどう変化しようとも、NVDAはAIインフラの「最小公倍数」であり続けるだろう。

逆に言えば、この前提が崩れるときこそ、NVDAにとっては本物のリスクシナリオとなりうるのだ

まとめ

TPU騒動の本質は、「ハイパースケーラーがGPU一辺倒ではなく、汎用+専用の混成艦隊に舵を切っている」という事実であり、「NVIDIAスタックからの離脱」ではない。むしろ、混成艦隊が前提になるほど、「何でも載せ替えられる汎用工場」としてのGPUと、その上に構築されるソフトウェア・ネットワークスタックの重要性は相対的に高まる側面がある。

冷静な投資家にとって、この種の「線形で派手なストーリー」は、二重の意味で観察対象となる。第一に、記事やレポートの中にどのような前提が埋め込まれているか(GPUとASICの関係、推論の中身、AIファクトリー・サイクルの捉え方など)を、自分なりのフレームワークで分解してみることができる。第二に、そのストーリーが市場にどの程度浸透しているかを、株価やバリュエーションの動きから逆算することができる。

以前、「煽り記事は構造的には押し目サインになりやすい」という話をしたことがある。ここで言いたいのは、「煽りが出たから機械的に買え」という単純な逆張りではない。むしろ、今回のTPU騒動のようなイベントが起きたときこそ、AIファクトリーや常時推論という観点から、自分のシナリオと市場の物語のズレを確認し直す機会である、という意味である。市場が線形で派手なストーリーに引き寄せられているほど、構造的な視点を持つ投資家にとっては「相対的なアドバンテージ」が広がるのだ。

編集部後記