AIチップ覇権争いに新局面——グーグルが第8世代TPUを発表
2026年4月22日、グーグルは年次イベント「Google Cloud Next 2026」において、第8世代となるカスタムAIチップ「TPU 8t」(学習特化)と「TPU 8i」(推論特化)を正式に発表した。これはグーグルのTPU(テンソル・プロセッシング・ユニット)開発史上、初めてトレーニングと推論という2つの異なるワークロードに向けてアーキテクチャを完全に分離した、歴史的な決断である。
NVIDIAのGPUがAIアクセラレーター市場の90%超を握るなか、グーグルの今回の発表はその支配体制に対する最も本格的な挑戦のひとつとして業界の注目を集めている。単なるチップのスペックアップにとどまらず、ソフトウェア・ネットワーク・冷却システムまで含めたフルスタックの共同設計によって、AIインフラの経済性を根本から変えようとするグーグルの戦略的意図が鮮明に浮かび上がる。
第8世代TPUの核心:2チップ体制への歴史的転換
これまでのTPUは基本的に1ラインナップで学習・推論の両方に対応してきたが、今回初めてその設計思想が大きく変わった。
学習特化チップ「TPU 8t」(コードネーム:Sunfish)
- 演算性能:チップ単体で12.6ペタFLOPS、9,600チップのスーパーポッドでFP4精度換算121エクサFLOPS
- メモリ:216GB HBM(HBM3e 12段積み)を搭載、前世代比で約30%高いメモリ帯域幅
- コスパ:前世代IronwoodにしてTPU 8tは同一価格で2.8倍のパフォーマンスを実現
- 信頼性:グッドプット(有効計算時間率)が97%超を達成し、大規模モデル開発のダウンタイムを大幅削減
- ネットワーク:新開発の「Virgo Network」により、最大100万チップまでほぼ線形のスケーリングを実現
- 設計パートナー:Broadcomが設計、2031年まで契約継続
推論特化チップ「TPU 8i」(コードネーム:Zebrafish)
- 演算性能:FP4で10.1ペタFLOPS、1,152チップのポッドでFP8精度換算11.6エクサFLOPS
- メモリ:288GB HBM(帯域幅8,601GB/s)+384MB大容量オンチップSRAM(前世代比3倍)
- コスパ:Ironwood比でコストパフォーマンス80%向上
- 低遅延設計:新トポロジー「Boardfly」により最大1,152チップ接続、ネットワーク直径を16ホップから7ホップに削減
- 設計パートナー:MediaTekが設計、コスト最適化バリアント(TPU v7e/v8e)も担当
両チップはTSMC 2nmプロセスで製造予定(2027年後半リリース目標)。また、グーグル独自のAxion(Arm系)CPUホストと組み合わせ、第4世代液冷システムを採用することで、前世代比で消費電力あたり性能を最大2倍に向上させている。
ビジネス視点:企業・経営者にとっての意味
今回の発表が企業経営者にとって最も重要な意味を持つのは、AIインフラのコスト構造が大きく変わる可能性がある点だ。これまでNVIDIA製GPUに依存してきたAIワークロードのコストが、グーグルTPUという選択肢の登場によって競争原理にさらされ始めている。
具体的には次のようなビジネスインパクトが見込まれる。
- AI開発コストの削減:TPU 8tの採用により、フロンティアモデルの開発サイクルを「数ヶ月から数週間へ短縮」とグーグルはアピール。企業がカスタムAIモデルを開発する際の時間・費用が大幅に削減できる見通し。
- 推論コストの最適化:TPU 8iはIronwood比で「同コストで約2倍の顧客ボリュームを処理できる」とされており、ChatGPTのような大規模推論サービスを運営する企業にとって直接的なコスト削減につながる。
- マルチクラウド戦略の選択肢拡大:AWS(Trainium)、Microsoft Azure(Maia 200)に加え、グーグルクラウドのTPUが実用レベルで競合することで、企業のクラウドプロバイダー交渉力が高まる。
グーグルクラウドは現在クラウドインフラ市場でシェア約11%(AWS 31%、Azure 25%に次ぐ3位)を占めるが、2025年末時点で3社中最速の成長率を記録しており、今回のTPU強化がその勢いをさらに加速させると見られる。
消費者・生活者視点:一般の人々への影響
一見、専門的なAIチップの話は一般消費者には無縁に思えるが、その影響は日常生活に着実に及んでいる。
- AIサービスの高速化・低コスト化:ChatGPTやGeminiなどの生成AIサービスの応答速度向上と、将来的なサービス料金の低下につながる可能性がある。TPU 8iは「数百万のAIエージェントを同時に低コストで稼働させる」ことを目標に設計されている。
- AIエージェントの普及加速:旅行予約、医療相談、財務アドバイスを自律的にこなすAIエージェントが、より低コストで大規模展開されるようになると見られ、身近なサービスのAI化が加速する可能性がある。
- 環境負荷の軽減:Ironwoodと比較してTPU v5p比で炭素効率が3.7倍改善されるなど、AIの環境フットプリント低減にも寄与。グーグルは5年前と比べてデータセンター1単位の電力から6倍の計算能力を引き出せるようになったとしている。
専門家の見解:業界の評価と今後のリスク
「第8世代TPUはトレーニングと推論のチップを初めて分離した、グーグルTPU史上最も重要なアーキテクチャの決断だ」 — The Next Web 技術分析レポート(2026年4月)
グーグルAI・インフラ担当上席副社長(SVP)兼チーフテクノロジスト、アミン・ヴァーダット氏は次のように述べている。
「シリコンをハードウェア・ネットワーク・ソフトウェアと共同設計するという、初代TPUの設計哲学は今も変わらない。この思想によって電力効率と絶対的なパフォーマンスを劇的に向上させられる」
一方、業界アナリストからは慎重な見方もある。NVIDIAは2027年後半に次世代「Rubin」アーキテクチャの投入を予定しており、メモリとネットワーク性能において再びコスト優位性を取り戻す可能性も否定できないとされる。また、カスタムASIC市場は年率44.6%で成長しているのに対してGPU市場の成長率は16.1%にとどまっており、2028年にはカスタムチップがAIチップ市場の45%を占めるとのアナリスト予測もある。
国際比較:クラウド大手のカスタムチップ競争
グーグルの第8世代TPU発表は、クラウド大手によるカスタムチップ開発競争が本格化している大きな流れの一部だ。
- Amazon(AWS):Trainium(学習向け)・Inferentia(推論向け)を展開。カスタムチップ事業の評価額は500億ドルとされ、外部販売も検討中と報じられている。
- Microsoft Azure:2026年1月に発表した「Maia 200」は、Amazon Trainium 3のFP4性能比3倍を主張。
- Meta:独自AI推論チップ「MTIA」の開発を継続中。
- グーグル:Broadcom(TPU 8t)、MediaTek(TPU 8i)、さらにMarvellとも交渉中とされる多サプライヤー戦略を採用。サプライチェーンの冗長性と交渉力の両方を確保している。
この競争において最大の顧客のひとつはAI企業Anthropicだ。Anthropicはグーグルから最大100万チップ・1ギガワット超の計算リソースへのアクセス権を取得しており、2027年には3.5ギガワットへの拡大が予定されている。Anthropicの年間収益は300億ドルを超えるとされており、グーグルクラウドにとっても最重要顧客のひとつとなっている。
今後の展望:注目すべきポイント
- 2026年後半:TPU 8tおよびTPU 8iのGoogle Cloud上での一般提供(GA)開始予定。
- 2027年:TSMC 2nmプロセスを採用したTPU 8世代の本格量産。グーグルはTPU出荷台数を2026年の430万台から2027年に1,000万台へ拡大する計画。
- 2028年:TPU出荷台数3,500万台超を目標とする。グーグルは2026年のインフラ投資額を1,750〜1,850億ドル(前年比約2倍)とする計画を発表しており、このスケール投資がTPU普及の鍵となる。
- NVIDIAの反撃:2027年後半に登場予定のRubinアーキテクチャが、メモリ・ネットワーク性能でどこまで対抗できるかが市場の焦点になる。
- PyTorchネイティブ対応:グーグルはTPU上でのネイティブPyTorchサポートをプレビュー公開しており、NVIDIA GPU環境から移行するエンジニアの心理的障壁が下がることで、採用拡大が見込まれる。
まとめ
- グーグルは2026年4月22日、Google Cloud Next 2026で第8世代TPU「TPU 8t」(学習特化)と「TPU 8i」(推論特化)を発表。同社TPU史上初めて用途別に2アーキテクチャを分離した歴史的転換点となった。
- TPU 8tは前世代比で価格性能比2.8倍、TPU 8iは80%のコスパ向上を実現。両チップとも前世代比で電力効率2倍を達成し、AIインフラの経済性と持続可能性に貢献する。
- Amazon・Microsoft・Metaも独自AIチップを積極展開しており、AIチップ市場でのカスタムASIC比率は2028年に45%に達するとの予測もある。NVIDIAが90%超を握ってきた推論市場での支配が、今後数年で大きく揺らぐ可能性がある。
参考情報
- Google Cloud 公式ブログ(日本語):第8世代TPU発表記事
- Google 公式ブログ(英語):Our eighth generation TPUs: two chips for the agentic era
- Google Cloud Blog:TPU 8t and TPU 8i technical deep dive
- The Next Web:Google launches Ironwood TPU and previews eighth-gen split
- GIGAZINE:GoogleがAI処理チップの第8世代TPUを発表
- PC Watch:Google Cloud、学習向け「TPU 8t」と推論向け「TPU 8i」
- Data Center Dynamics:Google unveils eighth-generation TPUs
- Google Cloud ドキュメント:TPU7x (Ironwood) 技術仕様
- Google Cloud 公式ブログ:Ironwood TPUで炭素効率が3.7倍向上
- FDAYTalk:Google TPU 8t Turns Months of AI Model Training Into Weeks
著者プロフィール
伊東雄歩(いとうゆうほ) / ゆぽゆぽ
株式会社ウォーカー代表取締役 / MENSA会員 / NLPマスタープラクティショナー
IQ130超のADHD経営者。「社会不適合」ゆえに会社員を2年で挫折し、フリーランスを経由せずいきなり起業。訴訟4回、2000万円の損失、役員の裏切り、オフショア開発の地獄を乗り越え10年生き残る。心理学・教育学に1000万円投資し、独自の「成長力学」を確立。現在は生成AI教育に注力し、「3年を2日に変える」AIプログラミング2Daysキャンプを全国展開中。AIフレンズコミュニティを運営。
夢は「世界征服」——世界の常識を変え、新しい価値観を提示すること。
