ソフトバンクGPUクラウド10月始動 ― Infrinia AI Cloud OSが描く国内ソブリンAI基盤の現在地

2026年5月27日2026年6月10日

2026年5月25日、ソフトバンクが「AIデータセンター GPUクラウド」の提供開始を正式発表しました。提供時期は2026年10月、同日からベータ展開も始まっています。搭載GPUはNVIDIA GB200 NVL72をはじめとする最先端世代、ソフトウエアスタックは自社開発の「Infrinia AI Cloud OS」です。「国内に置く、最先端のGPU基盤」というシンプルなコンセプトが、ソブリンAIの議論が止まらない今、改めて存在感を持ち始めています。

この記事では、生成AIを業務で本格活用したい企業の意思決定者を想定読者として、今回の発表の中身を一次情報ベースで整理し、国内GPUクラウド競争マップの中での位置づけ、そして「自社が選ぶとしたら何を見るべきか」までを通しで解説します。

ソフトバンクが発表した「AIデータセンター GPUクラウド」とは

まず一次情報の整理から始めます。2026年5月25日付のソフトバンク公式プレスリリースで明らかになったのは、次のポイントです。

項目	内容
正式サービス名	AIデータセンター GPUクラウド
発表日	2026年5月25日
提供開始時期	2026年10月（同日からベータ展開）
設置場所	国内のデータセンター（具体所在地は本リリース未公表）
搭載GPU	NVIDIA GB200 NVL72をはじめとする最先端GPU
ソフトウエアスタック	Infrinia AI Cloud OS
主要機能	KaaS（Kubernetes as a Service） / Inf-aaS（Inference as a Service）
初期利用主体	ソフトバンクおよびグループ会社
価格	未公表
上位戦略	「Activate AI for Society」 / ネオクラウド事業

ポイントは3点です。第一に、ハードはGB200 NVL72という現行最先端世代のGPUを国内データセンターに置くこと。第二に、その上をInfriniaという自社設計のクラウドOSで覆い、KubernetesとLLM推論APIをマルチテナントで提供する形を取ること。第三に、初期はソフトバンクおよびグループ会社の利用が中心で、外部企業への提供条件・価格は今回は明かされていない、という点です。

つまり「2026年10月に国内最先端のGPU基盤が立ち上がる」ことは確定ですが、「いつから・いくらで・誰が・どこまで使えるのか」は、これから段階的に開示されるフェーズにあります。生成AIの企業活用を本気で考えている読者にとっては、今後の追加発表をウォッチする価値が極めて高いカードと言えます。

「ベータ展開」と「2026年10月提供開始」の関係を誤解しないために

このプレスリリースで読み違えやすいのは、「2026年5月25日からベータ」「2026年10月提供開始」という二段構えの表現です。前者は限定環境での先行運用、後者が広い意味での正式提供を指します。BtoB領域のクラウドサービスでは、ベータ期間中はソフトバンク社内とグループ会社、ごく一部のパートナーで運用検証が進み、その後に外部公開と価格・規約が確定する流れが一般的です。

したがって、社内稟議や予算策定の前提として「2026年10月までに具体的な価格と契約条件が確定する」と見ておくのが現実的な置き方になります。価格未公表の現時点で導入決裁を打つのではなく、価格・SLA・データ所在ポリシーが固まったタイミングで意思決定する、というスケジュール感です。

NVIDIA GB200 NVL72搭載とInfrinia AI Cloud OSの位置づけ

次に、技術スタックの位置づけを整理します。今回のサービスを構成する2つの軸、ハード側の「GB200 NVL72」とソフト側の「Infrinia AI Cloud OS」は、それぞれ別の意味で重要です。

GB200 NVL72が意味するもの

NVIDIA GB200 NVL72は、Blackwell世代のGPUを72基まとめてラックスケールで密結合した、現行のNVIDIA GPU製品の中で最上位に位置づけられる構成です。LLMの学習・大規模推論を1筐体に近い形で集約できるため、生成AIワークロードの性能上限を引き上げます。

ここで注意したいのは、今回のソフトバンク公式リリースで明示されたGPUは「GB200 NVL72をはじめとする最先端GPU」であって、H100やH200を本サービスのGPUとして名指ししているわけではない、という点です。H100/H200は同社既存の「GPUサーバー」（2025年10月提供開始）でDGX構成として提供されていますが、新サービスの「AIデータセンター GPUクラウド」ではGB200世代が中核という位置づけです。両者は別サービスとして整理してください。

Infrinia AI Cloud OSの2つの提供形態

Infrinia AI Cloud OSは、ソフトバンクが今回の発表で明示した自社開発のクラウドOSで、2つの提供形態が示されています。

形態	正式名	概要
KaaS	Kubernetes as a Service	マルチテナント対応のコンテナ管理基盤。学習・推論ワークロードの実行環境として利用
Inf-aaS	Inference as a Service	LLM推論をAPI経由で提供。アプリケーションから直接呼び出し可能

この2層構成は、生成AIワークロードを「自前で学習・チューニングする層」と「推論APIだけ使いたい層」に分けたうえで、どちらも同じ国内基盤の上で完結させる狙いが読み取れます。Inf-aaSが整備されれば、自社モデルの学習までは手を出さない企業でも、「データを国外に出さずに推論だけ使う」選択肢が現実的になります。

1次情報と2次情報の線引き

ここから先、よく報じられる「ソフトバンクは1万基規模のGPUを保有」「苫小牧データセンターを2026年度稼働、最終的に300MW規模」といった数字は、本サービスのプレスリリースには含まれていない補足情報です。BUSINESS NETWORKなどの報道によれば、ソフトバンク全体としてのGPU保有数は約1万基、苫小牧データセンターは段階的に最大300MWへ拡張する計画とされています。本サービスにそのうち何基が割り当てられるかは公表されていません。

記事や社内資料で引用する場合は、「報道によれば」「ソフトバンク全体の戦略として」と1次・2次を分けて扱うのが安全です。

国内GPUクラウド競争マップ2026

では、このソフトバンクの新サービスは、国内GPUクラウド市場のどこに位置取りするのか。各社の公表情報をベースに、2026年5月時点の競合マップを整理します。価格は未公表のため、ここでは構成要素と立ち位置で比較します。

事業者	サービス/拠点	主GPU	特徴	立ち位置
ソフトバンク	AIデータセンター GPUクラウド（2026年10月開始）	GB200 NVL72ほか	Infrinia AI Cloud OSによるKaaS+Inf-aaSの2層提供	大規模学習・推論を国内で完結させたい企業の本命候補
ソフトバンク（既存）	GPUサーバー（2025年10月開始）	NVIDIA A100/H100 DGX	最短7日からの契約、ベアメタル提供	短期検証・PoC向けの即応サービス
KDDI	大阪堺データセンター（液冷）	GB200 NVL72	液冷ラック設計、2025年度内に稼働予定と公表	関西圏で大規模学習基盤を持ちたい層の選択肢
GMOインターネット	GMO GPUクラウド	NVIDIA H200	TOP500世界37位/国内6位（2024年11月時点）	国内事業者の中で稼働実績が長く、調達リードタイムが短い
ハイレゾ	GPUSOROBAN / ハイレゾ香川	NVIDIA H200	2データセンター合計1,600基規模の計画	研究機関・スタートアップに強い時間課金型
さくらインターネット	政府クラウド向け基盤など	NVIDIA系	経済産業省のクラウド支援対象事業者	公共・準公共セクター向け基盤としての厚み
RUTILEA	NVIDIA連携	NVIDIA系	製造業向けAIインフラ提案に強み	業種特化のソリューション提供型

この表から読み取れる構図は3つです。

1つ目は、GB200 NVL72世代を国内で公表している事業者がソフトバンクとKDDIの2社に集約されつつあるという点。最先端世代を「国内に置く」という条件で絞ると、選択肢はかなり限定的です。

2つ目は、H200世代まで広げるとGMOインターネット、ハイレゾが現実解として残り、調達リードタイムや時間課金の柔軟性で差別化されているという点。検証フェーズや中規模ワークロードなら、ここから入るのが速い場合があります。

3つ目は、さくらインターネットやRUTILEAのように「特定セクター（公共、製造業など）の事情に深く入り込む」事業者がレイヤーを別にして存在することです。スペックだけで横並びにすると見落とすポイントになります。

ここまでで一度、生成AI基盤を体系的に学び直したい方には、東京大学松尾・岩澤研究室がまとめた『AI白書 2025 生成AIエディション』が手堅い1冊です。生成AIの方式・モデルから、AIセーフティ、ガバナンス、規制動向まで網羅されており、社内でAI戦略を議論する際の共通言語として使えます。

AI白書 2025 生成AIエディション（東京大学松尾・岩澤研究室監修）をAmazonで見る（PR）

ネオクラウド事業の上位戦略「Activate AI for Society」

ハードとソフトの話を一段引き上げると、今回の発表は単体プロダクトのローンチではなく、「ネオクラウド事業」というソフトバンクの上位戦略の中に位置づけられます。プレスリリースで掲げられているコンセプトが「Activate AI for Society（社会にAIを実装する）」です。

なぜ今「ソブリンAI」という言葉が前に出てきたのか

「ソブリンAI」とは、データ、モデル、計算基盤を自国の主権下で運用するという考え方です。海外のハイパースケーラーが提供するクラウドAIサービスは技術的には非常に強力ですが、機微情報を国外データセンターに渡すこと、規約変更・法令変更時のリスク、為替変動による価格変動など、エンタープライズ視点では無視しづらい論点があります。

ソフトバンクの「AIデータセンター GPUクラウド」がここに刺さるのは、「最先端GPU」「国内データセンター」「国内事業者によるオペレーション」という3点を1社で押さえている点です。同じ要件をハイパースケーラー上で組もうとすると、東京・大阪リージョンが該当しても運営主体は海外法人になります。意思決定の重心が「性能」から「主権・データ所在・契約相手国」へ移ってきた組織にとって、選択肢が1つ増えることの意味は大きいと言えます。

「ネオクラウド」の文脈で何が変わるか

ソフトバンクが言う「ネオクラウド事業」は、自社の通信インフラ、データセンター、GPU調達、ソフトウエア（Infrinia）、上位のAIサービスを縦に貫いて提供するモデルです。従来の「IaaSベンダー」「SaaSベンダー」という縦割りの上を行く構図で、エンタープライズ顧客から見ると「窓口が1つで済む」「責任分界点が明確」というメリットが期待できます。

一方で、デメリットも先回りで認識しておく必要があります。垂直統合型は囲い込みリスクが大きく、後から他基盤に移したくなったときの移行コストが膨らみがちです。Kubernetes（KaaS）として標準的なAPIに揃えること、推論APIをOpenAI互換などの広く使われているインターフェースに寄せることは、移植性を担保するうえで重要なチェックポイントになります。

生成AI活用企業が今知っておくべき選定軸

「結局、自社はソフトバンクのこの新サービスを選ぶべきか？」を判断するには、性能スペックの単純比較では足りません。実務で意思決定するときに必要な軸を、チェックリスト形式で整理します。

Before / After：意思決定はどう変わるか

視点	Before（2024～2025年）	After（2026年10月以降想定）
大規模学習基盤	海外ハイパースケーラー＋自社オンプレの2択が主流	国内GB200 NVL72環境＋国内KaaS/Inf-aaSが現実的第3の選択肢に
データ所在	国内リージョンは選べるが運営主体は海外法人が多い	運営主体・物理拠点・契約相手国まで国内で揃えるルートが拡大
推論API	海外プロバイダのAPIを社内システムから呼び出し	国内事業者のInference as a Serviceを選択する余地が増える
調達のリードタイム	GPU不足・割当制限で計画が立てづらい	国内ネオクラウドが立ち上がり、中長期計画を立てやすくなる方向

自社評価のチェックリスト

生成AI基盤の選定にあたって、最低でも次の7項目を社内で言語化しておくと、各社の提案を横並びで比較しやすくなります。

・ワークロード種別: 自社で学習・チューニングまでやるのか、推論APIだけで足りるのか
・データ機微度: 個人情報・営業秘密・規制業種の機微データを扱うか
・データ所在要件: 物理拠点だけで足りるのか、運営主体・契約相手国まで国内である必要があるか
・性能要件: 1ジョブ当たりの学習規模、推論レイテンシ、同時セッション数
・スケジュール感: 2026年中の本格運用か、2027年度予算での導入か
・調達リスク: 単一事業者依存を許容できるか、マルチクラウド前提で設計するか
・移植性: 採用するKubernetes構成、推論APIの互換性、モデルアーティファクトの取り出しやすさ

「待ち」と「並走」の判断軸

ここで判断を急ぐ必要はありません。価格未公表、初期はソフトバンクとグループ会社中心、というステータスを踏まえると、外部企業が本格的に手を挙げるタイミングは、2026年夏以降に公表されるはずの料金・契約条件、想定SLAが出そろってからで十分です。一方で、「並走」しておくべき作業は明確に2つあります。

1つは、社内で扱うデータの分類とデータ所在ポリシーの明文化です。新サービスが出てきても、自社の要件が言語化されていなければ評価ができません。もう1つは、既存のH100/H200ベースのGPUクラウド、もしくはハイパースケーラーのマネージドAIサービスで小さく検証を回し、「自社ワークロードの実際の負荷プロファイル」を把握しておくことです。GB200 NVL72が登場したから検討を始めるのではなく、登場した時点で意思決定できる準備を整えておく、というスタンスです。

よくある質問（FAQ）

Q1. 「AIデータセンター GPUクラウド」と既存のソフトバンク「GPUサーバー」はどう違いますか

「GPUサーバー」は2025年10月提供開始のベアメタル型サービスで、A100/H100ベースのDGX構成、最短7日からの契約が特徴です。今回発表された「AIデータセンター GPUクラウド」は、GB200 NVL72世代を中心に、Infrinia AI Cloud OS上でKaaS（コンテナ基盤）とInf-aaS（推論API）を提供するクラウド型サービスです。世代・提供形態・想定ワークロードが異なるため、別サービスとして比較するのが正確です。

Q2. H100やH200は使えますか

本サービスの公式リリースで明示されたGPUは「NVIDIA GB200 NVL72をはじめとする最先端GPU」で、H100/H200は名指しされていません。H100/H200世代を活用したい場合は、ソフトバンクの既存「GPUサーバー」、もしくはGMO GPUクラウド、ハイレゾGPUSOROBANといった他社サービスが現実的な選択肢になります。

Q3. 価格はいくらですか

2026年5月25日時点で価格は公表されていません。一般論として、GB200 NVL72世代のGPUは時間単価が高くなる傾向にあるため、価格情報が出てきた段階で、自社のワークロードと照らした損益分岐の試算をやり直すことをおすすめします。

Q4. データセンターはどこに置かれますか

本リリースでは「国内のデータセンターに構築する」と記載されていますが、具体的所在地は公表されていません。ソフトバンク全体の戦略として、BUSINESS NETWORKなどの報道では北海道・苫小牧データセンターが2026年度稼働、最終的に300MW規模まで拡張する計画とされていますが、本サービスに苫小牧分が割り当てられるかは別途確認が必要です。

Q5. 自社単独で契約できますか

初期利用主体としてソフトバンクおよびグループ会社が明示されており、外部企業向けの提供条件はまだ整理途中です。本格的な外部提供は2026年10月の正式提供開始以降と見るのが妥当です。商談ベースで早期に検討したい場合は、ソフトバンクの法人窓口に問い合わせるのが筋になります。

Q6. ハイパースケーラーのAIサービスとどちらを選ぶべきですか

「最先端GPU性能」だけで比較するとハイパースケーラーが優位な領域も多いですが、「データ所在」「運営主体の国籍」「契約相手国」を含めると、国内ネオクラウドが優位になる場面があります。前述のチェックリスト7項目を自社で言語化したうえで、ワークロードごとに最適解を組み合わせる「マルチクラウド前提」の設計が現実的です。

Q7. KaaSとInf-aaSのどちらを使えばよいですか

自社でモデルの学習・ファインチューニングまで行う場合はKaaS、既存LLMの推論APIだけ使いたい場合はInf-aaSが基本的な使い分けです。両者を組み合わせて、開発・検証はKaaS上のコンテナで、本番運用はInf-aaSのAPIで、といった構成も想定できます。具体的な利用条件は正式提供時の仕様を確認してください。

Q8. 自社のセキュリティポリシーに合うかどう確認すればよいですか

提供開始後にSLA、データ取り扱い規約、暗号化方式、監査ログの取得範囲などが順次公開されるはずです。これらが揃った時点で、自社のセキュリティポリシー（ISMS、PCI DSS、業種別ガイドラインなど）と照合し、ギャップがあれば運用設計でカバーできるかを評価します。生成AIのリスク全体を体系的に押さえたい方は、東京大学・松尾豊氏の研究室メンバーである今井翔太氏の『生成AIで世界はこう変わる』が、ビジネスサイドの判断材料として読みやすい1冊です。

生成AIで世界はこう変わる（今井翔太／SB新書）をAmazonで見る（PR）

本記事のまとめ

ソフトバンクが2026年10月に提供開始する「AIデータセンター GPUクラウド」は、NVIDIA GB200 NVL72をはじめとする最先端GPUと、自社開発のInfrinia AI Cloud OS（KaaS/Inf-aaS）を組み合わせた国内ネオクラウドの本命候補です。「Activate AI for Society」を掲げ、データ・モデル・計算基盤を国内で完結させたい企業にとって、選択肢が1つ明確に増えます。

一方で、価格は未公表、初期利用主体はソフトバンクおよびグループ会社、という現時点のステータスを踏まえると、外部企業の本格検討は2026年夏以降の追加情報を待つのが現実的です。それまでに自社でやっておくべきは、データ分類とデータ所在ポリシーの言語化、そして既存GPU環境での小さな検証の積み重ね。GB200 NVL72が出てきてから動き始めるのではなく、出てきた瞬間に意思決定できる状態を整えておくことが、これからの12か月の差を生みます。

AIマスターズ.TOKYOでは、生成AIを「使う側」から「使いこなす側」へ進むための、現場で再現できる活用ノウハウをメルマガで配信しています。今回のような国内ネオクラウドの動向や、企業の意思決定に直結するアップデートを、現場目線で噛み砕いてお届けします。

この記事を書いた人

tomohiro