中国テック番犬

全般検索

    AI Smart Devices

    NVIDIAがCES2026で示した次世代プラットフォームの全貌

    NVIDIAがCES 2026にてGPUの発表を行わず、次世代AI計算プラットフォーム「Vera Rubin」を世界初公開。6種の新チップ同時刷新による性能向上と、オープンソースモデル「DeepSeek」等の潮流に伴うAI開発コストの破壊を解説します。

    NVIDIAがCES2026で示した次世代プラットフォームの全貌
    CES 2026のステージでVera Rubinプラットフォームを語るNVIDIAのジェンスン・フアンCEO
    CES 2026にて、2.5トンのAIサーバーラックを背にスピーチを行うジェンスン・フアンCEO
    • GPU不発表の衝撃:NVIDIAはCES 2026において、歴史上初めて新しいRTXグラフィックスカード(GPU)の発表を行わず、エンタープライズ向けのAIサーバーシステムに特化。
    • Vera Rubin(ヴェラ・ルービン)の初公開:CPU、GPU、DPU、ネットワークカード、スイッチを含む6種の主要チップを同時刷新する「システムとしてのAIインフラ」を提示。
    • オープンソースAIによる開発コスト破壊:中国発のオープンソースモデル「DeepSeek」などの急成長を背景に、NVIDIAがハードウェアとオープンソースエコシステムの双方で業界をリードする姿勢を強調。

    毎年、最新のゲーミンググラフィックスカードやコンシューマー向け技術が主役となる「CES 2026」において、NVIDIAは前代未聞の発表を行いました。ステージに新しいGeForce RTXシリーズの姿はなく、代わりにCEOのジェンスン・フアン(Jensen Huang)氏が運び込んだのは、重さ2.5トンに達する次世代AIスーパーコンピューターラックでした。

    NVIDIAが単一の「チップ(GPU)」売りから、AIプラットフォーム全体の「協調設計(コ・デザイン)」へと完全にシフトした背景と、そこに大きく影響を与えるオープンソース大規模言語モデル(LLM)の最新潮流について深掘りします。

    1. チップ単体から「エクストリーム・コ・デザイン」へのシフト

    過去数年間、NVIDIAは毎年CESでゲーマー向けのRTXシリーズなどを発表し、市場を沸かせてきました。しかし今年、フアンCEOが掲げたテーマは「物理AIとロボティクス、そしてデータセンター全体の再定義」でした。

    フアン氏は「次世代の高度なフロンティアモデルを実用化するには、チップ単体の処理能力を上げるだけでは不十分。システム全体、ネットワーク、さらには冷却システムまで同時に進化させる必要がある」と語りました。これが、ハードウェアとソフトウェアを極限まで垂直統合して設計する「エクストリーム・コ・デザイン(極限の協調設計)」戦略です。この思想を具現化したのが、今回世界初公開された「Vera Rubin(ヴェラ・ルービン)」プラットフォームです。

    2. 次世代AI計算プラットフォーム「Vera Rubin」の驚異のスペック

    Vera Rubinは、以下の6つの新しいコア半導体チップおよびモジュールで構成されています。これらが一つのデータセンターラック内で緊密に連携します。

    • Vera CPU:NVIDIAカスタムのOlympusコアを88個搭載(176スレッド)、システムメモリは従来のGraceの3倍にあたる1.5TB。
    • Rubin GPU:NVFP4フォーマットによる推論性能は50PFLOPS(ペタフロップス)に達し、前世代Blackwellの5倍、3,360億個のトランジスタを集積。
    • ConnectX-9 ネットワークカード(NIC):800Gbpsのイーサネット通信とプログラマブルなRDMA(Remote Direct Memory Access)に対応。
    • BlueField-4 DPU:800Gbpsのデータ処理能力を持ち、64コアのGrace CPUを搭載してストレージとセキュリティ処理をオフロード。
    • NVLink-6 スイッチチップ:最大72枚のGPUを1つの仮想的な巨大GPUとして統合し、3.6TB/sの圧倒的な双方向帯域幅を提供。
    • Spectrum-6 光イーサネットスイッチ:512チャネル×200Gbpsの通信を実現し、シリコンフォトニクス(光電融合)技術を実装。

    これらを組み合わせた「NVL72」ラックシステムは、前世代モデルと比較してAIの訓練性能が3.5倍、推論性能が5倍に向上しています。最も重要な点は、AIモデルのトレーニング時における「トークンあたりの計算コストが1/10」にまで下がる点です。

    設計の簡素化:組み立て時間を2時間から5分へ

    従来のスーパーコンピューターラックは、ノード間の配線に43本以上の水冷ホースや無数のネットワークケーブルが必要で、エンジニアが手作業で組み立てるのに2時間以上かかっていました。Vera Rubinシステムは「ケーブルゼロ、差し込み式の6本のリキッドチューブ」のみで設計されており、ラックへの脱着はわずか5分で完了します。また、総延長3.2kmに及ぶ銅製ケーブルがバックプレーン(背面板)に内蔵され、システム全体の物理的安定性とノイズ低減に寄与しています。

    3. 生成AIモデルのオープンソース化とDeepSeekの衝撃

    ハードウェアのコスト破壊が進む一方で、ソフトウェアおよびアルゴリズムのレイヤーでも地殻変動が起きています。フアンCEOはスピーチの中で、「中国発のオープンソースモデルであるDeepSeek(ディープシーク)が業界に与えたインパクトは凄まじい」と直接言及しました。

    DeepSeekは、従来の米国の巨大LLM(GPT-4など)と同等の実力を持ちながら、極めて洗練されたアルゴリズム(MoEやマルチヘッドアテンションの改良)により、従来の数分の一の計算リソースと訓練コストで開発されたオープンソースモデルです。

    この潮流を受け、NVIDIA自身も自社の推論モデルシリーズである「Nemotron」のオープンソースライセンスでの公開を加速させているほか、バイオインフォマティクス向けの「La Proteina」やタンパク質構造予測の「OpenFold 3」など、業界特化型の高性能オープンソースモデルを次々に発表しました。

    4. 日本のAI開発およびインフラ戦略への示唆

    日本のテック企業やデータセンター事業者にとって、NVIDIAのこのプラットフォームシフトは重要な意味を持ちます。

    まず、「GPUの調達数」だけでAI競争力を競う時代は終わりつつあります。今後は、限られた電力枠の中でいかに冷却効率を高めるか(液冷対応など)、ネットワーク遅延を極限まで減らせるかという「システム統合力」が問われます。さくらインターネットなどの国内クラウド事業者は、Vera Rubinのような超高密度・液冷前提のインフラを受け入れるためのデータセンター設備改修が急務となるでしょう。

    また、DeepSeekなどの「軽量で高性能なオープンソースモデル」を活用し、特定のビジネスドメインに特化した自律型AIエージェントをローカルで高速に動作させる開発アプローチは、リソースの限られた日本のベンチャー企業にとって最も現実的かつ強力な選択肢となります。

    5. まとめ

    NVIDIAがCES 2026で示したのは、半導体チップの切り売りから「システムとしてのAIファクトリー」への完全なるパラダイムシフトでした。ハードウェアの劇的なコスト削減と、オープンソースAIの洗練された進化が掛け合わさることで、AIエージェントや物理ロボティクスが現実の社会に溶け込むスピードはさらに加速するでしょう。

    コメント

    ...
    コメントを読み込んでいます...

    コメントを投稿する

    ※ メールアドレスは公開されません。