Subscribe to 中国テック番犬

AI #Multimodal

AI生成で3D世界を簡単構築、Marbleが2025年に一般公開

米スタンフォード大学の李飛飛教授が率いるWorld Labsは、テキストや画像から瞬時に3D空間を生成できるツール「Marble」を2025年2月に全ユーザー向けに公開した。AIによる生成と編集が一体化した本サービスは、従来の3Dモデリングのハードルを大幅に下げ、ゲームや映像、V…

AI生成で3D世界を簡単構築、Marbleが2025年に一般公開 のキービジュアル

米スタンフォード大学の李飛飛教授が率いるWorld Labsは、テキストや画像から瞬時に3D空間を生成できるツール「Marble」を2025年2月に全ユーザー向けに公開した。AIによる生成と編集が一体化した本サービスは、従来の3Dモデリングのハードルを大幅に下げ、ゲームや映像、VRコンテンツ制作に新たな可能性をもたらす。

Marbleの主な機能と操作フロー

Marbleは「マルチモーダル生成」「AIネイティブ編集」「世界拡張・組み合わせ」「Chisel」「全形式エクスポート」の5つのコア機能を備えている。

マルチモーダル生成

テキスト、単一画像、複数画像/動画、3Dレイアウトといった多様な入力方式に対応し、たとえば「青空の下にある木造の小屋」という一文だけで、木材の質感や光の当たり方まで再現した3Dシーンが数分で完成する。画像入力の場合は、アップロードした写真を基に360度全方位のパノラマを自動補完する。

AIネイティブ編集

生成後のシーンは、自然言語で局所的なオブジェクトの置換や構造変更が可能だ。例として「テーブルの上のゴミ箱を取り除いて」と指示すれば、AIが光影や影の落ち方まで再計算し、シームレスにシーンを修正する。

世界拡張・組み合わせ

シーンの端が曖昧な場合は「拡張」ボタンでAIが自動的に隣接領域を生成し、複数のシーンを「組み合わせ」モードで連結できる。公式デモでは、列車車両を次々に接続し、長大な鉄道空間を構築した。

Chisel(構造とスタイルの分離)

ユーザーは立方体や平面といった基本ジオメトリでフレームを作り、別途テキストでスタイルを指示するだけで、AIがフレームに対して指定されたデザインを自動的に適用する。たとえば同一フレームに「モダンアート美術館」と指示すれば、白壁と抽象画が配置された空間が、同じフレームに「北欧スタイルの寝室」と指示すれば、木製家具と氷河の窓景が生成される。

全形式エクスポート

完成したシーンは以下の形式でエクスポートできる。

  • Gaussian Splats(高精度リアルタイムレンダリング向け)
  • Triangle Mesh(低精度衝突メッシュと高精度レンダリングメッシュ)
  • 動画(カメラ操作やAIによるエフェクト追加が可能)

これらはUnityやUnreal Engineといった主流ゲームエンジンに直接インポートでき、開発フローの短縮に寄与する。

実際に使ってみた体験レポート

筆者はMarbleの体験版(https://marble.worldlabs.ai/)で以下のテストを実施した。

テキスト入力でのシーン生成

「光が差し込むホビット風キッチン、編みかごと銅製の鍋が並び、淡い青空が広がる」というプロンプトを入力すると、木製家具、銅製器具、光と影のディテールが揃った3Dキッチンが約5分で出力された。さらに「中世のレストラン美学と軌道技術が融合した宇宙ステーションのキッチン、チェッカーボード床とステンレス装置、柔らかな水色光が輝く」という抽象的な指示でも、AIは時空を超えた混合スタイルを的確に表現した。

画像入力での補完

普通の部屋の写真1枚をアップロードし、6分ほどで360度全景が生成された。エッジ部分の歪みはやや残ったが、初期段階としては実用に耐える品質だった。

編集機能の実践

生成したシーンで「壁の左側にある棚をステージに変えて、テーブルを観客向けの低いスツールに置き換えて」と指示すると、AIは構造と光源を再計算し、数秒で新しいレイアウトを提示した。これは従来の3Dソフトで数時間かかる作業に匹敵する速度である。

料金プランと利用シーン

Marbleは4段階のサブスクリプションを提供している。

  • 無料版:月間7,000ポイント、最大4シーン生成。テキスト・画像入力は利用可能だが高度機能はロック。
  • 標準版(20米ドル/月):月間20,000ポイント、12シーン。多画像・動画入力、Chisel、基本エクスポートが解放。
  • プロ版(35米ドル/月、初月1米ドル):月間40,000ポイント、25シーン。シーン拡張、動画エンハンス、高解像度メッシュ出力、商用利用ライセンスが付与。
  • フラッグシップ版(95米ドル/月):月間120,000ポイント、75シーン。全機能が無制限に利用できる。

無料版でも体験は十分可能だが、実務での継続利用はプロ版以上が前提となるだろう。

業界の反応と課題

Y Combinator CEO Garry TanはTwitterで「李飛飛は伝説的な人物で、今回のリリースは重要な意味を持つ」と評価した。一方、GDCの調査では、ゲーム開発者の3分の1が生成AIの導入が雇用にマイナス影響を与えると回答し、前年比で12%上昇した。

主な懸念は知的財産権の侵害、エネルギー消費、生成コンテンツの品質低下、そして従来のモデラーの職が減少する可能性だ。Activision Blizzardなど大手ゲーム会社はコスト削減のためAI活用を進めているが、Marbleは「制作プロセスを完全に置き換えるのではなく、資産生成を支援するツール」と位置付けている。

李飛飛が描く「空間インテリジェンス」のビジョン

Marble公開直前、李飛飛は自身のブログで「空間インテリジェンス(Spatial Intelligence)」という概念を提唱した。大規模言語モデルは言語処理に長けるが、距離感や方向感覚、物体の回転といった三次元認識は不得意である。人間の知能はむしろ「空間を理解し操作する能力」に根ざしているとし、以下の3段階で応用を展開する計画を示した。

  • 短期:ゲーム・映画・建築デザイン(Marbleが対象)
  • 中期:ロボティクス。シミュレーション環境でロボットに実世界での行動を学習させる
  • 長期:医薬・材料科学・診断・没入型教育など、科学的ブレークスルーへの応用

空間インテリジェンスが実現すれば、真に汎用的な人工知能の開発が可能になると李飛飛は語っている。

競合と今後の展望

3D生成AIの領域は、OpenAIの「Point-E」やMetaの「Make-A-Scene」など複数の企業が研究開発を進めているが、Marbleはマルチモーダル入力とAI編集を同一プラットフォームで提供する点で差別化を図っている。今後、生成品質の向上とエッジ処理の最適化が進めば、ゲームスタジオや映画制作会社が本格的に導入するケースが増えると予想される。

結論として、Marbleは「生成」から「編集」までをシームレスに結びつけた初の商用ツールであり、3Dコンテンツ制作のハードルを劇的に下げる可能性を秘めている。技術的・倫理的課題は残るものの、空間インテリジェンスという長期ビジョンが実現すれば、AIは単なる補助ツールから創造的パートナーへと進化するだろう。

出典: https://www.ifanr.com/1644304