
Google Earthなどの3D地図サービスは非常に便利ですが、ひとつの大きな課題を抱えています。それは「実際に飛行機や計測車で現地をスキャン(写真測量)した場所しか3D化できない」という点です。スキャンデータがない地方や新興国の郊外は、依然として平らな2Dマップのまま取り残されています。
この限界を打ち破る画期的な技術が発表されました。中国の地図大手・高徳地図(Amap / Alibaba傘下)のコンピュータビジョン研究所(AMAP CV Lab)が開発した「ABot-Earth-0.5」です。
ABot-Earth-0.5は、世界初の「3Dネイティブ都市生成モデル」です。現地を計測スキャンするのではなく、宇宙から撮影した衛星写真が1枚あれば、AIがその画像を元に「3Dの街並み」を瞬時に想像して生成してしまいます。

1. そもそも「3Dガウシアン・スプラッティング(3DGS)」とは?
従来の3Dモデリングやゲームグラフィックでは、三角形の板(ポリゴン)を何百万枚も繋ぎ合わせて立体を表現していました。しかし、この方法では「木の葉の複雑な隙間」「ビルの窓ガラスの反射」「きらめく水面」などを表現しようとすると、データ量が膨大になり、不自然な見た目(カチカチの質感)になってしまいます。
ABot-Earth-0.5が全面的に採用しているのが、近年3D業界に革命を起こしている3DGS(3Dガウシアン・スプラッティング)という表現手法です。
- 「絵の具の霧」で描く3D:3DGSを分かりやすく例えると、硬いポリゴンの板を組み立てるのではなく、空間に「半透明の微細な絵の具の霧(球体の点)」を何百万個も吹き付けて立体を描き出すイメージです。
- 圧倒的なリアルさ:これにより、木の葉のざわざわとしたディテールや、光の反射、複雑なビル壁面の陰影などを、極めて軽量かつ現実そっくりの質感で描画することができます。
2. ABot-Earth-0.5の3つの強み
従来の3Dモデリング技術と比較して、ABot-Earth-0.5には実用上の大きなブレークスルーがあります。
① 効率が「1000倍」へ向上
従来の3D都市モデリングは、ドローンで数万枚の写真を撮影し、数週間〜数ヶ月かけてデータを補正して作成していました。しかしABot-Earth-0.5は、市販のGPU(グラフィックボード)1枚で動作し、1平方キロメートル四方の3D都市をわずか10分未満で生成できます。従来比で約1000倍の超高速化を達成しました。
② 地球規模からストリートまで「滑らかなズーム」
生成プロセス自体にマルチ詳細レベル(LOD)構造が組み込まれています。重い処理を挟むことなく、宇宙から見た地球全体の広域表示から、各建物・ストリートの細部まで、ロードの遅延なしにシームレスにズームイン・ズームアウトが可能です。

③ 自動運転やロボットの訓練にすぐ使える(Simulation-Ready)
生成される3D空間は、単なる「見た目(画像)」ではなく、物理的な位置情報と整合した「三次元点群データ」です。そのため、自動運転車(Embodied AI / 自律ロボット)やドローンの仮想訓練シミュレータ環境(クローズドループ・シミュレータ)として、生成してすぐにそのまま活用することができます。
3. 世界最高精度(SOTA)を証明したベンチマーク
技術報告書によると、ABot-Earth-0.5は画像生成の忠実度を測定する国際的な基準(FIDおよびKID指標)において、既存の学術的な3D都市生成モデルを大きく圧倒しています。
数値が低いほど「本物の写真に近い(高品質である)」ことを示す指標において、以下の結果を残しました。
- CityDreamer: FID 97.3
- GaussianCity: FID 86.9
- EarthCrafter: FID 69.5
- ABot-Earth 0.5 (Ours): FID 16.1
競合モデルと比較して4倍以上の精度向上を記録し、世界最高水準(SOTA)のリアルさを証明しています。
4. 地図の未来はどう変わるか?
ABot-Earth-0.5は、地球上の都市部(約80万平方キロメートル)を約32万個のブロック(計3.2兆個のガウシアン点群)に分割して並列処理する大規模データパイプラインを稼働させています。1000台規模のGPUクラスターを使えば、わずか10日未満で地球上のすべての都市の3D化を完了できる計算です。
これにより、以下のような未来が実現に近づきます。
- 無限の3D地図展開:現地測量が困難な紛争地帯、災害地域、開発途上国であっても、最新の衛星写真さえあれば安全かつ即座に3D地図を生成してシミュレーションできます。
- メタバースやゲーム開発の自動化:生成データはオープンな3DGS規格で出力されるため、UnityやUnreal Engineなどのゲームエンジンにそのままインポートし、クリエイターが自由にカメラワークを変更したり編集したりできます。
- 都市計画のデジタルツイン:特定のビルを取り壊して新しい建物の3Dモデルをはめ込んだり、リアルタイムの交通データや災害時の浸水予測を重ね合わせたりする「都市空間の脳(意思決定プラットフォーム)」として機能します。
計測して「写し取る」ものだった地図は、AIによって「写真からその場で生成する」ものへと進化しつつあります。空間知能(Spatial Intelligence)の急速な発展を象徴する、非常にエキサイティングな技術報告書です。