• AppleのAI研究チームが開発した新しいモデル「Depth Pro」が、単一の2D画像から詳細な3D深度マップを瞬時に生成する能力を持つ
  • 従来、カメラデータに依存することなく、0.3秒で高解像度の深度マップを生成
  • モデルは、画像全体のコンテキストと細部を同時に処理する効率的なマルチスケールビジョン変換器を使用
  • 「Depth Pro」は相対的および絶対的な深度を推定できるため、「メトリック深度」と呼ばれる機能を持つ
  • モデルは領域固有のデータセットに大量のトレーニングを必要とせず、広範囲の画像に適用可能

この研究は、単一の画像から高品質でリアルタイムな深度マップを生成する「Depth Pro」の可能性を示唆しています。モデルの能力は、空間認識に依存する産業全体に幅広い影響を与える可能性があります。

元記事: https://venturebeat.com/ai/apple-releases-depth-pro-an-ai-model-that-rewrites-the-rules-of-3d-vision/