要約:
- ジョンズ・ホプキンス大学の研究者たちは、1枚の写真から完全に探索可能な3D環境を生成できるAIシステム「GenEx」を開発。
- GenExは、ロボットやAIエージェントが複雑な状況をより良く理解し、ナビゲートするのを支援し、機械に想像力を与えることができる。
- 実世界の写真の代わりに、チームはUnreal Engine 5やUnityなどのゲームエンジンからの仮想環境でGenExを訓練。
- GenExは360度ビューを6つの正方形に投影するキューブマップを使用して、異なる視点間のシームレスな遷移を作成する方法を学習。
- 研究によると、GenExは安定して一貫性のある画像を生成し、高度にリアルな視覚化を実現。
- GenExは、垂直軸に沿って移動することで鳥瞰図を生成し、AIエージェントにドローンの視点のような広い視野を提供。
- AIエージェントが生成された環境を探索すると、GenExは3Dマップを構築し、AI決定補助として活用可能。
- GenExを装備したGPT-40エージェントは、1枚の画像から作業するエージェントの46%に比べて、85%の正しい決定を下した。
感想:
この研究は非常に興味深いものであり、GenExがAIエージェントに想像力を提供することで、複雑な状況において正確な意思決定を促進する可能性が示されています。特に、実在する環境と想像上の空間の間のギャップを埋める課題に取り組む未来の作業に注力することが重要であると感じます。
元記事: https://the-decoder.com/genex-tries-to-teach-ai-to-imagine-whats-around-the-corner/