要約:
- 2024年12月12日、富士通は、フロントラインの職場向けにビデオ分析AIエージェントの開発を発表。
- AIエージェントは、職場のカメラ映像からの空間ビデオと画像データ、および書面情報を使用して、レポートを作成し、職場改善のための推奨事項を提供。
- AIエージェントは、大規模言語モデル(LLM)に基づいており、FieldWorkArenaで評価。
- 技術は、書面情報からの情報を使用して、AIエージェントのビデオデータ理解能力を向上させ、空間関係の理解や業務タスクの認識を支援。
- フジツーは、長時間のビデオコンテンツを処理するために、人間の選択的注意機構を模倣する技術を使用。この技術により、高い応答精度で長時間のビデオコンテンツを処理可能に。
感想:
富士通のビデオ分析AIエージェントの開発は、職場の改善や作業効率向上に革新をもたらす可能性があります。特に、選択的注意機構を活用して長時間のビデオコンテンツを効率的に処理する技術は、業務の効率化に大きく貢献すると考えられます。また、フジツーのSDGsへの取り組みや持続可能性への取り組みは、社会に対する信頼を築きながら、より良い未来を築くための重要な一歩となるでしょう。
元記事: https://www.fujitsu.com/global/about/resources/news/press-releases/2024/1212-02.html