• Encordは、ビジネス分析を超えて、「世界で唯一のマルチモーダルAIデータ開発プラットフォーム」になることを目指している。
  • Encordは、音声およびドキュメントを分類するための新しいマルチモーダルデータ注釈機能を発表し、既存の医療、コンピュータビジョン、ビデオデータのサポートを拡大している。
  • AI業界は、テキスト生成よりもビデオや音声の生成が難しいことに焦点を当てており、ChatGPTのVoice Modeなどの機能のリリースにより、マルチモーダル機能にますます注力している。
  • Encordは、音声データの質を高めることで音声および感情認識モデルを構築し、音声を識別できる。ビデオと音声AI製品は、人間らしいリアリズムを実現するためにますます洗練されたデータのサポートが必要とされている。
  • Encordの更新には、文書、音声ファイル、ビジョン、医療データのための新しい注釈およびキュレーション機能が含まれており、マルチモーダル注釈により、AIチームは異なるファイルタイプを並べてレビューおよび編集するインターフェースをカスタマイズできる。
  • Encordを使用すると、AIチームはモデル構築に必要なデータを特定および整理することができ、評価ダッシュボードはモデルのパフォーマンスを妨げるデータを特定することができる。
  • Encordの代表は、「Encordの顧客は平均して35%小さなデータセットを使用し、モデルのパフォーマンスが20%向上する」と述べた。

私の考え:
Encordは、マルチモーダルAIデータ開発プラットフォームとして進化し、高品質なデータを活用してAIモデルの精度向上を実現しています。特に音声およびビデオに焦点を当て、人間らしいリアリズムを追求する現代のAI業界において、Encordのプラットフォームは重要な役割を果たしています。

元記事: https://www.zdnet.com/article/building-complex-gen-ai-models-this-data-platform-wants-to-be-your-one-stop-shop/