• 2024年春、AIスタートアップのHumeは、Google DeepMindの元コンピュータサイエンティストであるAlan Cowen氏によって共同設立・率いられ、ユニークな声AIアシスタントを開発するアプローチで5000万ドルのシリーズBプライベートエクイティファンディングラウンドを調達。
  • Humeは、異なる話者のクロスカルチャーな音声録音と、自己申告の感情調査結果をマッチングさせ、独自のAIモデルを作成し、さまざまな言語や方言にわたるリアルな声の表現と理解を提供する。
  • EVI 2は、自然さ、感情的反応性、およびカスタマイズ性を向上させるための一連の強化機能を導入し、開発者や企業のためのコストを大幅に削減する。APIを介して40%低い遅延と30%安い価格。
  • EVI 2のキーの改善点は、音声の自然さと明瞭さを向上させる高度な音声生成システム、ユーザーのトーンを理解し応答を適応させる感情インテリジェンス、音声の調整を可能にするカスタマイズ可能な声など。
  • EVI 2は現在ベータ版で利用可能であり、HumeのAPIを介して統合可能。

私の考え:HumeのEVI 2は、音声AIの進化において重要な進歩を示しています。感情的な応答とユーザーの傾向に合った回答を提供することで、ユーザー満足度を向上させる設計を採用しています。EVI 2の今後の改善に期待が高まります。

元記事: https://venturebeat.com/ai/who-needs-gpt-4o-voice-mode-humes-evi-2-is-here-with-emotionally-inflected-voice-ai-and-api/