要約:

  • AIの発展により、テキストや画像の領域を超えて音声領域に活動範囲を拡大しており、会話型のAIが登場することでユーザー参入の障壁が低くなり、企業の収益機会が増加している。
  • AmazonはAI音声アシスタント「Alexa」を大幅に再編し、大規模言語モデル(LLM)を使用して複雑な会話が可能になると報じられている。
  • OpenAIは有料ユーザー向けに高度な音声モードのAlphaバージョン「GPT-PO(4o)」を提供し、ユーザーの声から感情も認識可能。
  • Appleは次回の新製品発表イベントでiPhone 16向けにアップグレード版の音声アシスタント「Siri」を発表予定。
  • Googleは今年中にプロジェクトAstraを導入する作業中。
  • メタは有名人の声を「Meta AI」に組み込む交渉中で、テキスト型サービスをインタラクティブサービスに変換してユーザーの利便性とコミュニケーションスキル向上を図る予定。
  • 韓国のNaverは、AI「HyperClova X」をベースにした「Speech X」技術をリリースし、複雑な音声パターンを認識し、自然な音声を生成することが可能。
  • 複数のIT業界関係者は、「正確な回答を与え、優れたコミュニケーションスキルを持つAIが求められる中、様々なデータを処理するAIへの技術開発のペースが加速している」と述べている。

考察:

AIの発展により、音声領域での活用が進んでおり、ユーザーの利便性向上や企業の収益機会拡大が期待される。各社が音声ベースのAI機能を競ってリリースしており、今後の技術開発やビジネスモデルの変革が注目される。


元記事: https://www.mk.co.kr/en/it/11104801