要約:

  • 22日、NaverはClovaの公式サイトのテクノロジーブログを通じて、Generative AIに基づいた音声合成技術を発表しました。
  • NaverはHyperClova Xベースの音声AI技術を発表し、これは以前の音声認識と音声合成技術よりも進化したモデルです。
  • 新技術は、言語構造や発音の精度だけでなく、感情表現を向上させることが可能な自然な会話を実現します。
  • HyperCLOVAXは、言語理解や音声機能を統合したシステムであり、画像や音声など複数のデータを同時に処理できます。
  • HyperClovaXは、画像理解能力を追加した大規模ビジョン言語モデルに発展しており、NaverはAIサービスの拡充を計画しています。
  • ClovaXは画像理解機能を強化し、画像を使ったクエリに基づいてAIと対話することが可能となりました。
  • HyperClovaXを用いたサービスは、リアルタイム音声翻訳や言語学習、カウンセリングなどの様々な分野で活用される見込みです。

考察:

Naverの新しい音声合成技術は、Generative AIを活用した先進的な取り組みであり、多様なデータを統合してより自然な会話を実現する可能性があります。HyperClovaXの進化により、AIサービスの幅が拡大し、ユーザー価値が向上することが期待されます。

元記事: https://www.mk.co.kr/en/it/11098396