要約:
- NCsoft(NC)は、独自の巨大言語モデル(LLM)「Barco」を開発し、画像解析機能を持つ非言語モデル(VLM)にアップグレードしました。
- NCは、VLM「Barco-Vision」と5つの韓国の多様性ベンチマークを発表しました。
- Barco-Visionは、画像入力値を理解できる中小規模のモデルであり、韓国語と英語のプロンプトとともに使用できます。
- Barco-Visionは、韓国語セクターで最も高いパフォーマンスを持ち、画像認識と推論を行うビジョンタスクに優れた結果を提供します。
- AIサービス開発者は、Barco-Visionを使用して画像認識とQ&A、画像の説明、文字認識(OCR)、オブジェクトの位置検出(grounding)機能を活用したさまざまなサービスを開発できます。
感想:
NCsoftのVLM「Barco-Vision」は、画像と自然言語を組み合わせたモデルであり、韓国語セクターで優れたパフォーマンスを示しています。Barco-Visionを活用することで、AIサービス開発者やコンテンツ制作会社は、画像認識やテキスト認識を使ったさまざまなサービスを効果的に開発・活用できる可能性があります。NCの取り組みは、韓国AIモデル研究の発展に貢献するものであり、VLMの機能拡張や業種への適用を通じて今後の成長が期待されます。
元記事: https://www.mk.co.kr/en/it/11185748