Nvidia が LLM トレーニングデータを作成するオープンモデルを発表

ByManagetech

6月 15, 2024

NvidiaがNemotron-4 340Bをリリース
Nemotron-4 340Bはオープンなモデルファミリーで、LLMsのトレーニング用の合成データを生成することを目的とする
高品質なトレーニングデータの不足が組織にとって課題となっており、Nemotron-4 340Bは合成データを生成する方法を提供
合成データは実際のデータを模倣するために人工的に生成されたデータであり、特徴や構造が似ている
NvidiaはNemotron-4 340Bモデルを最適化し、NeMoとTensorRT-LLMと統合
Nemotron-4 340B Rewardモデルは高品質な応答を特定することに特化し、Hugging Face RewardBenchのリーダーボードでトップに
研究者はNemotron-4 340B Baseモデルをカスタマイズ可能で、NeMoフレームワークを使用して微調整できる

この記事では、NvidiaがNemotron-4 340Bを通じて合成データの生成方法を提供することで、LLMsのトレーニングデータの不足という課題に取り組んでいることが紹介されています。Nemotron-4 340Bのモデルは、開発者が自由かつスケーラブルな方法で合成データを生成できるよう設計されており、実際のデータに似た特性や構造を持つデータを提供することが可能です。

元記事: https://www.pymnts.com/artificial-intelligence-2/2024/nvidia-unveils-open-model-that-creates-llm-training-data/