ラマ 3: Meta の新しいオープン LLM とラマ 1 および 2 の比較

6月 18, 2024

Metaの大規模言語モデルLlamaとLlama 2がオープンで非商用なライセンスの下で公開され、ユーザーがモデルを微調整や適応する自由を持ち、消費者向けハードウェアで実行できる可能性を提供し、多くの関心を集めた。
Llama 3がリリースされ、Metaはこのオープンソースにインスパイアされた大規模言語モデルのパフォーマンスを改善し、以前より多様なデータセットでトレーニングしていることが明らかになっている。
Llama 3はMetaによれば、これまでで最も能力の高い公開可能なモデルであり、最新の機能を提供し、業界のベンチマークで最先端のパフォーマンスを実証し、改善された推論などを提供している。
Llama 3はLlama 3 8B（8十億パラメーターモデル）とLlama 3 70B（7百億パラメーターモデル）という2つのサイズで提供され、コンテキストサイズが以前の世代から増加している。
Llama 3は、指示の追従、推論、コード生成能力の向上に取り組んでおり、他の最新のモデルよりも優れた性能を発揮している。

MetaのLlama 3は、大規模言語モデルのオープンソースの健全なエコシステムを確立するのに役立つだろう。オープンモデルの進化は、プロプライエタリな大規模言語モデルに対するオープンソースの代替手段を提供する。

MetaはLlama 3を安全かつ責任ある使用を考慮して設計し、新しいシステムレベルのアプローチを採用している。安全ツールの導入やリスク評価により、悪用に関連する潜在的な問題的な応答のリスクを評価している。

LLMの人気とパワーが増すにつれて、Llamaのようなオープンモデルの継続的な進化は、プロプライエタリな大規模言語モデルに対するオープンソースの代替手段を確立するのに役立つだろう。

ラマ 3: Meta の新しいオープン LLM とラマ 1 および 2 の比較 – The New Stack