- Metaの大規模言語モデルLlamaとLlama 2がオープンで非商用なライセンスの下で公開され、ユーザーがモデルを微調整や適応する自由を持ち、消費者向けハードウェアで実行できる可能性を提供し、多くの関心を集めた。
- Llama 3がリリースされ、Metaはこのオープンソースにインスパイアされた大規模言語モデルのパフォーマンスを改善し、以前より多様なデータセットでトレーニングしていることが明らかになっている。
- Llama 3はMetaによれば、これまでで最も能力の高い公開可能なモデルであり、最新の機能を提供し、業界のベンチマークで最先端のパフォーマンスを実証し、改善された推論などを提供している。
- Llama 3はLlama 3 8B(8十億パラメーターモデル)とLlama 3 70B(7百億パラメーターモデル)という2つのサイズで提供され、コンテキストサイズが以前の世代から増加している。
- Llama 3は、指示の追従、推論、コード生成能力の向上に取り組んでおり、他の最新のモデルよりも優れた性能を発揮している。
MetaのLlama 3は、大規模言語モデルのオープンソースの健全なエコシステムを確立するのに役立つだろう。オープンモデルの進化は、プロプライエタリな大規模言語モデルに対するオープンソースの代替手段を提供する。
MetaはLlama 3を安全かつ責任ある使用を考慮して設計し、新しいシステムレベルのアプローチを採用している。安全ツールの導入やリスク評価により、悪用に関連する潜在的な問題的な応答のリスクを評価している。
LLMの人気とパワーが増すにつれて、Llamaのようなオープンモデルの継続的な進化は、プロプライエタリな大規模言語モデルに対するオープンソースの代替手段を確立するのに役立つだろう。
元記事: https://thenewstack.io/llama-3-how-metas-new-open-llm-compares-to-llama-1-and-2/