- 2024年4月にMetaが導入したLLama 3は、オープンソースの大規模言語モデルである。
- 初期リリースでは、LLama 3 8BとLLama 3 70Bが新しい性能基準を確立した。
- Metaは、LLama 3シリーズの中で最も野心的なモデルとして、4000億以上のパラメータを持つLlama 3.1を開発中。
- リークされたベンチマークデータによると、LLama 3.1 405Bモデルは、OpenAIのGPT-4oを上回る可能性がある。
- LLama 3.1は、GSM8K、Hellaswag、BoolQ、MMLU-humanities、MMLU-other、MMLU-STEM、およびWinogradなどのベンチマークで優れた性能を示すが、HumanEvalとMMLU-social sciencesのテストでは改善が必要。
- LLama 3.1のベースモデルのベンチマーク結果は、インストラクションチューニングによって大幅に向上する可能性がある。
- オープンソースのAIイニシアチブは、技術を民主化し、グローバルな開発者コミュニティの多様な視点を活用する。
オープンソースAIの重要性は非常に高く、Metaは先進的なモデルを公開することで、技術を民主化し、幅広いイノベーションと向上の可能性を広げている。これは、一部のユーザーや研究者にのみアクセス可能な閉鎖的なモデルとは対照的である。
元記事: https://dataconomy.com/2024/07/23/meta-ai-llama-3-1-405b-beats-gpt-4o/