Meta AI Llama 3.1 405B が GPT-4o を驚異的に上回る – Dataconomy

7月 23, 2024

2024年4月にMetaが導入したLLama 3は、オープンソースの大規模言語モデルである。
初期リリースでは、LLama 3 8BとLLama 3 70Bが新しい性能基準を確立した。
Metaは、LLama 3シリーズの中で最も野心的なモデルとして、4000億以上のパラメータを持つLlama 3.1を開発中。
リークされたベンチマークデータによると、LLama 3.1 405Bモデルは、OpenAIのGPT-4oを上回る可能性がある。
LLama 3.1は、GSM8K、Hellaswag、BoolQ、MMLU-humanities、MMLU-other、MMLU-STEM、およびWinogradなどのベンチマークで優れた性能を示すが、HumanEvalとMMLU-social sciencesのテストでは改善が必要。
LLama 3.1のベースモデルのベンチマーク結果は、インストラクションチューニングによって大幅に向上する可能性がある。
オープンソースのAIイニシアチブは、技術を民主化し、グローバルな開発者コミュニティの多様な視点を活用する。

オープンソースAIの重要性は非常に高く、Metaは先進的なモデルを公開することで、技術を民主化し、幅広いイノベーションと向上の可能性を広げている。これは、一部のユーザーや研究者にのみアクセス可能な閉鎖的なモデルとは対照的である。