- 最近の主な発表には、OpenAI LLC、Mistral AI SAS、Alphabet Inc.のGoogle、Runway AI Inc.、Meta Platforms Inc.などから新しい大規模言語モデルが登場。
- MetaのLlama 3.1 405Bは、GPT-4 OmniやClaude 3.5 Sonnetなどの主要なクローズドソースモデルと同等の性能を持つオープンソースモデルとして注目を集めている。
- OpenAIは、GPT-4o miniを発表し、数学的推論やコーディングの性能、通話あたりのコスト削減能力を強調。
- Mistral AIとNVIDIA Corp.の提携により、Mistral NeMo 12BやLarge 2などの新しいモデルが発表された。
- LLM評価ツールのPatronus AI Inc.は、幻覚を検出するために設計されたLynxモデルをオープンソース化。
オープンソースとクローズドソースの大規模言語モデルに関する議論は、主要なフロンティアモデルが通常クローズドであることで影響を受けてきました。しかし、Llama 3.1 405Bの登場により、オープンとクローズドの差が狭まり、組織がモデルをより制御できるようになりました。MetaのLlama 3.1 405B、MistralのLarge 2、GoogleのGemma 2などは、純粋な意味でオープンソースではありませんが、オープンなウェイトを持ち、開発者が事前に学習されたパラメータにアクセスできます。