• Llama 3はMetaの最も能力のあるオープンソースLLMであり、最近リリースされたLlama 3.1は合成データ生成やモデル蒸留など、他に類を見ない柔軟性、制御力、最先端の機能を備えた新しいワークフローを可能にする。
  • AI Infra @ Scale 2024では、MetaのエンジニアがLlama 3をデータとトレーニングから推論までのすべてのステップについて議論した。
  • Joe Spisak氏は、MetaのオープンソースAIの歴史とMetaの全体的なビジョンについて語り、Delia David氏はGenAIに必要なデータの多様性、ボリューム、新鮮さ、および異なるデータタイプの抽出と準備について議論した。
  • Kaushik Veeraraghavan氏は、Metaが規模を拡大してLlamaをトレーニングする方法について語り、MetaのLlama 3モデルの開発を可能にするデータセンター、ネットワーキング、およびソフトウェアへの投資について掘り下げた。
  • 最後に、Ye(Charlotte)Qia氏は、MetaがLlamaの推論をどのように処理するかについて議論した。大規模な製品アプリケーションを可能にするために、LLM推論の最適化とスケーリングが重要である。Qia氏は、モデルサイズとコンテキストウィンドウのスケーリングを支援する主要な並列技術を紹介し、推論システムの設計に影響を与える。また、複雑なサービングパラダイムを展開する際に発生する実際の課題についても議論した。

Metaはオープンソース技術を通じてコミュニティの構築を信じている。人工知能、データインフラストラクチャ、開発ツール、フロントエンド、言語、プラットフォーム、セキュリティ、仮想現実など、最新プロジェクトを探索してみてください。

Metaのエンジニアリングは、Metaで大規模な技術的課題をどのように解決しているかに興味を持つエンジニア向けの技術ニュースリソースです。

コンテンツをパーソナライズし、広告をカスタマイズし、安全性を確保するために、Cookieを使用しています。サイトの利用をクリックまたはナビゲートすることで、Cookieを通じてFacebook内外での情報収集に同意したことになります。

元記事: https://engineering.fb.com/2024/08/21/production-engineering/bringing-llama-3-to-life/