水. 7月 9th, 2025

Metaの新しいLLMアーキテクチャは、言語モデルがテキストを処理する方法の根本的な欠陥に対処します

ByManagetech

12月 16, 2024

要約:

Metaは新しいAIアーキテクチャであるByte Latent Transformer（BLT）を開発しました。
BLTは、今日の言語モデルの基本的な問題である、個々の文字との信頼性のある作業ができないことを解決します。
BLTはトークンではなく、バイトレベルでデータを処理します。
BLTは、個々の文字を理解するタスクにおいて、16倍のデータにトレーニングされたLlama 3.1よりも8億のパラメータで優れたパフォーマンスを発揮します。
Metaの研究チームは、パッチとモデルのサイズを同時に拡大することで、効率を最大50％向上させる方法を発見しました。
BLTは、異常や破損したテキストを扱う能力に優れており、ノイズや他の干渉があってもパフォーマンスを維持します。

考察:

BLTはトークンの代わりにバイトレベルでデータを処理する新しいアーキテクチャであり、個々の文字を理解するタスクにおいて優れたパフォーマンスを示します。Metaの研究チームが両方のパッチとモデルのサイズを同時に拡大することで、効率を向上させる方法を見つけたことは注目に値します。さらに、異常や破損したテキストを扱う能力を持つBLTは、言語モデルの進化において重要な役割を果たす可能性があります。

元記事: https://the-decoder.com/metas-new-llm-architecture-tackles-fundamental-flaw-in-how-language-models-process-text/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech