- LLM(Large Language Models)は翻訳、テキスト分類、カスタマーサービスなどのタスクを自動化しており、中央サーバーにリクエストを送信する必要がある
- 新しいアルゴリズムCALDERAは、LLMのデータを圧縮し、プライバシーを向上させ、エネルギーを節約し、コストを削減する
- このアルゴリズムは、冗長性を削減し、LLMの情報層の精度を低下させることで、デバイス上で保管およびアクセス可能
- 低精度と低ランクの組み合わせにより、従来の圧縮技術よりも優れた効率を実現
- 圧縮されたLLMは、高精度が必要ない状況に適しており、プライバシーを強化し、データ漏洩のリスクを軽減
アルゴリズムCALDERAによるLLMの圧縮技術は、プライバシー保護やエネルギー効率向上に寄与するとともに、デバイス上での使用を可能にしています。低精度と低ランクの組み合わせは、従来の圧縮技術よりも優れた圧縮効果をもたらすことが示されています。
元記事: https://www.miragenews.com/slimmer-ai-models-power-phones-laptops-locally-1360031/