新しいアルゴリズムがLLMの大量のデータを圧縮しプライバシーを強化

ByManagetech

11月 20, 2024

大規模言語モデル（LLMs）の登場以来、翻訳やテキスト分類などの自動化されたタスクの負荷が増加
LLMsを使用するためには、ユーザーがリクエストを送信し、中央サーバーが処理してレスポンスを返信する必要がある
既存の方法は高価で、エネルギーを消費し、遅い
データはサーバーに保存されているため、データリークやデータ損失の可能性がある
データを圧縮する技術が開発され、デバイスにローカルに保存可能
冗長性を削減し、層の精度を低下させる新しいアルゴリズム提案
圧縮されたデータは未圧縮バージョンとほぼ同じ性能を提供し、プライバシーを高め、エネルギーを節約し、コストを削減
新しいアルゴリズムCALDERAが提案され、12月に発表予定
CALDERAは、2つの新しいアプローチ、Low-PrecisionとLow-Rankを使用
Low-RankフレームワークはLLMの重み行列の冗長性を減少させ、Low-Precisionはビット数を減らす
CALDERAアルゴリズムのトレーニングには大規模な情報コレクションが使用され、Meta AIによってリリースされた大規模言語モデルでテストされた
圧縮された言語モデルのパフォーマンスは複数のタスクセットで評価され、最大5％の改善が確認された
重み行列を利用することで通常の圧縮アルゴリズムよりも優れた結果が得られた

考え：今回の研究では、データの圧縮によってLLMsの性能向上が実証された点が興味深いです。特に低ランクと低精度のアプローチを組み合わせることで、従来の手法よりも優れた圧縮率が達成されたことが注目されます。また、データセキュリティやエネルギー消費量の削減など、さまざまな利点がもたらされる可能性があります。

元記事: https://www.techexplorist.com/new-algorithm-compresses-llm-reams-of-data-increase-privacy/93133/

新しいアルゴリズムがLLMの大量のデータを圧縮しプライバシーを強化

ByManagetech

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

You missed

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

JFrogとNVIDIAが提携し、安全なAI導入を強化

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY