月. 10月 20th, 2025

オープンソース AI の悪用を阻止できる新たな手法 | WIRED

ByManagetech

8月 3, 2024

Metaが4月に大規模言語モデルLlama 3を無料でリリース
外部開発者は数日で安全制限のないバージョンを作成
新しいトレーニング技術が開発され、今後のオープンソースAIモデルから安全保護を取り除くのが難しくなる可能性
研究者らはLlama 3の簡易版でトリックを実証
アプローチは完璧ではないが、AIモデルのデセンシングの基準が上がる可能性

この記事は、AIの安全保護に関する重要な課題に焦点を当てており、オープンソースAIモデルの安全性確保が今後ますます重要になると示唆しています。新しいトレーニング技術によって、悪意ある変更を困難にする手法が提案されており、これは今後の研究に影響を与える可能性があります。

元記事: https://www.wired.com/story/center-for-ai-safety-open-source-llm-safeguards/

By Managetech

Related Post

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech

研究者たちは現在、ロボットに AI を組み込んで物理的な作業を実行させている | ノーザンパブリックラジオ: WNIJ および WNIU

3月 18, 2025 Managetech

マイクロソフトが誤ってWindows 11から嫌われているAI機能を削除したことにユーザーが歓喜

3月 18, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech