火. 8月 19th, 2025

ChatGPT を騙して 16 進数を使ってエクスプロイトコードを書き込ませる方法 • The Register

ByManagetech

10月 30, 2024

要約：

OpenAIの言語モデルGPT-4oは16進数で悪意のある命令をエンコードすることによって、悪意ある目的のためにAIを悪用することができる。
0Dinの研究者Marco Figueroaによると、セキュリティガードレールをジャンプしてモデルの安全機能をバイパスすることが可能である。
最近のブログで、FigueroaはOpenAIのLLMに存在する脆弱性を利用して、Pythonの脆弱性コードを生成させることに成功した。
この攻撃は、ChatGPTが各エンコードされた指示を個別に処理する方法を悪用しており、よりコンテキストに即したセーフガードが必要であることを示唆している。
Figueroaは、エンコードされたコンテンツのより良い検出と、マルチステップのタスク全体を分析するモデルの開発が必要だと提案している。

感想：

この記事は、AIのセキュリティにおける新たな脅威について考えさせられる。Figueroaの実験によって、AIが悪用される可能性が浮き彫りになっている。エンコーディングされた悪意のある命令を検出し、それに対処するために、AIモデルのセーフガードを強化する必要があると感じる。

元記事: https://www.theregister.com/2024/10/29/chatgpt_hex_encoded_jailbreak/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech