- MITREの非営利技術研究機関が開発したATLASは、AIシステムの敵対的脅威を理解し、セキュリティ分析や脅威評価に活用するための知識ベース。
- ATLASは、攻撃者の攻撃ライフサイクルを示し、初期偵察から最終的な影響までを示す。
- 攻撃者は、リソースの確立やAI/MLシステムへの初期アクセスを目指し、MLモデルの回避や不正アクセスなどの手法を使用。
- MLモデルへのアクセスや永続性の確立、特権の昇格、データの外部への持ち出しなど、MLシステムへの攻撃手法が詳細に記載されている。
- 攻撃者は、最終的にはデータの外部への持ち出しやシステムへの影響を狙い、MLアーティファクトを盗むなどの活動を行う。
- 影響段階では、可用性攻撃やMLモデルの整合性への悪影響を狙い、サービスの中断やシステム破壊などの被害を引き起こす手法が記載されている。
自然言語処理システムへの攻撃手法に関するATLASの詳細な説明が提供されており、AI/MLシステムにおけるセキュリティの重要性が強調されています。攻撃者が様々な手法を用いてMLモデルにアクセスし、悪意ある活動を行う過程が包括的に示されており、これに対抗するための防御策が示唆されています。MLシステムのセキュリティを強化するためには、攻撃者の手法や攻撃段階を理解し、適切な対策を講じることが重要であると感じます。