- GoogleはProject Naptimeという新しいフレームワークを導入し、LLMsが脆弱性調査を行えるようにしている。
- このフレームワークは、LLMsのコード圧縮と一般的な推論能力の進展を活用して、セキュリティ脆弱性の特定とデモンストレーションにおいて人間の行動を再現することを可能にしている。
- Naptimeアーキテクチャは、AIエージェントと対象のコードベースとの相互作用を中心に構築されており、人間のセキュリティ研究者のワークフローを模倣する専門ツールセットが提供されている。
- このフレームワークには、AIエージェントが対象のコードベースをナビゲートするCrowd Browserツールや、Pythonスクリプトをファジングのためにサンドボックス環境で実行するPythonツール、プログラムの動作を異なる入力で観察するDebuggerツール、タスクの進捗を監視するReporterツールなどの複数のコンポーネントがある。
- Naptimeはバックエンドに依存せず、モデルにも依存しない。また、Metaのリサーチャーによって2024年4月にリリースされたCYBERSECEVAL 2のベンチマークによると、高度なメモリ破壊やバッファオーバーフローの欠陥をよりよく示すことが期待されている。
GoogleのProject Naptimeは、LLMsによる脆弱性調査を効率化し、人間のセキュリティ研究者のアプローチを模倣することで、セキュリティの向上を目指しています。新しいフレームワークの導入により、AIエージェントが効果的に脆弱性を特定し、分析する能力が向上し、結果が正確で再現性が確保されることが期待されています。