技術記事要約

  • アメリカ合衆国の公式政府機関のウェブサイトは.govを使用
  • .govウェブサイトはHTTPSを使用して安全に接続されている
  • US AISIとUK AISIはOpenAIの最新モデルo1の事前展開評価を共同で実施
  • US AISIとUK AISIは3つのドメインでo1の性能を評価し、サイバー能力、生物能力、ソフトウェアおよびAI開発に焦点を当てた
  • o1の性能に関する選択された調査結果を共有

感想

US AISIとUK AISIはOpenAIのo1モデルの評価を行う際に、さまざまなドメインでの性能を評価し、特にサイバーセキュリティに関連する暗号化の課題での追加能力を指摘しています。AIの急速な進歩は生物学研究分野にも大きな約束を持っており、US AISIはo1の生物学的能力を評価しました。今後のAIの安全性の向上を目指す独立した評価は、リスクと能力が現れるにつれて政府が先を見るのに役立ちます。

元記事: https://www.nist.gov/news-events/news/2024/12/pre-deployment-evaluation-openais-o1-model