日. 10月 26th, 2025

MLCommons が LLM AI の安全性を測定および監視するための「初の」ベンチマークを開始 – Hackster.io

ByManagetech

12月 6, 2024

MLCommonsが「AILuminate」という新しいベンチマークを発表
AILuminateは大規模言語モデル（LLMs）の安全性を評価するために設計された
12のハザードカテゴリにわたる24,000以上のテストプロンプトに対するLLMsの応答を評価
MLCommonsはAIリスクと信頼性に関するグローバル基準を進めるために取り組んでいる
AILuminateはオープンソースであり、Apache 2.0ライセンスのもとGitHubにリリースされている

MLCommonsがAIの安全性を評価するための新しいベンチマークであるAILuminateを発表しました。このベンチマークは大規模言語モデル（LLMs）の安全性を評価するために設計されており、24,000以上のテストプロンプトに対するLLMsの応答を評価します。MLCommonsはAIリスクと信頼性に関するグローバル基準を進めるために取り組んでおり、AILuminateはオープンソースであり、Apache 2.0ライセンスのもとGitHubにリリースされています。

元記事: https://www.hackster.io/news/mlcommons-launches-a-first-of-its-kind-benchmark-to-measure-and-monitor-llm-ai-safety-412b25a8846c

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech