要約:
- Open Source Initiative (OSI)が待望のオープンソースAI定義の最初のバージョンを発表
- RC1バージョンでは、AIモデルまたはLLMには3つのコンポーネントが必要
- LLMが実際にオープンソースであるかどうかを決定するための4つの要件も存在
- 定義には厳格な要件があり、トレーニングおよび実行のための完全なソースコードが利用可能である必要がある
- データ純粋主義者は新しいオープンソースAI定義にも異議を唱えている
- データの開示は問題であるが、完全なデータセットを公開することはできない
- トレーニングデータには完全な(オープンソース)データセットを要求する代わりに、LLMをトレーニングするための「十分に詳細な情報」を含む必要がある
- データ純粋主義者によると、オープンソースAIはオープンデータだけでトレーニングされたLLMに限定されるべきであると主張
- OSIによると、データ純粋主義者だけでなく、AI企業も新しいオープンソースAI定義に苦しんでいる
感想:
オープンソースAI定義の導入は歓迎されるが、データの開示に関する問題や批判があることが明らかです。データの公開は、プライバシー規制や知的財産権などの法的制約によって制限されることが多いため、透明性と実務的、法的な考慮とのバランスを取ろうとする定義が提供されていることが理解できます。