- 2023年には149のファンデーションモデルがリリースされ、そのうち2/3がオープンソースである。(スタンフォードのAIインデックスレポートより)
- Hugging Faceは、テキスト生成用のLLMを80,000以上追跡しており、リーダーボードを通じてモデルを簡単に比較できる。
- オープンソースモデルは商用モデルに比べてパフォーマンスが向上しており、透明性も高い。
- オープンソースはコストメリットが大きい。データセンターの余剰キャパシティがあれば、外部に支払う必要はない。
- 商用コードベースの96%にオープンソースコンポーネントが含まれている。(シノプシスのリポートより)
- オープンソースライセンスの形態は複雑であり、商用利用が可能かどうかについての課題が存在する。
- オープンソースプロジェクトは、コードだけでなく、トレーニングデータやモデルの重みも重要で、これらがモデルの動作を理解するために不可欠である。
- オープンソースのLLMは、すべての情報をリリースしているわけではなく、モデルによって異なる。
- オープンソースのgen AIは、専門知識がなければ効果的に利用することが難しい場合がある。
- オープンソースプロジェクトは、多くの人々がコードを見ることでセキュリティの弱点を発見できるが、gen AIの場合、そのような専門知識が十分にない可能性がある。
- オープンソースモデルはマルウェア生成などの悪用のリスクがある。
- オープンソースプロジェクトが標準に基づいているわけではなく、個々のプロジェクトに依存する。
- オープンソースが透明性を提供するとは限らないが、大規模な商用プロジェクトはしばしばより多くのリソースを文書化に投じている。
- オープンソースのgen AIを利用する場合、適切な文書化と評価が重要である。
要約:
オープンソースのgen AIモデルは、進化しており、商用モデルとの性能差も縮まっています。しかし、オープンソースプロジェクトの管理やセキュリティには課題があり、十分な専門知識や標準化が進んでいないため、企業がこれらのモデルを安全に利用するためには注意が必要です。また、オープンソースはコスト削減や透明性の面で有利ですが、その利用にはリスクも伴います。
元記事: https://www.cio.com/article/2104280/10-things-to-watch-out-for-with-open-source-gen-ai.html