• 2023年には149のファンデーションモデルがリリースされ、そのうち2/3がオープンソースである。(スタンフォードのAIインデックスレポートより)
  • Hugging Faceは、テキスト生成用のLLMを80,000以上追跡しており、リーダーボードを通じてモデルを簡単に比較できる。
  • オープンソースモデルは商用モデルに比べてパフォーマンスが向上しており、透明性も高い。
  • オープンソースはコストメリットが大きい。データセンターの余剰キャパシティがあれば、外部に支払う必要はない。
  • 商用コードベースの96%にオープンソースコンポーネントが含まれている。(シノプシスのリポートより)
  • オープンソースライセンスの形態は複雑であり、商用利用が可能かどうかについての課題が存在する。
  • オープンソースプロジェクトは、コードだけでなく、トレーニングデータやモデルの重みも重要で、これらがモデルの動作を理解するために不可欠である。
  • オープンソースのLLMは、すべての情報をリリースしているわけではなく、モデルによって異なる。
  • オープンソースのgen AIは、専門知識がなければ効果的に利用することが難しい場合がある。
  • オープンソースプロジェクトは、多くの人々がコードを見ることでセキュリティの弱点を発見できるが、gen AIの場合、そのような専門知識が十分にない可能性がある。
  • オープンソースモデルはマルウェア生成などの悪用のリスクがある。
  • オープンソースプロジェクトが標準に基づいているわけではなく、個々のプロジェクトに依存する。
  • オープンソースが透明性を提供するとは限らないが、大規模な商用プロジェクトはしばしばより多くのリソースを文書化に投じている。
  • オープンソースのgen AIを利用する場合、適切な文書化と評価が重要である。

要約:

オープンソースのgen AIモデルは、進化しており、商用モデルとの性能差も縮まっています。しかし、オープンソースプロジェクトの管理やセキュリティには課題があり、十分な専門知識や標準化が進んでいないため、企業がこれらのモデルを安全に利用するためには注意が必要です。また、オープンソースはコスト削減や透明性の面で有利ですが、その利用にはリスクも伴います。


元記事: https://www.cio.com/article/2104280/10-things-to-watch-out-for-with-open-source-gen-ai.html