人工知能:ニュース、ビジネス、研究

  • Nvidiaとテルアビブ大学の研究者が開発したComfyGenは、シンプルなプロンプトからのテキストから画像へのワークフローを自動化する新しいAI手法である。
  • ComfyGenは、適切なモデルを独立して選択し、プロンプトを作成し、生成された画像をアップスケーラーなどの追加ツールと組み合わせて望ましい結果を達成する。
  • 伝統的なテキストから画像への生成は、通常、テキストを画像に変換するために単一のモデルに依存している。しかし、経験豊富なプロンプトエンジニアは、複雑な、多段階のワークフローを使用して、ベースモデル、LoRAs、プロンプト拡張、アップスケーリングモデルなどの様々なコンポーネントを組み合わせることが多い。
  • ComfyGenは、簡潔なテキストプロンプトに基づいて適切なワークフローを自動的に編成するために、Claude 3.5 Sonnetなどの言語モデルを使用している。

私の考え:

ComfyGenは、既存のワークフローやスコアリングモデルに直接基づいて構築されており、新しい展開に適応できるという利点があります。しかし、これにより、生成されたワークフローの多様性や独自性が制限される可能性があります。将来、ComfyGenのようなプロンプト駆動型のワークフローは、初心者の導入障壁を下げながら画像の品質を向上させる可能性があります。

元記事: https://the-decoder.com/comfygen-ai-automates-multi-stage-text-to-image-workflows-from-simple-prompts/