• HtmlRAG:
    • HTML形式を使用し、文書の情報を保存
    • HTMLの構造を活用して文書の情報を最適化
    • HTMLの長いコンテキストを利用して、文書を短縮
  • AFLOW:
    • ワークフロー最適化をコード表現のワークフロー上の探索問題として再定義
    • Monte Carlo Tree Search(MCTS)を使用して効率的なソリューションを見つける
    • オペレーターを使用してワークフローを最適化
  • ChunkRAG:
    • 長い記事を小さな段落に分割し、最も関連性の高い箇所を取り出す
    • LLMベースのチャンクフィルタリングフレームワークを導入
    • 高度なRAGテクノロジーを統合してパフォーマンスを向上
  • MarkItDown:
    • PDF、画像などのファイルをMarkdownに変換するユーティリティ
    • PDFではPdfConverter、画像ではImageConverterを使用
    • 今後の開発を期待

元記事: https://substack.com/home/post/p-154719624%3Futm_campaign%3Dpost%26utm_medium%3Dweb