- HtmlRAG:
- HTML形式を使用し、文書の情報を保存
- HTMLの構造を活用して文書の情報を最適化
- HTMLの長いコンテキストを利用して、文書を短縮
- AFLOW:
- ワークフロー最適化をコード表現のワークフロー上の探索問題として再定義
- Monte Carlo Tree Search(MCTS)を使用して効率的なソリューションを見つける
- オペレーターを使用してワークフローを最適化
- ChunkRAG:
- 長い記事を小さな段落に分割し、最も関連性の高い箇所を取り出す
- LLMベースのチャンクフィルタリングフレームワークを導入
- 高度なRAGテクノロジーを統合してパフォーマンスを向上
- MarkItDown:
- PDF、画像などのファイルをMarkdownに変換するユーティリティ
- PDFではPdfConverter、画像ではImageConverterを使用
- 今後の開発を期待
元記事: https://substack.com/home/post/p-154719624%3Futm_campaign%3Dpost%26utm_medium%3Dweb