- MiniMax-01がDeepSeek-V3よりも優れている可能性
- Qwen2.5 Math Process Reward Models (PRM)の紹介
- Open TTSの逆襲:KokoroとOuteTTS 0.3
MiniMax-01はDeepSeek-V3よりも優れたパフォーマンスを達成し、商用モデルであるClaudeやGeminiを一部のベンチマークで上回った。しかし、計算方法が不明確なため、結果は慎重に検討すべき。
MiniMax-01はLightning Attentionと呼ばれる新しい注目メカニズムを持ち、線形注意の最適化実装であり、推論時間を大幅に短縮する。
QwenチームはPRMのトレーニングプロセスと数学的推論モデルを公開し、さらにBoN評価を組み込むことを推奨している。
OuteTTS 0.3とKokoroは、新しいオープンTTSモデルであり、言語サポートや音声品質の向上が特徴。
Kokoroはパフォーマンス向上を果たし、TTS Spaces Arenaで上位を獲得した。Apache 2.0ライセンスで広範な利用が可能。
新しいモデルを試すことに興奮し、オープンTTSモデルの進化に期待している。
元記事: https://substack.com/home/post/p-154765674%3Futm_campaign%3Dpost%26utm_medium%3Dweb