- QCon London 2025(4月7日〜9日)では、エンジニアリングの課題に対する実践的なアドバイスを得ることができます。
- Michael Brunton-Spall氏は、主に商業組織によって公に属性付けされた、最も先進的な攻撃について議論しています。
- Camilla Crispim氏は、アーキテクチャの側面について評価が必要な点、これらの評価を行う方法、およびプロセスを支援し意思決定をサポートするツールについて議論しています。
- Rachael Greaves氏は、データライフサイクル管理の要件、技術アプローチ、リスクについての要約を提供し、データ最小化のベストプラクティスチェックリストを含んでいます。
- Shane Hastie氏が行ったポッドキャストでは、Maria Apazoglou氏が、優れたチームの構築と組織全体で大規模言語モデルの使用を民主化する経験について語っています。
Linkov氏のトークからの重要な洞察の1つは、単一のメトリクスに過度に依存する問題です。彼は、複数のモデルが「私はポテトです」というフレーズを「私はポテトを食べるのが好きです」というフレーズの最良の一致と誤って識別した例を挙げました。これらのエラーは、単純なアプローチの制約と、より洗練された、多面的な評価戦略の必要性を強調しています。
元記事: https://www.infoq.com/news/2024/12/llm-eval-micro-metric/