- Unified memory on modern GPU and its implementation on x86-64 system
- LinkedIn’s transition from Rest.li to Google’s gRPC for remote procedure calls
- Discussion on coordinate systems in AI and physical world
- Product value curve and women in tech communities
- Effective security posture maintenance with Linux through proactive approaches
- Genie, an AI-powered copilot by Uber, leveraging RAG for efficient incident response
Genie, Uber’s AI-powered copilot, has significantly improved on-call support engineers’ efficiency by utilizing Retrieval-Augmented Generation (RAG) for real-time responses. Since its launch, Genie has saved 13,000 engineering hours and answered over 70,000 questions. The system pulls data from internal sources like Uber’s wiki and Stack Overflow, processes it using OpenAI models, and stores it in Uber’s vector database for quick retrieval. User feedback is collected in real-time to enhance Genie’s performance and refine its responses based on actual user experiences. Uber has implemented a metrics framework and a custom evaluation pipeline to ensure the copilot’s effectiveness and maintain the quality of information it provides.
Genieは、UberのAIパワードコパイロットであり、リアルタイムの応答にRAGを活用してオンコールサポートエンジニアの効率を大幅に向上させました。ローンチ以来、Genieは13,000時間のエンジニアリング時間を節約し、7万件以上の質問に答えています。システムは、UberのウィキやStack Overflowなどの内部ソースからデータを取得し、OpenAIモデルを使用して処理し、迅速に取得するためにUberのベクトルデータベースに保存します。ユーザーフィードバックはリアルタイムで収集され、Genieのパフォーマンスを向上させ、実際のユーザー体験に基づいて応答を改善します。 Uberは、効果の評価と提供される情報の品質を維持するために、メトリクスフレームワークとカスタム評価パイプラインを導入しています。
元記事: https://www.infoq.com/news/2024/10/uber-genie-rag-copilot/