EyeLevel
EyeLevel
  • 91
  • 26 406
RAG Evaluation Sucks: Here's a Totally New Way to Do It - e17 RAG Masters
Tired of spending weeks manually creating question-answer pairs for RAG evaluation?
In this episode of RAG Masters, we unveil a game-changing approach to automated QA pair generation that saves you countless hours of manual work.
Neil Katz and Daniel Warfield break down how to leverage LLMs + human-in-the-loop to create high-quality test sets in seconds instead of days. Perfect for RAG engineers, ML practitioners, and anyone building production-grade retrieval systems! 🚀
Tech stack revealed:
-Ground X for document parsing
-OpenAI for QA generation
-Parallel processing for speed
-Visual validation tools
-Automated test set creation
Code on GitHub: github.com/groundxai/code-samples/blob/master/notebooks/RAGMasters_QAGenWithHuman.ipynb
Timestamps:
0:00 - The RAG Testing Problem
2:14 - Why QA Pair Generation is Crucial (and Hard)
4:32 - Introducing Automated QA Generation
7:15 - Visual Demo: Testing Real Documents
11:43 - How the System Works Under the Hood
15:20 - Configuring for Different Document Types
18:45 - Processing Pipeline Deep Dive
22:30 - Implementation Details & Code Walkthrough
26:15 - Output Formats & Integration Tips
28:40 - Wrap-up & Code Availability
#RAGMasters #LLM #AIEngineering #MachineLearning #RAG #Testing #AITesting #datascience
มุมมอง: 127

วีดีโอ

RAG on Prem: How to Build Secure RAG for Finance, Health, Government and More | RAG Masters | e16
มุมมอง 13214 วันที่ผ่านมา
🔒 Enterprise-grade RAG is finally here! Learn how to build secure, scalable Retrieval Augmented Generation systems that can run in the most sensitive environments - from air-gapped military facilities to highly-regulated industries like healthcare and finance. In this episode of RAGmasters, Neil Katz and Daniel Warfield dive deep into GroundX, a groundbreaking technology that enables: • Air-gap...
Making a Verbal AI Assistant With OpenAI, LangChain, and GroundX | RAG Masters ep15
มุมมอง 58214 วันที่ผ่านมา
🗣️ Building voice-controlled AI assistants doesn't have to be a black-box - this episode demonstrates a practical architecture combining Vue.js/Flask for the application layer, OpenAI Whisper for speech processing, and LangChain's structured output parser for reliable response handling. We dive into how GroundX's document understanding capabilities enable precise figure and page-level retrieval...
Beyond Chat: Build Powerful RAG Apps in Days | RAG Masters | e14
มุมมอง 235หลายเดือนก่อน
Beyond Chat: Build Powerful RAG Apps in Days | RAG Masters | e14
RAG Has a Scaling Problem: Are Vectors to Blame? | RAG Masters E13
มุมมอง 443หลายเดือนก่อน
RAG Has a Scaling Problem: Are Vectors to Blame? | RAG Masters E13
LangGraph: The Future of AI Agents? | RAG Masters Deep Dive e12
มุมมอง 566หลายเดือนก่อน
LangGraph: The Future of AI Agents? | RAG Masters Deep Dive e12
Is OpenAI o1’s Model Any Good? Our Data scientist digs in and finds out.
มุมมอง 170หลายเดือนก่อน
Is OpenAI o1’s Model Any Good? Our Data scientist digs in and finds out.
Instant Multimodal RAG on Super Complex Walmart Docs - I Was Blown Away
มุมมอง 208หลายเดือนก่อน
Instant Multimodal RAG on Super Complex Walmart Docs - I Was Blown Away
📄 Multimodal RAG: From PDFs to AI-Ready Data | e10 RAG Masters
มุมมอง 2122 หลายเดือนก่อน
📄 Multimodal RAG: From PDFs to AI-Ready Data | e10 RAG Masters
Eyelevel AI Legal Assistant Overview (CC)
มุมมอง 372 หลายเดือนก่อน
Eyelevel AI Legal Assistant Overview (CC)
Eyelevel AI Legal Assistant Overview
มุมมอง 422 หลายเดือนก่อน
Eyelevel AI Legal Assistant Overview
👁️ AI Observability Unveiled: Arize Founders on LLM Quality Control | RAG Masters | E9
มุมมอง 1012 หลายเดือนก่อน
👁️ AI Observability Unveiled: Arize Founders on LLM Quality Control | RAG Masters | E9
RAG Without Vectors? Is it Better!?!? With EyeLevel CEO Ben Fletcher
มุมมอง 2102 หลายเดือนก่อน
RAG Without Vectors? Is it Better!?!? With EyeLevel CEO Ben Fletcher
AI Expert Reveals His Secret to Fine Tuning LLMs (Clueless Host Tries to Follow Along)
มุมมอง 1193 หลายเดือนก่อน
AI Expert Reveals His Secret to Fine Tuning LLMs (Clueless Host Tries to Follow Along)
Slash LLM Costs by 80%: LLM Routing with Unify (Better Than GPT-4?) | RAG Masters e6
มุมมอง 1673 หลายเดือนก่อน
Slash LLM Costs by 80%: LLM Routing with Unify (Better Than GPT-4?) | RAG Masters e6
🐾 AI Revolutionizing Veterinary Care: AskVet's Journey with RAG | RAG Masters ft. Dave Kearney
มุมมอง 803 หลายเดือนก่อน
🐾 AI Revolutionizing Veterinary Care: AskVet's Journey with RAG | RAG Masters ft. Dave Kearney
X-Ray machine for RAG AI
มุมมอง 744 หลายเดือนก่อน
X-Ray machine for RAG AI
Key to RAG Success: Document Parsing Explained | RAG Masters ep 4
มุมมอง 1.4K4 หลายเดือนก่อน
Key to RAG Success: Document Parsing Explained | RAG Masters ep 4
Agentic RAG Explained: Building Agentic Systems with RAG | RAG Masters Ep. 3
มุมมอง 3014 หลายเดือนก่อน
Agentic RAG Explained: Building Agentic Systems with RAG | RAG Masters Ep. 3
Multimodal RAG: A Comprehensive Guide to the Newest AI Approaches and Applications
มุมมอง 5244 หลายเดือนก่อน
Multimodal RAG: A Comprehensive Guide to the Newest AI Approaches and Applications
Is Meta's CRAG Any Good? We Dissect the new RAG Benchmark for AI Engineers
มุมมอง 3865 หลายเดือนก่อน
Is Meta's CRAG Any Good? We Dissect the new RAG Benchmark for AI Engineers
Has Google Already Lost the AI Search War?
มุมมอง 275 หลายเดือนก่อน
Has Google Already Lost the AI Search War?
WarKat: Legal & AI- An Interview with Eric Fong
มุมมอง 285 หลายเดือนก่อน
WarKat: Legal & AI- An Interview with Eric Fong
Google I/O 2024: Everything You Need to Know and Their Battle with OpenAI
มุมมอง 586 หลายเดือนก่อน
Google I/O 2024: Everything You Need to Know and Their Battle with OpenAI
OpenAI's GPT-4o Big Reveal Brings Voice, Vision and More, Worth the Hype?
มุมมอง 1656 หลายเดือนก่อน
OpenAI's GPT-4o Big Reveal Brings Voice, Vision and More, Worth the Hype?
World's Most Accurate RAG? LangChain/Pinecone, LlamaIndex or EyeLevel
มุมมอง 4.4K7 หลายเดือนก่อน
World's Most Accurate RAG? LangChain/Pinecone, LlamaIndex or EyeLevel