
What is RAG ? | Completely Explained in 15 Minutes
Apna College
Overview
यह वीडियो रिट्रीवल ऑगमेंटेड जनरेशन (RAG) की अवधारणा को विस्तार से समझाता है, जो AI मॉडल की प्रतिक्रियाओं की सटीकता और प्रासंगिकता को बेहतर बनाने की एक तकनीक है। यह बताता है कि RAG कैसे काम करता है, इसके क्या फायदे हैं, और विभिन्न प्रकार के RAG आर्किटेक्चर और उनके उपयोग के मामले क्या हैं। वीडियो में एक सामान्य LLM और RAG-आधारित सिस्टम के बीच अंतर को स्पष्ट करने के लिए छात्रों के परीक्षा के उदाहरण का उपयोग किया गया है। यह डेटा इंजेक्शन और रिट्रीवल पाइपलाइन की प्रक्रिया को भी कवर करता है, जिसमें डेटा को चंक्स में विभाजित करना, उन्हें एम्बेडिंग में बदलना और उन्हें वेक्टर डेटाबेस में स्टोर करना शामिल है। अंत में, यह स्टैंडर्ड RAG, हाइब्रिड RAG, मेमोरी के साथ RAG, ग्राफ RAG, एजेंटिक RAG, मल्टीमॉडल RAG और सेल्फ-रिफ्लेक्टिव RAG जैसे विभिन्न RAG आर्किटेक्चर पर चर्चा करता है।
Save this permanently with flashcards, quizzes, and AI chat
Chapters
- RAG (रिट्रीवल ऑगमेंटेड जनरेशन) AI मॉडल की प्रतिक्रियाओं की सटीकता और गुणवत्ता को बेहतर बनाने की एक तकनीक है।
- यह LLMs (जैसे ChatGPT, Gemini) की सीमाओं को दूर करता है, जैसे कि सीमित या पुरानी जानकारी तक पहुंच।
- RAG मॉडल को रियल-टाइम और अप-टू-डेट डेटाबेस तक पहुंचने की अनुमति देता है, जिससे अधिक सटीक और प्रासंगिक प्रतिक्रियाएं मिलती हैं।
- यह कस्टमर सपोर्ट, मेडिकल, लीगल और फाइनेंस जैसे विभिन्न डोमेन में रियल-वर्ल्ड एप्लीकेशंस के लिए बहुत लोकप्रिय है।
- सामान्य LLMs (जैसे GPT, Gemini) बड़े डेटासेट पर प्रशिक्षित होते हैं और अपनी ट्रेनिंग के आधार पर प्रतिक्रियाएं उत्पन्न करते हैं।
- RAG-आधारित सिस्टम एक 'ओपन बुक एग्जाम' की तरह काम करते हैं, जहां मॉडल वास्तविक समय में बाहरी डेटाबेस से जानकारी प्राप्त कर सकता है।
- यह वास्तविक समय में जानकारी को सत्यापित करने और अपडेटेड डेटा का उपयोग करने की क्षमता प्रदान करता है।
- RAG मॉडल को अधिक प्रासंगिक और संदर्भ-जागरूक उत्तर देने में सक्षम बनाता है।
- हेलुसिनेशन (गलत जानकारी गढ़ना) को कम करता है क्योंकि प्रतिक्रियाएं वास्तविक डेटा पर आधारित होती हैं।
- ज्ञान को अप-टू-डेट रखता है, LLMs के नॉलेज कट-ऑफ डेट की सीमा को पार करता है।
- कॉस्ट-इफेक्टिव है क्योंकि यह मॉडल को फिर से प्रशिक्षित या फाइन-ट्यून करने की आवश्यकता को समाप्त करता है।
- डेटा प्राइवेसी बनाए रखता है, खासकर एंटरप्राइज-लेवल एप्लीकेशन्स के लिए, क्योंकि मॉडल केवल क्वेरी से संबंधित डेटा के विशिष्ट हिस्सों तक पहुंचता है।
- डेटा इंजेक्शन पाइपलाइन में डेटा को निकालना, उसे छोटे 'चंक्स' में विभाजित करना, और फिर उन्हें संख्यात्मक 'एंबेडिंग' (वेक्टर) में परिवर्तित करना शामिल है।
- ये एंबेडिंग एक विशेष 'वेक्टर डेटाबेस' में स्टोर की जाती हैं जो सिमेंटिक (अर्थ-आधारित) खोज की अनुमति देता है।
- रिट्रीवल पाइपलाइन में उपयोगकर्ता की क्वेरी को एंबेडिंग में बदलना शामिल है।
- फिर वेक्टर डेटाबेस में क्वेरी एंबेडिंग का उपयोग करके प्रासंगिक चंक्स (कॉन्टेक्स्ट) को पुनः प्राप्त किया जाता है।
- ऑग्मेंटेशन चरण में, मूल उपयोगकर्ता क्वेरी को पुनः प्राप्त कॉन्टेक्स्ट के साथ जोड़ा जाता है ताकि एक विस्तृत 'प्रॉम्प्ट' बनाया जा सके।
- यह ऑग्मेंटेड प्रॉम्प्ट फिर LLM को भेजा जाता है।
- LLM इस प्रॉम्प्ट का उपयोग करके अंतिम प्रतिक्रिया या सामग्री उत्पन्न करता है।
- इसलिए इसे 'रिट्रीवल ऑग्मेंटेड जनरेशन' कहा जाता है: पहले रिट्रीवल, फिर ऑग्मेंटेशन, और अंत में जनरेशन।
- चंकिंग रणनीतियों में फिक्स्ड साइज, हायरार्किकल और सिमेंटिक चंकिंग शामिल हैं, प्रत्येक के अपने फायदे और नुकसान हैं।
- एंबेडिंग मॉडल (जैसे OpenAI के टेक्स्ट एंबेडिंग 3, Gemini) टेक्स्ट को संख्यात्मक वैक्टर में परिवर्तित करते हैं।
- वेक्टर डेटाबेस (जैसे ChromaDB, Pinecone, Elasticsearch) इन वैक्टर को कुशलतापूर्वक स्टोर और क्वेरी करने के लिए डिज़ाइन किए गए हैं, जो सिमेंटिक खोज को सक्षम करते हैं।
- स्टैंडर्ड RAG: सबसे सरल, FAQ और सरल चैटबॉट्स के लिए उपयुक्त।
- हाइब्रिड RAG: वेक्टर और कीवर्ड खोज को जोड़ता है, एंटरप्राइज और ई-कॉमर्स सर्च के लिए बेहतर।
- मेमोरी के साथ RAG: बातचीत के इतिहास को बनाए रखता है, सपोर्ट असिस्टेंट्स के लिए उपयोगी।
- ग्राफ RAG: एंटिटीज़ के बीच संबंधों को मॉडल करने के लिए नॉलेज ग्राफ का उपयोग करता है, जटिल, इंटरकनेक्टेड डेटा के लिए उपयुक्त।
- एजेंटिक RAG: जटिल क्वेरी को हल करने के लिए मल्टी-स्टेप रिट्रीवल और टूल्स का उपयोग करता है।
- मल्टीमॉडल RAG: टेक्स्ट, इमेज, वीडियो और ऑडियो जैसे विभिन्न डेटा प्रकारों को प्रोसेस करता है।
- सेल्फ-रिफ्लेक्टिव RAG: प्रतिक्रियाओं को अंतिम रूप देने से पहले उनका विश्लेषण और सुधार करता है।
Key takeaways
- RAG AI मॉडल की सटीकता और प्रासंगिकता को बढ़ाने के लिए एक शक्तिशाली तकनीक है, जो LLMs की सीमाओं को दूर करती है।
- यह मॉडल को वास्तविक समय और बाहरी डेटा स्रोतों तक पहुंचने की अनुमति देकर काम करता है, जिससे 'ओपन बुक' क्षमता मिलती है।
- RAG के मुख्य लाभों में हेलुसिनेशन में कमी, अप-टू-डेट ज्ञान, लागत-प्रभावशीलता और बेहतर डेटा प्राइवेसी शामिल हैं।
- RAG पाइपलाइन में डेटा इंजेक्शन (डेटा तैयार करना) और रिट्रीवल (जानकारी खोजना) शामिल है, जिसके बाद ऑग्मेंटेशन और जनरेशन होता है।
- वेक्टर डेटाबेस सिमेंटिक खोज के लिए महत्वपूर्ण हैं, जो अर्थ के आधार पर जानकारी को पुनः प्राप्त करने में सक्षम बनाते हैं।
- विभिन्न RAG आर्किटेक्चर (जैसे हाइब्रिड, ग्राफ, एजेंटिक) विशिष्ट आवश्यकताओं और जटिलताओं को पूरा करने के लिए डिज़ाइन किए गए हैं।
- सही चंकिंग रणनीति, एंबेडिंग मॉडल और वेक्टर डेटाबेस का चुनाव RAG सिस्टम के प्रदर्शन के लिए महत्वपूर्ण है।
Key terms
Test your understanding
- RAG सामान्य LLMs की तुलना में हेलुसिनेशन को कैसे कम करता है?
- RAG पाइपलाइन में डेटा इंजेक्शन प्रक्रिया के मुख्य चरण क्या हैं?
- वेक्टर डेटाबेस सामान्य डेटाबेस से किस प्रकार भिन्न है और यह RAG के लिए क्यों महत्वपूर्ण है?
- हाइब्रिड RAG आर्किटेक्चर स्टैंडर्ड RAG से कैसे बेहतर है और किन उपयोग के मामलों के लिए यह उपयुक्त है?
- RAG सिस्टम में 'ऑग्मेंटेशन' चरण का क्या उद्देश्य है?