Vi presenterar en ny Coursera-kurs: Retrieval Augmented Generation (RAG) Du kommer att lära dig att bygga högpresterande, produktionsklara RAG-system i denna praktiska, djupgående kurs skapad av och undervisad av @ZainHasan6, erfaren AI- och ML-ingenjör, forskare och utbildare. RAG är en kritisk komponent idag i många LLM-baserade applikationer inom kundsupport, interna företagssystem för frågor och svar, till och med många av de ledande chatbotarna som använder webbsökning för att svara på dina frågor. I den här kursen lär du dig på djupet hur du får RAG att fungera bra. LLM:er kan producera generiska eller föråldrade svar, särskilt när de ställs specialiserade frågor som inte tas upp i dess träningsdata. RAG är den mest använda tekniken för att ta itu med detta. Den tar in data från nya datakällor, såsom interna dokument eller senaste nyheter, för att ge LLM relevant sammanhang till privat, ny eller specialiserad information. Detta gör att den kan generera mer jordnära och korrekta svar. I den här kursen lär du dig att designa och implementera varje del av ett RAG-system, från retrievers till vektordatabaser till generering till utvärderingar. Du kommer att lära dig om de grundläggande principerna bakom RAG och hur du optimerar den på både komponent- och systemnivå. I takt med att AI utvecklas, utvecklas även RAG. Nya modeller kan hantera längre kontextfönster, resonera mer effektivt och kan vara delar av komplexa agentiska arbetsflöden. Ett spännande tillväxtområde är Agentic RAG, där en AI-agent vid körning (i stället för att den är hårdkodad vid utvecklingstillfället) autonomt bestämmer vilken data som ska hämtas och när/hur den ska gå djupare. Även med denna utveckling är det viktigt att ha tillgång till data av hög kvalitet vid körning, vilket är anledningen till att RAG är en viktig del av så många applikationer. Du kommer att lära dig via praktiska erfarenheter att: - Bygga ett RAG-system med hämtning och snabb förstärkning - Jämför hämtningsmetoder som BM25, semantisk sökning och Reciprocal Rank Fusion - Segmentera, indexera och hämta dokument med hjälp av en Weaviate-vektordatabas och en nyhetsdatauppsättning - Utveckla en chattrobot, med hjälp av LLM:er med öppen källkod som drivs av Together AI, för en fiktiv butik som svarar på produkt- och FAQ-frågor - Använd evals för att förbättra tillförlitligheten och införliva multimodala data RAG är en viktig grundläggande teknik. Bli bra på det genom den här kursen! Anmäl dig här:
107,07K