Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Kunngjøring av et nytt Coursera-kurs: Gjenfinning av utvidet generasjon (RAG)
Du lærer å bygge høyytelses, produksjonsklare RAG-systemer i dette praktiske, dyptgående kurset laget av og undervist av @ZainHasan6, erfaren AI- og ML-ingeniør, forsker og lærer.
RAG er en kritisk komponent i dag i mange LLM-baserte applikasjoner i kundestøtte, interne selskapers Q&A-systemer, til og med mange av de ledende chatbotene som bruker nettsøk for å svare på spørsmålene dine. Dette kurset lærer deg i dybden hvordan du får RAG til å fungere godt.
LLM-er kan produsere generiske eller utdaterte svar, spesielt når de stilles spesialiserte spørsmål som ikke dekkes i treningsdataene. RAG er den mest brukte teknikken for å løse dette. Den henter inn data fra nye datakilder, for eksempel interne dokumenter eller nylige nyheter, for å gi LLM den relevante konteksten til privat, nylig eller spesialisert informasjon. Dette lar den generere mer jordede og nøyaktige svar.
I dette kurset lærer du å designe og implementere alle deler av et RAG-system, fra retrievere til vektordatabaser til generering til evals. Du vil lære om de grunnleggende prinsippene bak RAG og hvordan du optimaliserer det på både komponent- og hele systemnivå.
Etter hvert som AI utvikler seg, utvikler RAG seg også. Nye modeller kan håndtere lengre kontekstvinduer, resonnere mer effektivt og kan være deler av komplekse agentarbeidsflyter. Et spennende vekstområde er Agentic RAG, der en AI-agent under kjøring (i stedet for at den er hardkodet på utviklingstidspunktet) autonomt bestemmer hvilke data som skal hentes, og når/hvordan den skal gå dypere. Selv med denne utviklingen er tilgang til data av høy kvalitet under kjøring avgjørende, og det er grunnen til at RAG er en sentral del av så mange applikasjoner.
Du lærer via praktiske erfaringer å:
- Bygg et RAG-system med henting og rask forsterkning
- Sammenlign gjenfinningsmetoder som BM25, semantisk søk og Reciprocal Rank Fusion
- Chunk, indekser og hent dokumenter ved hjelp av en Weaviate-vektordatabase og et nyhetsdatasett
- Utvikle en chatbot ved hjelp av åpen kildekode LLM-er som driftes av Together AI, for en fiktiv butikk som svarer på produkt- og FAQ-spørsmål
- Bruk evalueringer for å forbedre påliteligheten og innlemme multimodale data
RAG er en viktig grunnleggende teknikk. Bli god på det gjennom dette kurset!
Vennligst registrer deg her:
107,09K
Topp
Rangering
Favoritter