Oznámení nového kurzu Coursera: Retrieval Augmented Generation (RAG) Naučíte se vytvářet vysoce výkonné systémy RAG připravené k produkci v tomto praktickém hloubkovém kurzu, který vytvořil a vyučuje @ZainHasan6, zkušený inženýr, výzkumník a pedagog v oblasti AI a ML. RAG je dnes kritickou součástí mnoha aplikací založených na LLM v zákaznické podpoře, interních podnikových Q&A systémech, dokonce i mnoha předních chatbotů, které používají webové vyhledávání k zodpovězení vašich otázek. Tento kurz vás do hloubky naučí, jak zajistit, aby RAG dobře fungoval. LLM mohou produkovat obecné nebo zastaralé odpovědi, zejména když jsou jim kladeny specializované otázky, které nejsou zahrnuty v jejich tréninkových datech. RAG je nejpoužívanější technikou pro řešení tohoto problému. Přináší data z nových datových zdrojů, jako jsou interní dokumenty nebo nedávné zprávy, aby LLM poskytl relevantní kontext k soukromým, nedávným nebo specializovaným informacím. To mu umožňuje generovat uzemněnější a přesnější odpovědi. V tomto kurzu se naučíte navrhovat a implementovat každou část systému RAG, od retrieverů přes vektorové databáze až po generování evalů. Dozvíte se o základních principech RAG a o tom, jak jej optimalizovat na úrovni komponent i celého systému. Jak se vyvíjí umělá inteligence, vyvíjí se i RAG. Nové modely mohou zpracovávat delší kontextová okna, efektivněji uvažovat a mohou být součástí složitých agentických pracovních postupů. Jednou ze zajímavých oblastí růstu je Agentic RAG, ve kterém agent umělé inteligence za běhu (spíše než aby byl pevně zakódován v době vývoje) autonomně rozhoduje, jaká data získat a kdy/jak jít hlouběji. I přes tento vývoj je přístup k vysoce kvalitním datům za běhu nezbytný, což je důvod, proč je RAG klíčovou součástí tolika aplikací. Prostřednictvím praktických zkušeností se naučíte: - Vytvořte systém RAG s vyhledáváním a rychlým rozšiřováním - Porovnat metody vyhledávání, jako je BM25, sémantické vyhledávání a reciproční fúze hodností. - Blokování, indexování a načítání dokumentů pomocí vektorové databáze Weaviate a datové sady zpráv - Vyvíjejte chatbota pomocí open-source LLM hostovaných společností Together AI pro fiktivní obchod, který odpovídá na otázky týkající se produktů a často kladených otázek - Používat hodnocení ke zlepšení spolehlivosti a začlenit multimodální data RAG je důležitá základní technika. Staňte se v tom dobrými prostřednictvím tohoto kurzu! Zaregistrujte se prosím zde:
107,09K