Ankündigung eines neuen Coursera-Kurses: Retrieval Augmented Generation (RAG) Sie werden lernen, leistungsstarke, produktionsbereite RAG-Systeme in diesem praktischen, tiefgehenden Kurs zu erstellen, der von @ZainHasan6, einem erfahrenen KI- und ML-Ingenieur, Forscher und Pädagogen, erstellt und unterrichtet wird. RAG ist heute ein kritischer Bestandteil vieler LLM-basierter Anwendungen im Kundenservice, internen Unternehmens-Q&A-Systemen und sogar vieler führender Chatbots, die Websuche nutzen, um Ihre Fragen zu beantworten. Dieser Kurs lehrt Sie im Detail, wie Sie RAG effektiv einsetzen können. LLMs können generische oder veraltete Antworten produzieren, insbesondere wenn sie auf spezialisierte Fragen gestellt werden, die nicht in ihren Trainingsdaten abgedeckt sind. RAG ist die am weitesten verbreitete Technik zur Behebung dieses Problems. Es bezieht Daten aus neuen Datenquellen, wie internen Dokumenten oder aktuellen Nachrichten, um dem LLM den relevanten Kontext für private, aktuelle oder spezialisierte Informationen zu geben. Dadurch kann es fundiertere und genauere Antworten generieren. In diesem Kurs lernen Sie, jeden Teil eines RAG-Systems zu entwerfen und zu implementieren, von Retrievern über Vektordatenbanken bis hin zu Generierung und Auswertungen. Sie werden die grundlegenden Prinzipien hinter RAG kennenlernen und wie man es sowohl auf Komponenten- als auch auf Systemebene optimiert. Während sich KI weiterentwickelt, entwickelt sich auch RAG weiter. Neue Modelle können längere Kontextfenster verarbeiten, effektiver argumentieren und Teil komplexer agentischer Workflows sein. Ein spannendes Wachstumsfeld ist Agentic RAG, bei dem ein KI-Agent zur Laufzeit (anstatt dass es zur Entwicklungszeit fest codiert wird) autonom entscheidet, welche Daten abgerufen werden sollen und wann/wie tiefer eingetaucht werden soll. Selbst mit dieser Evolution ist der Zugang zu hochwertigen Daten zur Laufzeit entscheidend, weshalb RAG ein Schlüsselbestandteil so vieler Anwendungen ist. Sie werden durch praktische Erfahrungen lernen: - Ein RAG-System mit Retrieval- und Prompt-Augen zu erstellen - Retrieval-Methoden wie BM25, semantische Suche und Reciprocal Rank Fusion zu vergleichen - Dokumente mit einer Weaviate-Vektordatenbank und einem Nachrichten-Datensatz zu chunkieren, zu indizieren und abzurufen - Einen Chatbot zu entwickeln, der open-source LLMs nutzt, die von Together AI gehostet werden, für einen fiktiven Laden, der Produkt- und FAQ-Fragen beantwortet - Evals zu verwenden, um die Zuverlässigkeit zu verbessern und multimodale Daten zu integrieren RAG ist eine wichtige grundlegende Technik. Werden Sie darin gut durch diesen Kurs! Bitte melden Sie sich hier an:
107,08K