Annonce d'un nouveau cours sur Coursera : Génération Augmentée par Récupération (RAG) Vous apprendrez à construire des systèmes RAG performants et prêts pour la production dans ce cours pratique et approfondi créé et enseigné par @ZainHasan6, ingénieur en IA et ML expérimenté, chercheur et éducateur. Le RAG est un composant essentiel aujourd'hui de nombreuses applications basées sur des LLM dans le support client, les systèmes de questions-réponses internes des entreprises, et même de nombreux chatbots leaders qui utilisent la recherche sur le web pour répondre à vos questions. Ce cours vous enseigne en profondeur comment faire fonctionner le RAG efficacement. Les LLM peuvent produire des réponses génériques ou obsolètes, surtout lorsqu'on leur pose des questions spécialisées qui ne sont pas couvertes par leurs données d'entraînement. Le RAG est la technique la plus largement utilisée pour y remédier. Il intègre des données provenant de nouvelles sources, telles que des documents internes ou des actualités récentes, pour donner au LLM le contexte pertinent pour des informations privées, récentes ou spécialisées. Cela lui permet de générer des réponses plus concrètes et précises. Dans ce cours, vous apprendrez à concevoir et à mettre en œuvre chaque partie d'un système RAG, des récupérateurs aux bases de données vectorielles, en passant par la génération et les évaluations. Vous découvrirez les principes fondamentaux derrière le RAG et comment l'optimiser à la fois au niveau des composants et du système dans son ensemble. À mesure que l'IA évolue, le RAG évolue aussi. De nouveaux modèles peuvent gérer des fenêtres de contexte plus longues, raisonner plus efficacement et faire partie de flux de travail agentiques complexes. Un domaine de croissance passionnant est le RAG Agentique, dans lequel un agent IA, en temps réel (plutôt que d'être codé en dur au moment du développement), décide de manière autonome quelles données récupérer, et quand/comment approfondir. Même avec cette évolution, l'accès à des données de haute qualité en temps réel est essentiel, c'est pourquoi le RAG est une partie clé de tant d'applications. Vous apprendrez par des expériences pratiques à : - Construire un système RAG avec récupération et augmentation de prompt - Comparer des méthodes de récupération comme BM25, recherche sémantique et Fusion de Rang Réciproque - Découper, indexer et récupérer des documents en utilisant une base de données vectorielle Weaviate et un ensemble de données d'actualités - Développer un chatbot, en utilisant des LLM open-source hébergés par Together AI, pour un magasin fictif qui répond aux questions sur les produits et les FAQ - Utiliser des évaluations pour améliorer la fiabilité et incorporer des données multimodales Le RAG est une technique fondamentale importante. Devenez compétent grâce à ce cours ! Veuillez vous inscrire ici :
107,07K