Anunciando um novo curso do Coursera: Retrieval Augmented Generation (RAG) Você aprenderá a construir sistemas RAG de alto desempenho e prontos para produção neste curso prático e aprofundado criado e ministrado por @ZainHasan6, experiente engenheiro, pesquisador e educador de IA e ML. O RAG é um componente crítico hoje de muitos aplicativos baseados em LLM no suporte ao cliente, sistemas internos de perguntas e respostas da empresa e até mesmo muitos dos principais chatbots que usam pesquisa na web para responder às suas perguntas. Este curso ensina em profundidade como fazer o RAG funcionar bem. Os LLMs podem produzir respostas genéricas ou desatualizadas, especialmente quando feitas perguntas especializadas não abordadas em seus dados de treinamento. RAG é a técnica mais amplamente usada para lidar com isso. Ele traz dados de novas fontes de dados, como documentos internos ou notícias recentes, para dar ao LLM o contexto relevante para informações privadas, recentes ou especializadas. Isso permite gerar respostas mais fundamentadas e precisas. Neste curso, você aprenderá a projetar e implementar todas as partes de um sistema RAG, de retrievers a bancos de dados vetoriais, geração e avaliações. Você aprenderá sobre os princípios fundamentais por trás do RAG e como otimizá-lo nos níveis do componente e de todo o sistema. À medida que a IA evolui, o RAG também está evoluindo. Novos modelos podem lidar com janelas de contexto mais longas, raciocinar com mais eficiência e podem fazer parte de fluxos de trabalho agenciais complexos. Uma área de crescimento empolgante é o Agentic RAG, no qual um agente de IA em tempo de execução (em vez de ser codificado no momento do desenvolvimento) decide de forma autônoma quais dados recuperar e quando/como se aprofundar. Mesmo com essa evolução, o acesso a dados de alta qualidade em tempo de execução é essencial, e é por isso que o RAG é uma parte fundamental de tantas aplicações. Você aprenderá por meio de experiências práticas a: - Construir um sistema RAG com recuperação e aumento imediato - Compare métodos de recuperação como BM25, pesquisa semântica e fusão de classificação recíproca - Fragmente, indexe e recupere documentos usando um banco de dados vetorial Weaviate e um conjunto de dados de notícias - Desenvolva um chatbot, usando LLMs de código aberto hospedados pela Together AI, para uma loja fictícia que responda a perguntas sobre produtos e perguntas frequentes - Use avaliações para melhorar a confiabilidade e incorporar dados multimodais RAG é uma técnica fundamental importante. Torne-se bom nisso através deste curso! Por favor, inscreva-se aqui:
107,1K