Annuncio di un nuovo corso su Coursera: Generazione Aumentata da Recupero (RAG) Imparerai a costruire sistemi RAG ad alte prestazioni e pronti per la produzione in questo corso pratico e approfondito creato e insegnato da @ZainHasan6, ingegnere esperto in AI e ML, ricercatore ed educatore. RAG è un componente critico oggi di molte applicazioni basate su LLM nel supporto clienti, nei sistemi di domande e risposte interni delle aziende, e persino in molti dei principali chatbot che utilizzano la ricerca web per rispondere alle tue domande. Questo corso ti insegnerà in dettaglio come far funzionare bene RAG. Gli LLM possono produrre risposte generiche o obsolete, specialmente quando vengono poste domande specializzate non coperte nei dati di addestramento. RAG è la tecnica più ampiamente utilizzata per affrontare questo problema. Porta dati da nuove fonti, come documenti interni o notizie recenti, per fornire all'LLM il contesto rilevante per informazioni private, recenti o specializzate. Questo gli consente di generare risposte più concrete e accurate. In questo corso, imparerai a progettare e implementare ogni parte di un sistema RAG, dai recuperatori ai database vettoriali, dalla generazione alle valutazioni. Imparerai i principi fondamentali dietro RAG e come ottimizzarlo sia a livello di componente che a livello di sistema completo. Con l'evoluzione dell'AI, anche RAG sta evolvendo. Nuovi modelli possono gestire finestre di contesto più lunghe, ragionare in modo più efficace e possono far parte di flussi di lavoro agentici complessi. Un'area di crescita entusiasmante è RAG Agentico, in cui un agente AI in tempo reale (anziché essere codificato a tempo di sviluppo) decide autonomamente quali dati recuperare e quando/come approfondire. Anche con questa evoluzione, l'accesso a dati di alta qualità in tempo reale è essenziale, motivo per cui RAG è una parte chiave di così tante applicazioni. Imparerai attraverso esperienze pratiche a: - Costruire un sistema RAG con recupero e aumento del prompt - Confrontare metodi di recupero come BM25, ricerca semantica e Fusione di Rango Reciproco - Suddividere, indicizzare e recuperare documenti utilizzando un database vettoriale Weaviate e un dataset di notizie - Sviluppare un chatbot, utilizzando LLM open-source ospitati da Together AI, per un negozio fittizio che risponde a domande sui prodotti e FAQ - Utilizzare valutazioni per migliorare l'affidabilità e incorporare dati multimodali RAG è una tecnica fondamentale importante. Diventa esperto in questo attraverso questo corso! Iscriviti qui:
107,09K