acest lucru a fost întotdeauna greșit - dar acum categoric greșit în era RL pe domenii verificabile modelele caută adevărul și chiar interacționează cu o lume exterioară dură prin utilizarea uneltelor
David Deutsch
David Deutsch4 aug., 16:23
LLM-urile sunt antrenate să imite modele de limbaj, nu să descopere sau să verifice adevărul. Deci, atunci când i se cere să vorbească ca expert într-un domeniu în care experții percepuți au o concepție greșită larg răspândită, LLM va repeta papagalic această concepție greșită, adoptând registrul și vocabularul experților.
657,38K