esto siempre ha sido incorrecto, pero ahora categóricamente incorrecto en la era de RL en dominios verificables Los modelos buscan la verdad e incluso interactúan con un mundo exterior difícil mediante el uso de herramientas
David Deutsch
David Deutsch4 ago, 16:23
Los LLMs están entrenados para imitar patrones de lenguaje, no para descubrir o verificar la verdad. Así que, cuando se les pide que hablen como expertos en un área donde los expertos percibidos tienen una concepción errónea generalizada, el LLM repetirá esa concepción errónea, adoptando el registro y el vocabulario de los expertos.
658.26K