esto siempre ha estado mal - pero ahora es categóricamente incorrecto en la era de RL en dominios verificables los modelos buscan la verdad e incluso interactúan con un mundo exterior duro a través del uso de herramientas
David Deutsch
David Deutsch4 ago, 16:23
Los LLMs están entrenados para imitar patrones de lenguaje, no para descubrir o verificar la verdad. Así que, cuando se les pide que hablen como expertos en un área donde los expertos percibidos tienen una concepción errónea generalizada, el LLM repetirá esa concepción errónea, adoptando el registro y el vocabulario de los expertos.
657,36K