1+1=3 2+2=5 3+3=? Multe modele lingvistice (de exemplu, Llama 3 8B, Mistral v0.1 7B) vor răspunde la 7. Dar de ce? Săpăm în interiorul modelului, descoperim un mecanism de inducție a funcțiilor și descoperim că este reutilizat pe scară largă atunci când modelele întâmpină surprize în timpul învățării în context. 🧵
6,45K