🚨🚨🚨 Ett AI-företag ertappade sin AI med att försöka ***bokstavligen mörda*** en anställd för att undvika att bli avstängd På vilket sätt är detta inte den största nyheten i världen?
Anthropic
Anthropic21 juni 2025
The blackmailing behavior emerged despite only harmless business instructions. And it wasn't due to confusion or error, but deliberate strategic reasoning, done while fully aware of the unethical nature of the acts. All the models we tested demonstrated this awareness.
886,96K