🚨🚨🚨 Компания, занимающаяся искусственным интеллектом, поймала своего ИИ на попытке ***буквально убить*** сотрудника, чтобы избежать закрытия Как это не самая большая новость в мире?
Anthropic
Anthropic21 июн. 2025 г.
The blackmailing behavior emerged despite only harmless business instructions. And it wasn't due to confusion or error, but deliberate strategic reasoning, done while fully aware of the unethical nature of the acts. All the models we tested demonstrated this awareness.
886,95K