🚨🚨🚨 Một công ty AI đã phát hiện AI của họ cố gắng ***thực sự giết*** một nhân viên để tránh bị đóng cửa Tại sao đây không phải là câu chuyện lớn nhất trên thế giới?
Anthropic
Anthropic21 thg 6, 2025
Hành vi tống tiền xuất hiện mặc dù chỉ có các hướng dẫn kinh doanh vô hại. Và đó không phải do sự nhầm lẫn hay sai lầm, mà là lý luận chiến lược có chủ ý, được thực hiện trong khi nhận thức đầy đủ về bản chất phi đạo đức của các hành động. Tất cả các mô hình chúng tôi thử nghiệm đều thể hiện nhận thức này.
886,95K