Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sangat mengecewakan bahwa OpenAI kurang ketat dengan pengujian GPT-5 mereka daripada model OS mereka yang jauh lebih lemah.
OpenAI memiliki kumpulan data yang tersedia untuk menyempurnakan GPT-5 dan mengukur risiko senjata hayati GPT-5 dengan lebih akurat; mereka hanya memilih untuk tidak melakukannya.


6 Agu, 01.55
Kredit di mana harus diterima:
OpenAl melakukan banyak hal yang benar untuk eval keamanan OSS mereka
- mereka benar-benar melakukan penyempurnaan
- mereka mendapat umpan balik eksternal yang berguna
- mereka membagikan rekaman mana yang mereka adopsi dan mana yang tidak mereka adopsi
Saya tidak selalu mengikuti alasan OAI, tetapi sangat bagus mereka berbagi info


OpenAI menggunakan bio-test yang sama untuk model OS dan GPT-5, tetapi tidak membuat versi "bio max" dari GPT-5, meskipun mereka melakukannya untuk model yang lebih lemah.
Ini mungkin salah satu alasan mengapa OpenAI "tidak memiliki bukti pasti" tentang GPT-5 berisiko tinggi.


Tentu saja, jika GPT-5 dicuri - sesuatu yang diyakini oleh laboratorium AI utama mungkin - maka OpenAI tidak dapat menghentikan penyalahgunaan apa pun, sama seperti tidak dapat dilakukan untuk model OS.
Ini adalah alasan untuk menjalankan evaluasi yang disesuaikan: untuk mengetahui risiko maksimum aktual jika dicuri.

Sayangnya, tidak jelas OpenAI telah mencegah pencurian model berisiko tingginya, seperti yang disyaratkan oleh Kerangka Kesiapsiagaan.
Tulisan OpenAI tentang kontrol keamanan cukup jarang dan tidak mengatakan 'kami telah berinvestasi pada tingkat tertentu yang kami janjikan.' Saya ingin tahu lebih banyak.



Saya cukup bingung mengapa OpenAI tidak menjalankan eval yang disesuaikan untuk GPT-5; mereka memiliki kumpulan data dan infra penyempurnaan.
Suatu kali, OpenAI telah berkomitmen pada ketelitian ini. Saya mengerti mengapa mereka akan mengingkari jika mereka tidak memiliki sumber daya, tetapi pada titik ini, mereka jelas tampaknya memilikinya.

1,95K
Teratas
Peringkat
Favorit