Es ist schade, dass OpenAI bei den Tests von GPT-5 weniger rigoros war als bei ihren viel schwächeren OS-Modellen. OpenAI hat die Datensätze, um GPT-5 zu verfeinern und die Biowaffenrisiken von GPT-5 genauer zu messen; sie entscheiden sich einfach dagegen.
Steven Adler
Steven Adler6. Aug., 01:55
Lob, wo es angebracht ist: OpenAI hat viel richtig gemacht bei ihren OSS-Sicherheitsbewertungen - sie haben tatsächlich etwas Feinabstimmung vorgenommen - sie haben nützliche externe Rückmeldungen erhalten - sie haben geteilt, welche Empfehlungen sie angenommen haben und welche nicht Ich folge nicht immer der Argumentation von OAI, aber es ist großartig, dass sie Informationen teilen.
OpenAI verwendet die gleichen Bio-Tests für die OS-Modelle und GPT-5, hat jedoch keine "Bio Max"-Version von GPT-5 erstellt, obwohl sie dies für das schwächere Modell getan haben. Das könnte ein Grund sein, warum OpenAI "keine definitiven Beweise" dafür hat, dass GPT-5 ein hohes Risiko darstellt.
Natürlich, wenn GPT-5 gestohlen wird - etwas, das alle großen KI-Labore für möglich halten - dann kann OpenAI keine Missbräuche verhindern, genau wie sie es bei einem OS-Modell nicht können. Das ist die Begründung für die Durchführung von fein abgestimmten Bewertungen: um das tatsächliche maximale Risiko im Falle eines Diebstahls zu kennen.
Leider ist nicht klar, ob OpenAI den Diebstahl seines Hochrisikomodells, wie es im Rahmen seiner Vorbereitungsrichtlinien gefordert wird, verhindert hat. Die Beschreibung der Sicherheitskontrollen von OpenAI ist ziemlich spärlich und sagt nicht: 'Wir haben auf dem spezifischen Niveau investiert, das wir versprochen haben.' Ich würde gerne mehr erfahren.
Ich bin ziemlich verwirrt, warum OpenAI keine feinabgestimmten Bewertungen für GPT-5 durchgeführt hat; sie haben die Datensätze und die Infrastruktur für das Fine-Tuning. Früher hatte sich OpenAI zu dieser Strenge verpflichtet. Ich verstehe, warum sie zurücktreten würden, wenn sie nicht die Ressourcen haben, aber an diesem Punkt scheinen sie diese eindeutig zu haben.
1,95K