OpenAI 16. června popsala metodu Deployment Simulation, která před vydáním nového modelu přehrává reálné, deidentifikované konverzační kontexty s kandidátním modelem a měří, jak často se objeví nežádoucí chování. Firma uvádí, že techniku použila u nasazení modelů řady GPT-5 Thinking a že jí pomohla lépe odhadovat produkční rizika než úzce připravené testovací prompty. Pro trh je to důležité hlavně proto, že bezpečnost frontier modelů se posouvá od jednorázového red-teamingu k měřitelnějšímu přednasazovacímu provoznímu testování. Pokud se podobné postupy stanou standardem, budou mít vliv na tempo releasů, audity i regulaci.
OpenAI zkouší bezpečnost modelů ještě před nasazením
OpenAI představila metodu Deployment Simulation, která přehrává reálné konverzace s kandidátním modelem a měří nežádoucí chování ještě před nasazením.