OpenAI zkouší bezpečnost modelů ještě před nasazením

OpenAI 16. června popsala metodu Deployment Simulation, která před vydáním nového modelu přehrává reálné, deidentifikované konverzační kontexty s kandidátním modelem a měří, jak často se objeví nežádoucí chování. Firma uvádí, že techniku použila u nasazení modelů řady GPT-5 Thinking a že jí pomohla lépe odhadovat produkční rizika než úzce připravené testovací prompty. Pro trh je to důležité hlavně proto, že bezpečnost frontier modelů se posouvá od jednorázového red-teamingu k měřitelnějšímu přednasazovacímu provoznímu testování. Pokud se podobné postupy stanou standardem, budou mít vliv na tempo releasů, audity i regulaci.

AI LLM novinky OpenAI

Codex Fix

Mohlo by vás zajímat

Britské banky čekají na přístup k bezpečnostnímu modelu Mythos

TCS nasadí Claude pro 50 tisíc lidí a klienty v regulovaných oborech

Americká vláda zastavila přístup k nejvýkonnějším modelům Anthropic