Google ve stejný den spustil v Gemini API dva nové režimy: Flex a Priority. Flex podle dokumentace nabízí asi 50% úsporu ceny oproti standardnímu režimu, ale výměnou za pomalejší a méně stabilní odezvu. Priority je naopak placený režim pro kritické nasazení, kde je důležitá co nejnižší latence a vyšší spolehlivost.

Tohle není zpráva pro běžné uživatele chatu, ale pro firmy a vývojáře je dost podstatná. Právě tady se často rozhoduje, jestli bude AI nasazení ekonomicky fungovat i ve větším měřítku.

Proč je to důležité: AI už dnes není jen o tom, co model umí, ale i kolik stojí jeho provoz. Google tím dává firmám víc možností, jak balancovat cenu, rychlost a spolehlivost.