World Action Models mají robotům pomoct předem simulovat, co se stane po jejich akci, místo aby jen mapovaly obraz z kamery na další pohyb. The Decoder popisuje nový přehled zhruba stovky prací, který dělí přístupy na kaskádové a společné architektury. Důležitý je hlavně datový posun: tyto modely mohou využívat běžná videa bez robotických akčních popisků, která byla pro tradiční robotické modely málo použitelná. Pokud se podaří vyřešit evaluaci a výpočetní náklady, může jít o praktický krok k robotům, kteří lépe odhadují důsledky vlastních pohybů.
World Action Models posouvají robotiku k plánování následků
World Action Models mají robotům pomoct předem simulovat, co se stane po jejich akci, místo aby jen mapovaly obraz z kamery na další pohyb.