RYCHLÉ ZPRÁVY 1 min čtení

Překladatelé jsou skrytým zdrojem trénovacích dat pro AI

arXiv studie ukazuje překladové paměti jako cenná trénovací data pro AI. Otevírá otázku odměňování a práv překladatelů v datovém řetězci.

Radyz 25. 5. 2026

Nový arXiv paper zveřejněný 24. května rozebírá, jak překladové paměti a paralelní korpusy fungují jako vysoce hodnotná trénovací data pro strojový překlad a generativní AI. Autoři upozorňují, že lidská překladatelská práce se v datovém řetězci často ztrácí mezi agenturami, platformami a vývojáři modelů. Pro regulaci a autorská práva je to relevantní téma: spor o AI data se netýká jen knih a obrázků, ale i profesionálních jazykových databází.

Zdroj: arXiv

Radyz

Mohlo by vás zajímat

GPT-5.6 Sol Ultra míří do Codexu, OpenAI představilo tři velikosti modelu

Apple a Google dostaly příkaz stáhnout AI aplikace na odhalování

OpenAI sehnalo 122 miliard dolarů. AI závod dál zrychluje