Panelová diskuze: Jaká bude budoucnost s AI (nejen) v Seznamu?

11. října 2023

V rámci letošního Seznam fóra jsme poprvé vyzkoušeli formát panelové debaty, do které se zapojili čtyři zástupci Seznamu: Peter Jančárik, Pavel Kasík, Martin Kirschner a Jiří Špaček. Tématem diskuze byla umělá inteligence – její přednosti, slabiny i konkrétní využití (nejen) v Seznamu. Co zajímavého v rámci panelovky zaznělo?

Prvním tématem, kterému se panelisté věnovali, byla pravidla pro využívání AI v Seznamu, respektive v rámci Seznam Zpráv. Podle Pavla Kasíka společně s rozvojem jazykového modelu ChatGPT vznikla potřeba vytvořit etický kodex pro využívání nástroje v redakci. „Zároveň bylo třeba, aby taková pravidla byla veřejná. Jedině tak mohou čtenáři vědět, co od nás v tomto ohledu mohou čekat,“ uvedl Kasík s tím, že v této oblasti je bezpodmínečně nutné být směrem k publiku zcela transparentní.

Kde leží hranice využívání AI v Seznam Zprávách? To zjistíte v etickém kodexu.

Pravidla, která vznikla v rámci Seznam Zpráv, se později rozšířila i na další služby Seznamu. Netýkají se jen generování textů, ale i generování nebo úprav audiovizuálního obsahu. Neuronové sítě mohou redaktorům pomáhat s vytvářením opravdu působivých a atraktivních ilustračních obrázků, které často rozhodují o tom, jestli čtenář na daný článek klikne a přečte si ho, nebo ne.   

Vygenerované obrázky a koláže můžeme využívat k tomu, abychom ukázali, o čem text pojednává. Nikdy ale nesmíme ukazovat situace, které neexistují, a vydávat je za realitu. A pokud ilustrační obrázek vygenerujeme s pomocí AI, musíme to vždy uvést. Pro výsledek používáme zastřešující pojem AI vizualizace, který považujeme za nejvýstižnější.

Bude využití AI regulovat zákon?

Rozmach umělé inteligence je v posledních měsících tak intenzivní, že se začíná uvažovat i o tom, jestli by její využívání nemělo být vymezené zákonem. „V Evropském parlamentu aktuálně leží takzvaný AI Act, který prošel mnoha čteními a připomínkovacím procesem. I když zatím neznáme výsledek, můžeme očekávat, že případná pravidla dost omezí možnosti dalšího výzkumu, a tím se růst generativních modelů může zpomalit,“ uvedl Jiří Špaček.

Hacsiko není autonomní jednotka. Aktuálně to funguje tak, že editor do nástroje vloží URL článku a syntetický hlas z něj vyrobí rádiový vstup. Editor zkontroluje, jestli je vstup v pořádku, a případně ho upraví. Celý proces bychom dnes zvládli i bez zásahu člověka, ale s ohledem na etický kodex to neděláme, protože chceme, aby výstup vždy někdo z kolegů zkontroloval.  

Právě on se společně s moderátorkou konference Bárou Hacsi podílel na vývoji Hacsiko, syntetické moderátorky rádia Expres FM, která v nočním vysílání mluví Bářiným hlasem. A dokonce se jí i podobá – tvář Hacsiko totiž vytvořil nástroj Midjourney na základě Bářiných fotek. I využití Hacsiko má svá pravidla: syntetický hlas se smí objevovat výhradně ve vysílání rádia Expres FM a posluchač vždy musí být informován, jestli právě poslouchá „živou“ moderátorku, nebo hlas vygenerovaný umělou inteligencí.

Jazykové modely vznikají i v Seznamu

Martin Kirschner mluvil o tom, jak v Seznamu – například v rámci Vyhledávání – využíváme vlastní jazykové modely. Prozradil také, že se v Seznamu intenzivně pracuje na vývoji jejich pokročilejších nástupců. Jejich úkolem bude mimo jiné zrychlit práci s vyhledávačem.

Generativní modely, na kterých aktuálně pracujeme, budou řádově pracovat s desítkami miliard parametrů. Zároveň se soustředíme na to, aby dobře fungovaly v češtině. Poté je chceme využívat napříč službami Seznamu. Věříme totiž, že mít svůj vlastní jazykový model, abychom nemuseli využívat produkty třetích stran, má spoustu výhod.

Pro zahraniční jazykové modely čeština nebyla prioritou, což se někdy odráží ve výsledku. Vytváření textu proto může být pomalejší, případně se v něm objevují zbytečné chyby, které pramení z nedokonalé znalosti jazyka. A podle Martina by generativní model od Seznamu měl být – díky tomu, že se „učí“ primárně na češtině – v tomto ohledu spolehlivější.  

AI dokáže hravě odhalit „líné“ autory

Peter Jančárik, který se v Seznamu věnuje oblasti brand safety a boji s dezinformacemi, hostům ukázal, jak v rámci Seznam Médium pomocí AI určujeme, do jaké míry konkrétní texty vytvářel člověk a do jaké míry některý z generativních modelů. Úkolem editorů Seznam Médium je pak hlídat, aby se na blogovací platformě objevovalo co nejvíce originálních textů, které píšou skuteční lidé.

Platí, že čím delší text do našeho interního rozpoznávacího nástroje vložíme, tím přesnější výsledek dostáváme. Pokud pracujeme jen s krátkým úryvkem, jazykový model si není jistý, a tím může dojít ke zkreslení.    

Sdílet na sítích