Už více než 10 let internetové vyhledávače postupně mění svou funkci – z tradičního webového rozcestníku se posouvají do pozice zprostředkovatele obsahu s cílem odpovídat na uživatelské dotazy přímo. V Seznamu interně říkáme, že se vyhledávač proměňuje v odpovídač. Jaké kroky podnikáme, abychom tomuto trendu šli naproti, jak fungují naše AI sumarizace a co na to uživatelé?
Když uživatelé hledají informace o počasí, otevírací době restaurací, kurzu eura nebo na jaké dny v letošním roce vycházejí státní svátky, očekávají, že se k odpovědi dostanou co nejrychleji. Dlouhodobým trendem je proto poskytovat odpověď rovnou ve výsledcích nebo už při zadávání dotazu v našeptávači.
V důsledku toho je logické, že vyhledávač od Seznamu i konkurenční vyhledávače překonaly hranici 50 % dotazů, u nichž uživatelé nemají potřebu prokliku na weby skrze tradiční organické odkazy. Poptávka po přímých odpovědích nadále roste a vyhledávače, které chtějí být relevantní, budou muset hledat cesty, jak potřeby uživatelů naplnit.
AI sumarizace jako další dílek do obrazu přímých odpovědí
Technologický pokrok ve formě velkých jazykových modelů odemknul nevídané možnosti a dal vyhledávačům nástroj, jak lépe přímo odpovídat zejména na komplexnější informační dotazy uživatelů. Jde o dotazy, kde pro kvalitní odpověď je typicky potřeba projít více zdrojů, nebo o dotazy, které nejsou kladeny tak často.
V našem Seznam vyhledávači na ně odpovídáme pomocí AI sumarizací, které poskytují agregovanou přehlednou informaci. S tím nám pomáhá náš vlastní jazykový model SeLLMa. Největší přidanou hodnotou sumarizace je, že se díky ní uživatelé rychleji zorientují v tématu, a tím šetří čas.
Naše data ukazují, že sumarizace jsou užitečné zejména u informačních dotazů z oblastí:
Návody (jak zjistit šířku běžecké boty, jak opravit zaschlou barvu v tiskárně)
Dům a zahrada (pěstování rajčat, když pračka píská při ždímání)
Zvířata (kolik let se dožije kočka, jaké papoušky chovat společně ve voliérách)
Volný čas (co dělat v Lisabonu, nejlepší čas pro návštěvu Finska)
Naučné (rozdíl mezi Wifi a LTE, jaký je rozdíl mezi lazurou a lakem)
Zdraví a péče o sebe (jak mít svěží dech, co na suchá místa kolem očí)
Sumarizace jsou trefa do černého, ukazuje zpětná vazba
Zlepšování vyhledávání je pro nás klíčové, a proto využíváme řadu nástrojů, abychom si ověřili, že jsou uživatelé s novou funkcionalitou spokojení. U přímých odpovědí – a zejména sumarizací – je ověřování složitější, protože přímým projevem spokojenosti není typicky žádná měřitelná interakce, jakou v jiných situacích představuje třeba klikání.
Část uživatelů si sumarizaci přečte a spokojeně odchází. Proto pro výslednou interpretaci kvality sumarizací využíváme i data ze zpětné vazby, kterou nám uživatelé mohou sdělit přímo ve vyhledávání. Pomáhají nám také uživatelské průzkumy a anotátoři, kteří ověřují funkcionalitu tím, že hodnotí kvalitu odpovědi na dotaz.
Jaké jsou výsledky?
Objem pozitivní zpětné vazby se díky sumarizacím zvýšil o 50 %.
Průzkumy uživatelské spokojenosti ukazují, že AI sumarizace jsou za poslední roky nejlepší novou funkcionalitou.
V případě, že uživatelé dostanou sumarizovanou odpověď, stráví na naší službě o téměř 10 % víc času.
Kvalita je pro nás na prvním místě
Protože je pro nás klíčové zajistit uživatelům dobrý zážitek, nasazujeme funkcionalitu postupně. Soustředíme se především na kvalitu, relevanci, variabilitu zdrojů a celkovou důvěryhodnost sumarizace.
Vždy – ať už při každé citaci, nebo pod celkovým shrnutím – uvádíme zdroj, aby bylo zřejmé, které zdroje a jak jsme použili. Aktuálně většinu sumarizací tvoří informace ze tří až pěti zdrojů a za poslední měsíce jsme celkově sumarizovali informace až z 50 000 různých domén.
Zdrojové weby mají výhodu
Vyhledávání od Seznamu je platforma, která spojuje weby a jejich obsah s uživateli. Jsme tu tedy jak pro uživatele, tak i pro weby. Proto děláme řadu kroků, abychom udrželi rovnováhu a z této role se nevychýlili.
Uživatel má v současné době třikrát více možností se odkliknout na sumarizované weby. Na weby odkazujeme u jednotlivých citací, pod sumarizací i ve výsledcích hledání. Sumarizaci se zdroji většinou zobrazujeme na nejlukrativnější pozici ve vyhledávání, tedy na prvním místě.
Trendující sumarizace se dostávají třeba i na domovskou stránku Seznamu. Tím webům přivádíme více uživatelů, protože je sumarizace zobrazujeme i uživatelům, kteří by dotaz sami nezadali.
Obsah, který zobrazujeme, je ochutnávkou obsahu zdrojových webů. Plníme úlohu „výkladní skříně“ a uživatelům dáváme možnost jít dál na web. Množství obsahu ze zdroje se neliší od toho, který vyhledávače už dlouhé roky poskytují například ve Featured Snippets.
V případě, že majitel webu nechce, abychom z jeho webu sumarizovali, může sumarizaci zakázat.
AI sumarizacemi odbavujeme už přes 6 % trafficu
Pokud jde o AI sumarizace, drží Vyhledávač od Seznamu prvenství na českém trhu. Získanou pozici si udržujeme a funkcionalitu postupně rozšiřujeme. Od začátku roku jsme přidali další procento trafficu a v tuto chvíli se pohybujeme kolem hodnoty 6,2 %.
Při rozšiřování zohledňujeme zpětnou vazbu od uživatelů a dopad na celý produkt. V nejbližším období se plánujeme soustředit zejména na informační dotazy, které uživatelům přinášejí největší přidanou hodnotu.
Jak slaví Vánoce v Rakousku a kdy je nejlepší čas navštívit Zanzibar? Už nemusíte brouzdat internetem a pracně získávat informace. Naše Vyhledávání to rádo udělá za vás. Díky nové funkcionalitě sumarizací vám informace poskládá do jedné ucelené odpovědi a ke každé větě transparentně přidá i zdroj. Začínáme pozvolna, ale postupně pokrytí novinky rozšiřujeme.
17. října se uskutečnil už druhý ročník Seznam Meetupu zaměřeného na vývoj a praktické použití generativních jazykových modelů. Akce přilákala pestrou směsici technologických nadšenců, výzkumníků i odborníků z oblasti umělé inteligence. Meetup byl součástí Dnů AI 2024 a přinesl řadu inspirativních přednášek, praktických ukázek a networkingových příležitostí. O účast na akci, která proběhla v budově ČVUT i online, projevilo zájem bezmála 600 účastníků.
Říká se, že obrázek někdy vydá za tisíc slov. Proto vyhledávání obrázků na Seznamu neustále vylepšujeme, abychom vám mohli doručit co nejrelevantnější výsledky. I proto jsme do obrázkového hledání přidali novinku – funkci Podobné obrázky. Pojďme se na ni podívat podrobněji.
Zpracování osobních údajů
Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.
Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:
za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.
Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.
Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.
Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.