Když se vyhledávač mění v odpovídač. Jak fungují AI sumarizace?

Už více než 10 let internetové vyhledávače postupně mění svou funkci – z tradičního webového rozcestníku se posouvají do pozice zprostředkovatele obsahu s cílem odpovídat na uživatelské dotazy přímo. V Seznamu interně říkáme, že se vyhledávač proměňuje v odpovídač. Jaké kroky podnikáme, abychom tomuto trendu šli naproti, jak fungují naše AI sumarizace a co na to uživatelé?

Když uživatelé hledají informace o počasí, otevírací době restaurací, kurzu eura nebo na jaké dny v letošním roce vycházejí státní svátky, očekávají, že se k odpovědi dostanou co nejrychleji. Dlouhodobým trendem je proto poskytovat odpověď rovnou ve výsledcích nebo už při zadávání dotazu v našeptávači.

V důsledku toho je logické, že vyhledávač od Seznamu i konkurenční vyhledávače překonaly hranici 50 % dotazů, u nichž uživatelé nemají potřebu prokliku na weby skrze tradiční organické odkazy. Poptávka po přímých odpovědích nadále roste a vyhledávače, které chtějí být relevantní, budou muset hledat cesty, jak potřeby uživatelů naplnit.

AI sumarizace jako další dílek do obrazu přímých odpovědí

Technologický pokrok ve formě velkých jazykových modelů odemknul nevídané možnosti a dal vyhledávačům nástroj, jak lépe přímo odpovídat zejména na komplexnější informační dotazy uživatelů. Jde o dotazy, kde pro kvalitní odpověď je typicky potřeba projít více zdrojů, nebo o dotazy, které nejsou kladeny tak často.

Zaujaly vás AI sumarizace? Ještě více o nich zjistíte v článku Petry Kubernátové.

V našem Seznam vyhledávači na ně odpovídáme pomocí AI sumarizací, které poskytují agregovanou přehlednou informaci. S tím nám pomáhá náš vlastní jazykový model SeLLMa. Největší přidanou hodnotou sumarizace je, že se díky ní uživatelé rychleji zorientují v tématu, a tím šetří čas.

Naše data ukazují, že sumarizace jsou užitečné zejména u informačních dotazů z oblastí:

  • Návody (jak zjistit šířku běžecké boty, jak opravit zaschlou barvu v tiskárně)
  • Dům a zahrada (pěstování rajčat, když pračka píská při ždímání)
  • Zvířata (kolik let se dožije kočka, jaké papoušky chovat společně ve voliérách)
  • Volný čas (co dělat v Lisabonu, nejlepší čas pro návštěvu Finska)
  • Naučné (rozdíl mezi Wifi a LTE, jaký je rozdíl mezi lazurou a lakem)
  • Zdraví a péče o sebe (jak mít svěží dech, co na suchá místa kolem očí)

Sumarizace jsou trefa do černého, ukazuje zpětná vazba

Zlepšování vyhledávání je pro nás klíčové, a proto využíváme řadu nástrojů, abychom si ověřili, že jsou uživatelé s novou funkcionalitou spokojení. U přímých odpovědí – a zejména sumarizací – je ověřování složitější, protože přímým projevem spokojenosti není typicky žádná měřitelná interakce, jakou v jiných situacích představuje třeba klikání.

Část uživatelů si sumarizaci přečte a spokojeně odchází. Proto pro výslednou interpretaci kvality sumarizací využíváme i data ze zpětné vazby, kterou nám uživatelé mohou sdělit přímo ve vyhledávání. Pomáhají nám také uživatelské průzkumy a anotátoři, kteří ověřují funkcionalitu tím, že hodnotí kvalitu odpovědi na dotaz.

Jaké jsou výsledky?

  • Objem pozitivní zpětné vazby se díky sumarizacím zvýšil o 50 %.
  • Průzkumy uživatelské spokojenosti ukazují, že AI sumarizace jsou za poslední roky nejlepší novou funkcionalitou.
  • V případě, že uživatelé dostanou sumarizovanou odpověď, stráví na naší službě o téměř 10 % víc času.

Kvalita je pro nás na prvním místě

Protože je pro nás klíčové zajistit uživatelům dobrý zážitek, nasazujeme funkcionalitu postupně. Soustředíme se především na kvalitu, relevanci, variabilitu zdrojů a celkovou důvěryhodnost sumarizace.

Vždy – ať už při každé citaci, nebo pod celkovým shrnutím – uvádíme zdroj, aby bylo zřejmé, které zdroje a jak jsme použili. Aktuálně většinu sumarizací tvoří informace ze tří až pěti zdrojů a za poslední měsíce jsme celkově sumarizovali informace až z 50 000 různých domén.

Zdrojové weby mají výhodu

Vyhledávání od Seznamu je platforma, která spojuje weby a jejich obsah s uživateli. Jsme tu tedy jak pro uživatele, tak i pro weby. Proto děláme řadu kroků, abychom udrželi rovnováhu a z této role se nevychýlili.

Uživatel má v současné době třikrát více možností se odkliknout na sumarizované weby. Na weby odkazujeme u jednotlivých citací, pod sumarizací i ve výsledcích hledání.
Sumarizaci se zdroji většinou zobrazujeme na nejlukrativnější pozici ve vyhledávání, tedy na prvním místě.

Trendující sumarizace se dostávají třeba i na domovskou stránku Seznamu. Tím webům přivádíme více uživatelů, protože je sumarizace zobrazujeme i uživatelům, kteří by dotaz sami nezadali.

Obsah, který zobrazujeme, je ochutnávkou obsahu zdrojových webů. Plníme úlohu „výkladní skříně“ a uživatelům dáváme možnost jít dál na web. Množství obsahu ze zdroje se neliší od toho, který vyhledávače už dlouhé roky poskytují například ve Featured Snippets.

V případě, že majitel webu nechce, abychom z jeho webu sumarizovali, může sumarizaci zakázat.

AI sumarizacemi odbavujeme už přes 6 % trafficu

Pokud jde o AI sumarizace, drží Vyhledávač od Seznamu prvenství na českém trhu. Získanou pozici si udržujeme a funkcionalitu postupně rozšiřujeme. Od začátku roku jsme přidali další procento trafficu a v tuto chvíli se pohybujeme kolem hodnoty 6,2 %.

Při rozšiřování zohledňujeme zpětnou vazbu od uživatelů a dopad na celý produkt. V nejbližším období se plánujeme soustředit zejména na informační dotazy, které uživatelům přinášejí největší přidanou hodnotu.

Za tým Vyhledávání Peter Pekarovič
 

Sdílet na sítích