Dynamická míchačka SERPů: Jak skládáme výsledky hledání?

23. srpna 2023

Díky tomu, že žijeme v 21. století, se jedním z nejlepších zdrojů odpovědí na naše otázky stal internetový vyhledávač. Ať už hledáme e-shop, otevírací dobu pošty, recept na večeři nebo novinky ze světa, vyhledávače nám naservírují obrovské množství informací na jedno kliknutí. Ale co vlastně očekáváme, když zadáme dotaz do vyhledávacího pole?

Lidé mohou mít různé představy o tom, jaké výsledky chtějí získat. Pro některé může být vyhledávání prostředkem k nalezení zdrojů pro hlubší výzkumy, jiní se snaží najít seznam firem nabízejících určitou službu, další chtějí ve výsledcích vidět e-shopy, kde by si koupili to, co potřebují, nebo se přes vyhledávač dostat na konkrétní stránku.

Seznamácký vyhledávač je navržen tak, aby co nejlépe vyhovoval široké škále potřeb uživatelů. Proto musí být vyhledávací algoritmy schopné interpretovat různé typy dotazů a nabídnout relevantní výsledky. Tyto algoritmy zohledňují mnoho faktorů, jako jsou relevance obsahu, popularita webových stránek, a dokonce i geografické umístění.

V dnešní době Vyhledávání na Seznamu využívá pokročilé strojové učení a umělou inteligenci prostřednictvím modelů strojového učení nazývaných „streamy“. Jako součást procesu sestavování výsledné stránky vyhledávače (SERP) vstupují streamy do „míchačky“. Míchačku si můžeme představit jako algoritmus, který je zodpovědný za sestavení SERPu z různých streamů tak, aby nejlépe odpovídal uživatelskému záměru, tedy tomu, co si uživatel při vyhledávání přeje najít.

Uživatelský záměr se odkazuje na úmysl nebo požadavek, který má uživatel při zadávání dotazu do vyhledávacího nástroje. Je to specifický cíl, informace nebo akce, kterou uživatel očekává, že mu vyhledávač poskytne prostřednictvím výsledků vyhledávání.

Uživatelské záměry ve Vyhledávání můžeme shrnout do čtyř hlavních kategorií:

1. Získat informace

  • Nadčasové informace: Uživatel hledá všeobecné informace o určitém tématu, entitě nebo jevu, které nevyžadují aktuálnost, například historické události, vědecká fakta, teorie atd.
  • Aktuální informace: Uživatel potřebuje aktuální informace, jako jsou výsledky sportovních zápasů, program kulturních akcí, aktuální kurzy měn, počasí, aktuální slevové nabídky, otevírací doby obchodů apod.

2. Získat zboží

  • Koupit nebo prodat: Uživatel plánuje obchodní transakci, jako je koupě, prodej nebo výměna zboží nebo služeb. Hledá konkrétní produkty, ceny, srovnání nabídek, bazarové inzeráty, slevové akce apod.

3. Najít firmu

  • Konkrétní firma nebo služba: Uživatel hledá konkrétní firmu, instituci nebo webovou službu. Může se jednat o vyhledávání podle názvu firmy, oboru činnosti, konkrétní služby, recenzí, kontaktů, adresy, navigace, fotografií apod.

4. Přejít na konkrétní stránku

  • Uživatel chce přejít na konkrétní stránku. Má jasnou představu o stránce, na kterou chce přejít, i když nezná nutně URL. Například ví, že chce stránku konkrétního prodejce, firmy, úřadu, konkrétní online služby, dokumentu z konkrétní domény apod. Uživateli není jedno, na kterém webu získá informace.

Nový SERP mícháme na míru každému dotazu

Streamové složení a zastoupení streamů v SERPech, které připravila starší míchačka, bylo pro všechny dotazy se stejným uživatelským záměrem téměř identické. Pokud byl uživatelský záměr vyhodnocen jako „Najít firmu“, výsledky v SERPu byly sestaveny z výsledků poskytovaných firemním a informačním streamem. U uživatelského záměru „Získat zboží“ výsledky pocházely od zbožového srovnávače a informačního streamu. Jak se ale vypořádat s dotazy, které mají více než jeden potenciální záměr?

Nová dynamická míchačka, která nově míchá organické výsledky v našem Vyhledávání, je založená na pravděpodobnostech všech možných uživatelských záměrů, díky čemuž může uživateli namíchat SERP přímo na míru podle konkrétního dotazu.

Poté, co uživatel do Vyhledávání zadá dotaz, analyzujeme ho, abychom mimo jiné vypočítali pravděpodobnosti jednotlivých uživatelských záměrů. Tyto pravděpodobnosti poté použijeme jako vstupní parametry do vzorce d’Hondtovy metody.

Pomáhá nám metoda, kterou známe z politiky

Co je to d’Hondtova metoda? Tato metoda se v České republice používá například při výpočtu rozdělení mandátů v zastupitelstvech obcí a krajů, ale také při volbách do Evropského parlamentu a do roku 2017 i při volbách do Poslanecké sněmovny.

Před přidělením každého mandátu se porovnávají d’Hondtova skóre každé strany a mandát získá strana s nejvyšším skóre. Jednotlivá d’Hondtova skóre (N) se vypočítají jako podíl získaného počtu hlasů (V) a počtu již získaných mandátů (s) zvýšených o jedna.

I když tato metoda byla původně vyvinuta pro rozdělování mandátů v politických volbách, v našem případě byla adaptována na výběr a pořadí výsledků z různých streamů na základě vypočítané pravděpodobností uživatelských záměrů. Streamy s vyššími pravděpodobnostmi jsou v SERPu zastoupeny více, čímž se zajišťuje, že výsledky budou co nejvíce odpovídat potřebám uživatele.

Ve Vyhledávání neustále pracujeme na tom, abychom zajistili, že výsledky, které se dostanou k uživatelům našeho vyhledávače, budou co nejlepší a nejpřesnější. Kromě hledání způsobů, jak zlepšit kvalitu našich modelů strojového učení, se zaměřujeme i na přesnější detekci uživatelského záměru a ladění míchačky, která poskytne uživateli výsledný SERP.

Za tým Vyhledávání Anna Hrešková

Sdílet na sítích