Nový update relevance Vyhledávání zajistí lepší pořadí výsledků

1. listopadu 2021

Ve středu 13. 10. jsme nasadili dlouho připravovanou změnu ve vyhodnocování relevance. Jedná se o několik úprav, které by dohromady měly zlepšit pořadí výsledků na některé dotazy a zároveň umožnit efektivnější rozvoj hledání do budoucna.

Lidé, kteří zadávají dotazy do Vyhledávání, mají vždy nějaký konkrétní záměr. Těch nejčastějších jsou jednotky a patří sem: přejít na nějaký web, získat zboží, najít firmu nebo dozvědět se více informací o nějaké entitě (třeba na Wikipedii). Dotazy s těmito záměry tvoří více než dvě třetiny trafficu ve Vyhledávání. Zbytek pak tvoří long tail. Velmi specifické záměry reprezentované málo častými dotazy, kdy lidé často potřebují s něčím poradit, něco doporučit nebo třeba získat konkrétní postup.

Posbírali jsme hodně dat a analyzovali jsme, jaké záměry existují, a na jejich základě vytvořili klasifikátor. Získaná informace o pravděpodobném záměru uživatele se nyní používá jako jeden z přibližně 250 faktorů při vyhodnocování relevance dokumentu k dotazu. Tato informace je důležitá, protože pomáhá modelu relevance v podobě rozhodovacích stromů. Na začátku vyhodnocování dokumentu určuje, kterou větví stromu daný dokument půjde a jaké faktory o jeho relevanci rozhodnou. O pořadí výsledků na informační dotazy by tak měly rozhodovat jiné faktory než o pořadí výsledků na nákupní dotazy.

Pro různé záměry máme různé modely relevance. Jejich výsledky se míchají dohromady. Rozdělení problému podle záměrů nám umožňuje rozvíjet hledání paralelně a více se soustředit právě na long tail, kde dává smysl použít vektorový přístup.

Nový update by měl vylepšit pozice především u e-shopů a nákupních webů. K menším změnám docházelo během října.

Sdílet na sítích