Pár dalších signálů do relevance

25. listopadu 2016

Ve středu 23. listopadu jsme do vyhledávání přidali nové signály. Výsledky přirozeného vyhledávání se měnily větší měrou, než je obvyklé. Ačkoli je pro nás změna relevančních modelů relativně rutinní věc, kvůli přidání signálů se nyní dá mluvit o středně významné změně. Před koncem letošního roku už další modely relevance přirozených výsledků nasazovat nebudeme.

Přidali jsme patnáct signálů dokumentu. Některé komplexnější, jiné jednoduché. Abych uvedl příklad, jedním z přidaných signálů je jednoduchá entropie textu stránky. Nedá se říct, že by stránky s vyšší entropií od nynějška získávaly více bodů než stránky s nižší entropií, nebo naopak. Nové signály vstupují společně s ostatními do relativně složitého relevančního modelu (konkrétně do součtu mnoha rozhodovacích stromů) a model je používá spíše jako pomůcku pro rozhodování a větvení, než že by podle nich přímo řadil. Stránkám s vyšší entropií prostě v některých případech počítá relevanci jiná větev výpočtu než stránkám s nižší entropií. Podobně to funguje i s ostatními čtrnácti novými signály – obvykle nemají jednoznačnou intepretaci. I tak ale modelu pomáhají lépe řadit.

Přidání signálů jsme předem testovali na vzorku 9200 dotazů. Na první stránce SERPu (deset výsledků) se změna projevila záměnou aspoň jednoho výsledku v 79 % dotazů. U změněných SERPů šlo v 73 % vyhledávání o měřitelné zlepšení, proto jsme se rozhodli to nasadit ještě teď v listopadu, přestože víme, že provozovatelé stránek jsou raději, když se vyhledávání před koncem roku moc nemění.

Sdílet na sítích