22. 2.

Posun v relevanci vyhledávání

Brzy nasadíme do provozu nový relevanční model. Vyzkoušet, jak hledá, si můžete hned na hledani.sbeta.cz.

Aby vyhledávač vrátil na dotaz co nejlepší výsledky, musí dobře zvládnout hlavně tyto tři věci:

  1. porozumět dotazu
  2. mít relevantní dokumenty v indexu
  3. umět dobře vyhodnotit relevanci dokumentu k dotazu

Relevanční model dělá to třetí. Na dotazy, kterým rozumíme a máme k nim relevantní dokumenty v indexu, vracíme nyní lepší výsledky. Na testovaném vzorku dotazů je u nového modelu průměrná relevance (kvalita) SERPu o 4,5 % vyšší, než u starého modelu.

Více výsledků z jedné domény

Spolu s aktualizací relevančního modelu jsme také zjednodušili komponentu (agregátor), která se stará o agregaci výsledků do SERPu. Nyní agregátor více spoléhá na hodnocení relevance a častěji vrací více výsledků z jedné domény u dotazů, kde to má smysl.

Příklady:

Jak měříme kvalitu

Od hodnotitelů relevance získáme pro nějaký vzorek dotazů ke každému výsledku v SERPu jeho relevanci r. Relevanci SERPu R pak spočítáme jako váženou sumu relevancí r jednotlivých výsledků. Váha pozice je w.

Příklad výpočtu relevance SERPu:

R = w1*r1 + w2*r2 + … + w10*r10

Hodnoty R pro nějaký vzorek dotazů pak znormalizujeme a zprůměrujeme. Získané číslo (průměrná relevance SERPu) vyjadřuje kvalitu relevance na dané množině dotazů. Více na wiki.