Brzy nasadíme do provozu nový relevanční model. Vyzkoušet, jak hledá, si můžete hned na hledani.sbeta.cz.
Aby vyhledávač vrátil na dotaz co nejlepší výsledky, musí dobře zvládnout hlavně tyto tři věci:
- porozumět dotazu
- mít relevantní dokumenty v indexu
- umět dobře vyhodnotit relevanci dokumentu k dotazu
Relevanční model dělá to třetí. Na dotazy, kterým rozumíme a máme k nim relevantní dokumenty v indexu, vracíme nyní lepší výsledky. Na testovaném vzorku dotazů je u nového modelu průměrná relevance (kvalita) SERPu o 4,5 % vyšší, než u starého modelu.
Více výsledků z jedné domény
Spolu s aktualizací relevančního modelu jsme také zjednodušili komponentu (agregátor), která se stará o agregaci výsledků do SERPu. Nyní agregátor více spoléhá na hodnocení relevance a častěji vrací více výsledků z jedné domény u dotazů, kde to má smysl.
Příklady:
Jak měříme kvalitu
Od hodnotitelů relevance získáme pro nějaký vzorek dotazů ke každému výsledku v SERPu jeho relevanci r. Relevanci SERPu R pak spočítáme jako váženou sumu relevancí r jednotlivých výsledků. Váha pozice je w.
Příklad výpočtu relevance SERPu:
R = w1*r1 + w2*r2 + … + w10*r10
Hodnoty R pro nějaký vzorek dotazů pak znormalizujeme a zprůměrujeme. Získané číslo (průměrná relevance SERPu) vyjadřuje kvalitu relevance na dané množině dotazů. Více na wiki.