1. 9. 2011

Zařazení upoutávek na relevantní pozice

V současné době jsou pro upoutávky vyčleněny na stránce s vyhledáváním dvě pozice – horní a spodní pozice pro upoutávky.

Horní pozice je umístěna nad výsledky vyhledávání a je obsazena pouze tehdy, pokud víme, že upoutávka je pro uživatele přínosná. Spodní pozice pro upoutávky je umístěna pod výsledky vyhledávání a její význam spočívá zejména k doplnění výsledků o potenciálně zajímanou informaci a k zobrazování méně zajímavých upoutávek.

Způsob rozmístění upoutávek byl navržen před několika lety. V době návrhu se počítalo s řádově několika druhy upoutávek. V současné době se počet vydávaných upoutávek rozrostl na několik desítek. Se zvýšeným počtem upoutávek se čím dál více začaly projevovat negativní vlastnosti původního návrhu:

  1. Nestálost upoutávky na horní pozici
    Pro dotaz může existovat více upoutávek, o kterých víme, že jsou vhodné k zobrazení na horní pozici. V takovém případě se náhodně volí jedna z nich. Z uživatelského hlediska to znamená, že pro stejný dotaz dostává uživatel různé upoutávky. Nemůže se tak spolehnout, že na daný dotaz se upoutávka daného typu zobrazí. Má také pocit, že se stránka s vyhledáváním často mění. Dlouhodobě se ukazuje, že stabilita je pro velkou část uživatelů důležitá.
  2. Předbíhání relevantních fulltextových výsledků
    Pro určité dotazy se stává, že upoutávka „předběhne“ relevantnější výsledek vyhledávání. V současném návrhu nejsme schopni zařadit upoutávku „trochu níže“, neexistuje žádná „trochu nižší pozice“. Uživatelům tak odsuneme očekávaný výsledek níže a před něj předřadíme méně relevantní upoutávku.

Z uvedených důvodů jsme se rozhodli přepracovat způsob vydávání upoutávek, a to tak, abychom odstranili výše uvedené neduhy. Hlavní myšlenkou změny je zařadit upoutávku na takovou pozici, na kterou má z hlediska relevance výsledků vyhledávání nárok. Upoutávky se mohou nově zařadit i mezi výsledky vyhledávání.

Výše uvedené změny vedou k větší stabilitě výsledného obsahu a k relevantnějšímu zařazení upoutávek. Změny neovlivňují způsob řazení samotných výsledků vyhledávání ani počet zobrazovaných výsledků.

Změnu zaznamenaly také samotné upoutávky. Provedli jsme menší redesign grafických šablon, kvalitativně jsme vylepšili některé stávající upoutávky.

O tom, jak jsme se s touto technologickou výzvou vypořádali, vám v některém z příštích článků popíší vývojáři a výzkumníci fulltextu, kteří se danou problematikou přímo zabývají. Bude to například statistická metoda LDALatent Dirichlet Allocation, kterou využíváme pro korektní zařazení upoutávek u longtailových dotazů nebo metoda SVMSupport Vector Machine, která slouží k analýze dat a rozpoznávání vzorů.

Změnu je možné otestovat na http://searchtest.seznam.cz.

Budeme rádi za váš feedback.

Update 2.9.2011 10:00

Na searchtestu je nasazena produkční verze hledání, takže výsledky jsou shodné s výsledky ostrého hledání. Sklik se vydává z testovacího rozhraní Skliku (viz příspěvek [2]).