16. 8. 2011

Druhý výsledek z webu

Budeme zobrazovat více výsledků z jednoho webu. Můžete to vidět na searchtestu.

Momentální funkčnost je taková, že z jednoho webu zobrazujeme v přirozených výsledcích vyhledávání pouze jeden odkaz. Když píšu o ” webu”, tak tím myslím hostname, tedy celé doménové jméno. Nový stav, který už je k vidění na searchtest.seznam.cz, bude takový, že se z jednoho webu bude moci zobrazit více výsledků (zpočátku konkrétně dva).

Kritéria pro vypsání druhého výsledku z jednoho webu jsou dvě. Jednak musí být druhý odkaz dostatečně dobrý (ve smyslu našeho řazení), aby se sám dostal na stejnou stránku výsledku vyhledávání, na kterou patří první odkaz. Za druhé se od sebe oba odkazy musejí dostatečně obsahově odlišovat. Pokud oběma kritérii druhý odkaz projde, bude zařazen pod ten první, aby byly u sebe.

Dost práce jsme strávili úvahami, jestli nějak dvojici výsledků z jednoho webu ve výsledcích graficky označovat. Zatím jsme se rozhodli, že druhý výsledek nijak neodlišíme a spolehneme se na schopnost uživatelů identifikovat stejný web podle podobného obrázku se screenshotem.

ukázka dvou výsledků na dotaz LG

výřez dvou výsledků ze stejného hostname www.lg.com

V minulosti už jsme podobnou funkčnost několikrát měli, ale fungovala s pochybnou kvalitou, tak jsme to vypnuli. Teď by to mělo být lepší. Zkuste například dotazy Hradčany, Olympus nebo Klaus, na nich by to mělo být vidět. Je možné, že druhé výsledky na tyto dotazy časem zmizí, jak se změní vyhledávací index. Stejně jako při každé úpravě algoritmu se dají najít příklady dotazů, jejichž výsledky se úpravou zhorší, a jiné, které se zlepší.

Do ostrého provozu na search.seznam.cz půjde druhý výsledek z webu někdy brzo. V tuto chvíli budeme rádi zejména za hlášení případů, kdy se pod sebou zobrazují dvě obsahově velmi podobné stránky.