Vylepšení textové reprezentace výsledků ve vyhledávání

14. srpna 2018

Brzy nasadíme do provozu nový způsob přípravy textových úryvků výsledků ve vyhledávání, tzv. snippetů, které je založeno na strojovém učení. Připravovaná změna se dotkne naprosté většiny výsledků.

Podívat se, jak nové snippety vypadají, můžete už nyní na https://hledani.sbeta.cz/.

Snippet je textová reprezentace výsledku ve vyhledávání, která reaguje na dotaz zadaný uživatelem a zároveň reprezentuje dokument zobrazený v SERPu.

Příprava snippetů probíhá těsně před vystavením výsledků vyhledávání. Abychom dokázali vytvořit snippet, potřebujeme rozumět dotazu a dokumentu, který je na zadaný dotaz relevantní.

V první fázi procesu vybíráme z dokumentu takové textové části, které splňují požadavky na formální úpravu. V další fázi z předvýběru formálně kvalitních částí dokumentu vybíráme ty, které nejlépe reagují na uživatelův dotaz či jej přímo zodpovídají.

Během přípravy snippetů sledujeme dvě základní kritéria – kvalitu snippetu (kontrolujeme jeho formální stránku) a užitečnost (sledujeme, do jaké míry reaguje na uživatelův dotaz).

Spolu s nasazením nového způsobu přípravy snippetů upravíme i jejich délku. Nově budou snippety delší cca o 1/3 svojí původní délky.

Příklad:

  • Aktuální provozní verze:

https://search.seznam.cz/?q=miloš+forman

  • Nová verze se změnou:

https://hledani.sbeta.cz/?q=miloš+forman

Tým Vyhledávání

Sdílet na sítích