Vyhledávání Seznamu uvádí vybrané úryvky neboli Featured snippets

Co přesně jsou Featured snippets na Seznamu, jak je aktuálně zobrazujeme a kdy bude možné se do těchto úryvků dostat? Přiblížíme vám novinku, kterou můžete už teď vidět ve Vyhledávání.

Featured snippet je krátký úryvek textu, který se zobrazuje na stránce s výsledky vyhledávání (SERP) a klade si za cíl poskytnout přímou odpověď na hledaný dotaz. V češtině mu říkáme „vybraný úryvek“. Na rozdíl od klasických snippetů, které se zobrazují pro každý výsledek, se tento úryvek v SERPu zobrazuje pouze jeden.

Předpokladem Featured snippetu je, že obsahuje tu nejlepší odpověď na hledaný dotaz, která se na stránkách v rámci SERPu v danou chvíli dá najít. Může mít formu odstavce, tabulky, ale i číslovaného či nečíslovaného seznamu.

Jak Featured snippet vzniká?

Díky naší neuronové síti Small-E-Czech, vycházející z modelu Electra, jsme schopní z textu na daný dotaz vybrat odstavec obsahující tu nejlepší odpověď. Model jsme doučili na volně dostupném datasetu Natural Questions (soubor otázek a odpovědí na ně) a na vlastních anotacích, kde anotátoři v rámci anotační úlohy na daný dotaz vybírají nejvhodnější odpověď.

Vstupem modelu je hledaný dotaz a odstavce textu nacházející se na webových stránkách. Výstupem je pak ohodnocení každého odstavce. Toto skóre se počítá pro každý výsledek v SERPu a nejlépe hodnocený odstavec poté zobrazujeme ve Featured snippetu.

Model neustále vylepšujeme a trénujeme na nových datech.

Jak si Featured snippet vyzkoušet „naživo“?

Vytvoření Featured snippetu ve Vyhledávání je časově náročná operace, a proto v tuto chvíli musíme regulovat, pro jaké dokumenty a dotazy se počítají. Zatím je počítáme jen pro výsledky z Wikipedie, které se nachází na prvních 5 pozicích v SERPu. Navíc musí hodnota vypočítaná naším modelem překonat určitý threshold (snippet musí dosahovat určité kvality). Výpočet provádíme pro dotazy, u kterých identifikujeme záměr „Poradit“ či „Dozvědět se více“. Zobrazovat by se měly například na dotazy „co je kurzarbeit“, „latinsky národ“ nebo „abolice“. Postupně budeme rozšiřovat pokrytí jak dokumentů, tak dotazů.

Co plánujeme dál?

Kromě rozšiřování pokrytí se chceme věnovat i dalším typům Featured snippetů. Momentálně vydáváme pouze odstavcové (paragrafové), ale v budoucnu plánujeme rozšíření o snippety s tabulkami a seznamy. Jedním z dalších kroků bude také přidání obrázků.

Petra Kubernátová
Product manager Vyhledávání

Sdílet na sítích