Přidávání zobecňujících signálů

Yuhů 20. dubna 2020 Vyhledávání

V přirozeném hledání máme nasazen nový model užitečnosti, což je jeden z nejdůležitějších dílčích modelů, ze kterého se naše vyhledávání skládá. Aktualizace se nasazovala ve středu 15. 4. Letos jde zatím o největší změnu.

Tentokrát jsme hlavně přidávali nové signály a učili na nich nové modely užitečnosti. Logiku sběru učících dat jsme neměnili. Z toho plyne, že viditelné změny by měly být spíše technického rázu než nějaké systémové. Stále platí, že se snažíme učit modely tak, aby ve vyhledávání preferovaly stránky, které jsou co nejužitečnější pro uživatele. Podrobněji jsme metodu učení modelů popisovali v listopadu.

Hodně nás baví nová skupina signálů, kterou připravujeme pomocí nástroje Vowpal Wabbit. To je populární knihovna, která umí z oznámkovaných, málo strukturovaných nebo nestrukturovaných vstupů (například z dvojic dotazů a textů stránek) uvařit obrovský vzoreček hádající známky budoucích vstupů (opět například dvojic dotazů a textů stránek). Tento obrovský vzoreček je navíc navržený tak, že se příjemně rychle počítá, takže se dá použít už na jedné z hlubších vrstev hledání. Samy o sobě jsou výstupy z Vowpal Wabbitu relativně hloupé a na řazení výsledků vyhledávání by nestačily, ale jako signály vstupující do dalšího výpočtu jsou vhodné, protože umí částečně zobecňovat význam slov. Významy slov už dlouho zobecňují některé další naše komponenty hledání (například query processing), ale každá další vrstva zobecnění se při hledání hodí.

Další nové signály se snaží hádat, zda je na stránce s výrobkem skutečně výrobek na prodej, nebo zmírňují chyby vzniklé při náhodné shodě vyskloňovaných tvarů spolu nesouvisejících českých slov. Stále totiž platí, že se ve vyhledávání snažíme primárně pracovat s češtinou.

Yuhů

Konzultant vyhledávání

Sdílet na sítích

Češi si nejvíc vyhledávají dovolené v Egyptě, Řecku a Itálii. Stále víc je láká Albánie

Data ze Seznam.cz Vyhledávání ukazují, že Češi nejvíc vyhledávají dovolenou v Egyptě, Řecku a Itálii. Stále častěji ale hledají inspiraci na dovolenou i v méně tradičních destinacích. Mnohem více je zajímá třeba Albánie, která si v posledních letech získává srdce českých turistů. Podle dat Seznam.cz Vyhledávání za posledních osm let zájem o tuto zemi vzrostl hned o 125 %.

Když se vyhledávač mění v odpovídač. Jak fungují AI sumarizace?

Už více než 10 let internetové vyhledávače postupně mění svou funkci – z tradičního webového rozcestníku se posouvají do pozice zprostředkovatele obsahu s cílem odpovídat na uživatelské dotazy přímo. V Seznamu interně říkáme, že se vyhledávač proměňuje v odpovídač. Jaké kroky podnikáme, abychom tomuto trendu šli naproti, jak fungují naše AI sumarizace a co na to uživatelé?

Buďte v obraze díky sumarizacím ve Vyhledávání

Jak slaví Vánoce v Rakousku a kdy je nejlepší čas navštívit Zanzibar? Už nemusíte brouzdat internetem a pracně získávat informace. Naše Vyhledávání to rádo udělá za vás. Díky nové funkcionalitě sumarizací vám informace poskládá do jedné ucelené odpovědi a ke každé větě transparentně přidá i zdroj. Začínáme pozvolna, ale postupně pokrytí novinky rozšiřujeme.

Zpracování osobních údajů

Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.

Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:

za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;

za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.

Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.

Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.

Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.