Posun v relevanci vyhledávání

Tým relevance 22. února 2018 Vyhledávání

Brzy nasadíme do provozu nový relevanční model. Vyzkoušet, jak hledá, si můžete hned na hledani.sbeta.cz.

Aby vyhledávač vrátil na dotaz co nejlepší výsledky, musí dobře zvládnout hlavně tyto tři věci:

porozumět dotazu
mít relevantní dokumenty v indexu
umět dobře vyhodnotit relevanci dokumentu k dotazu

Relevanční model dělá to třetí. Na dotazy, kterým rozumíme a máme k nim relevantní dokumenty v indexu, vracíme nyní lepší výsledky. Na testovaném vzorku dotazů je u nového modelu průměrná relevance (kvalita) SERPu o 4,5 % vyšší, než u starého modelu.

Více výsledků z jedné domény

Spolu s aktualizací relevančního modelu jsme také zjednodušili komponentu (agregátor), která se stará o agregaci výsledků do SERPu. Nyní agregátor více spoléhá na hodnocení relevance a častěji vrací více výsledků z jedné domény u dotazů, kde to má smysl.

Příklady:

[zmije]
nové, staré
[lady gaga youtube]
nové, staré
[zoo praha]
nové, staré

Jak měříme kvalitu

Od hodnotitelů relevance získáme pro nějaký vzorek dotazů ke každému výsledku v SERPu jeho relevanci r. Relevanci SERPu R pak spočítáme jako váženou sumu relevancí r jednotlivých výsledků. Váha pozice je w.

Příklad výpočtu relevance SERPu:

R = w1*r1 + w2*r2 + … + w10*r10

Hodnoty R pro nějaký vzorek dotazů pak znormalizujeme a zprůměrujeme. Získané číslo (průměrná relevance SERPu) vyjadřuje kvalitu relevance na dané množině dotazů. Více na wiki.

Tým relevance

Sdílet na sítích

Co hýbe Českem? Ceny benzínu, elektroauta i kanystry, ukazují analýzy vybraných služeb společnosti Seznam.cz

Uživatelé v Česku na portálu Sauto.cz nejčastěji vyhledávají automobily spalující benzín*. Současná situace na trhu s palivy ale mnoho lidí, podle dat Seznam.cz Vyhledávání, podněcuje k většímu zájmu o elektroauta. Roste také počet dotazů na ceny benzínu, zejména na čerpacích stanicích Ono. Na Zboží.cz mají lidé větší zájem o kanystry, většinou o ty o objemu 20 litrů. Podíváme-li …

Čím se loni Češi bavili? Filmem s Hanou Vagnerovou i námořním muzeem, ukázala data Seznam.cz Vyhledávání

Česká internetová jednička tradičně zveřejnila svoje skokany vyhledávání – výrazy, jejichž hledanost ve srovnání s předchozím rokem vyrostla nejvíce. Mezi častěji zadané dotazy patřily ty na filmovou a seriálovou tvorbu. Konkrétně této kategorii loni kralovala česko-slovenská komedie s názvem Villa Lucia. Na čelní místo žebříčku více hledaných výrazů týkajících se volnočasových aktivit se probojovalo Námořní muzeum …

Page Quality jako klíč k úspěchu: Co musí mít web, aby si získal důvěru vyhledávačů i uživatelů

Page Quality je jedním z nejdůležitějších faktorů, které rozhodují o viditelnosti vašeho webu ve vyhledávání. Nejde jen o technickou metodu hodnocení, ale o souhrn principů, které určují, jak kvalitní, důvěryhodná a uživatelsky přívětivá vaše stránka skutečně je. Zjistěte, co vše Page Quality ovlivňuje a jak můžete její úroveň zvýšit, abyste posílili pozice svého webu v SERPu i důvěru uživatelů.

Zpracování osobních údajů

Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.

Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:

za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;

za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.

Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.

Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.

Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.