Ve středu 13. 10. jsme nasadili dlouho připravovanou změnu ve vyhodnocování relevance. Jedná se o několik úprav, které by dohromady měly zlepšit pořadí výsledků na některé dotazy a zároveň umožnit efektivnější rozvoj hledání do budoucna.
Lidé, kteří zadávají dotazy do Vyhledávání, mají vždy nějaký konkrétní záměr. Těch nejčastějších jsou jednotky a patří sem: přejít na nějaký web, získat zboží, najít firmu nebo dozvědět se více informací o nějaké entitě (třeba na Wikipedii). Dotazy s těmito záměry tvoří více než dvě třetiny trafficu ve Vyhledávání. Zbytek pak tvoří long tail. Velmi specifické záměry reprezentované málo častými dotazy, kdy lidé často potřebují s něčím poradit, něco doporučit nebo třeba získat konkrétní postup.
Posbírali jsme hodně dat a analyzovali jsme, jaké záměry existují, a na jejich základě vytvořili klasifikátor. Získaná informace o pravděpodobném záměru uživatele se nyní používá jako jeden z přibližně 250 faktorů při vyhodnocování relevance dokumentu k dotazu. Tato informace je důležitá, protože pomáhá modelu relevance v podobě rozhodovacích stromů. Na začátku vyhodnocování dokumentu určuje, kterou větví stromu daný dokument půjde a jaké faktory o jeho relevanci rozhodnou. O pořadí výsledků na informační dotazy by tak měly rozhodovat jiné faktory než o pořadí výsledků na nákupní dotazy.
Pro různé záměry máme různé modely relevance. Jejich výsledky se míchají dohromady. Rozdělení problému podle záměrů nám umožňuje rozvíjet hledání paralelně a více se soustředit právě na long tail, kde dává smysl použít vektorový přístup.
Nový update by měl vylepšit pozice především u e-shopů a nákupních webů. K menším změnám docházelo během října.
Když se řekne výzkumník, možná si představíte člověka v bílém plášti, který tráví celé dny v laboratoři. Veronika Krejčířová žádný plášť nenosí a místo zkumavek pracuje na počítači. Přesto v Seznamu vede tým výzkumníků, kteří se věnují strojovému učení. A my jsme se jí zeptali třeba na to, jak se její obor za poslední roky změnil nebo co si myslí o obřích jazykových modelech, které v posledních měsících hýbají světem.
Neustále pracujeme na tom, aby se ve Vyhledávání na Seznamu zobrazovaly co nejlepší výsledky. I proto jsme nedávno nasadili úpravy, které zlepšují relevanci organického hledání. Co se změnilo a z čeho úpravy vycházejí?
S hokejovou upoutávkou ve Vyhledávání od Seznamu vám neunikne žádná informace o letošním mistrovství. V kartě uvidíte, jak si na turnaji český tým vede, které zápasy se odehrají v nejbližší době a také výsledky předchozích utkání. A pro případ, že nebudete moct sledovat televizní přímý přenos, pro vás vývoj probíhajících zápasů budeme aktualizovat živě.
Zpracování osobních údajů
Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.
Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:
za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.
Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.
Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.
Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.