Ve středu 13. 10. jsme nasadili dlouho připravovanou změnu ve vyhodnocování relevance. Jedná se o několik úprav, které by dohromady měly zlepšit pořadí výsledků na některé dotazy a zároveň umožnit efektivnější rozvoj hledání do budoucna.
Lidé, kteří zadávají dotazy do Vyhledávání, mají vždy nějaký konkrétní záměr. Těch nejčastějších jsou jednotky a patří sem: přejít na nějaký web, získat zboží, najít firmu nebo dozvědět se více informací o nějaké entitě (třeba na Wikipedii). Dotazy s těmito záměry tvoří více než dvě třetiny trafficu ve Vyhledávání. Zbytek pak tvoří long tail. Velmi specifické záměry reprezentované málo častými dotazy, kdy lidé často potřebují s něčím poradit, něco doporučit nebo třeba získat konkrétní postup.
Posbírali jsme hodně dat a analyzovali jsme, jaké záměry existují, a na jejich základě vytvořili klasifikátor. Získaná informace o pravděpodobném záměru uživatele se nyní používá jako jeden z přibližně 250 faktorů při vyhodnocování relevance dokumentu k dotazu. Tato informace je důležitá, protože pomáhá modelu relevance v podobě rozhodovacích stromů. Na začátku vyhodnocování dokumentu určuje, kterou větví stromu daný dokument půjde a jaké faktory o jeho relevanci rozhodnou. O pořadí výsledků na informační dotazy by tak měly rozhodovat jiné faktory než o pořadí výsledků na nákupní dotazy.
Pro různé záměry máme různé modely relevance. Jejich výsledky se míchají dohromady. Rozdělení problému podle záměrů nám umožňuje rozvíjet hledání paralelně a více se soustředit právě na long tail, kde dává smysl použít vektorový přístup.
Nový update by měl vylepšit pozice především u e-shopů a nákupních webů. K menším změnám docházelo během října.
Říká se, že obrázek někdy vydá za tisíc slov. Proto vyhledávání obrázků na Seznamu neustále vylepšujeme, abychom vám mohli doručit co nejrelevantnější výsledky. I proto jsme do obrázkového hledání přidali novinku – funkci Podobné obrázky. Pojďme se na ni podívat podrobněji.
Seznam interně vyvíjí velké jazykové modely nazvané SeLLMa (Šelma), které mohou v mnohém konkurovat komerčně dostupným modelům. Diana Hlaváčová hostům Seznam fóra představila, co naše jazykové modely umí a v jakých produktech je využíváme.
Vyhledávání informací na internetu se stalo nedílnou součástí našich životů. Ať už potřebujeme rychle zjistit, jak opravit zaseknutý zip, najít nejlepší kavárnu v okolí nebo vybrat dárek k narozeninám – internetové vyhledávače jsou často naší první zastávkou. A s rostoucí sofistikovaností technologií se mění i způsob, jakým s vyhledávači komunikujeme.
Zpracování osobních údajů
Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.
Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:
za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.
Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.
Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.
Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.