Ve středu 13. 10. jsme nasadili dlouho připravovanou změnu ve vyhodnocování relevance. Jedná se o několik úprav, které by dohromady měly zlepšit pořadí výsledků na některé dotazy a zároveň umožnit efektivnější rozvoj hledání do budoucna.
Lidé, kteří zadávají dotazy do Vyhledávání, mají vždy nějaký konkrétní záměr. Těch nejčastějších jsou jednotky a patří sem: přejít na nějaký web, získat zboží, najít firmu nebo dozvědět se více informací o nějaké entitě (třeba na Wikipedii). Dotazy s těmito záměry tvoří více než dvě třetiny trafficu ve Vyhledávání. Zbytek pak tvoří long tail. Velmi specifické záměry reprezentované málo častými dotazy, kdy lidé často potřebují s něčím poradit, něco doporučit nebo třeba získat konkrétní postup.
Posbírali jsme hodně dat a analyzovali jsme, jaké záměry existují, a na jejich základě vytvořili klasifikátor. Získaná informace o pravděpodobném záměru uživatele se nyní používá jako jeden z přibližně 250 faktorů při vyhodnocování relevance dokumentu k dotazu. Tato informace je důležitá, protože pomáhá modelu relevance v podobě rozhodovacích stromů. Na začátku vyhodnocování dokumentu určuje, kterou větví stromu daný dokument půjde a jaké faktory o jeho relevanci rozhodnou. O pořadí výsledků na informační dotazy by tak měly rozhodovat jiné faktory než o pořadí výsledků na nákupní dotazy.
Pro různé záměry máme různé modely relevance. Jejich výsledky se míchají dohromady. Rozdělení problému podle záměrů nám umožňuje rozvíjet hledání paralelně a více se soustředit právě na long tail, kde dává smysl použít vektorový přístup.
Nový update by měl vylepšit pozice především u e-shopů a nákupních webů. K menším změnám docházelo během října.
Jak slaví Vánoce v Rakousku a kdy je nejlepší čas navštívit Zanzibar? Už nemusíte brouzdat internetem a pracně získávat informace. Naše Vyhledávání to rádo udělá za vás. Díky nové funkcionalitě sumarizací vám informace poskládá do jedné ucelené odpovědi a ke každé větě transparentně přidá i zdroj. Začínáme pozvolna, ale postupně pokrytí novinky rozšiřujeme.
Mezi nejhledanější události loňského roku se dle dat služby Seznam.cz Vyhledávání, kam denně míří několik milionů dotazů, probojovaly podzimní povodně a výskyt vztekliny v Česku. Češi se však ve velkém zajímali také o své oblíbené herce a herečky, sportovní akce či praktické informace. Služba tradičně představila i takzvané skokany roku – výrazy, jejichž hledanost ve srovnání s předchozím rokem vyrostla nejvíce.
17. října se uskutečnil už druhý ročník Seznam Meetupu zaměřeného na vývoj a praktické použití generativních jazykových modelů. Akce přilákala pestrou směsici technologických nadšenců, výzkumníků i odborníků z oblasti umělé inteligence. Meetup byl součástí Dnů AI 2024 a přinesl řadu inspirativních přednášek, praktických ukázek a networkingových příležitostí. O účast na akci, která proběhla v budově ČVUT i online, projevilo zájem bezmála 600 účastníků.
Zpracování osobních údajů
Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.
Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:
za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.
Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.
Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.
Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.