Díky tomu, že žijeme v 21. století, se jedním z nejlepších zdrojů odpovědí na naše otázky stal internetový vyhledávač. Ať už hledáme e-shop, otevírací dobu pošty, recept na večeři nebo novinky ze světa, vyhledávače nám naservírují obrovské množství informací na jedno kliknutí. Ale co vlastně očekáváme, když zadáme dotaz do vyhledávacího pole?
Lidé mohou mít různé představy o tom, jaké výsledky chtějí získat. Pro některé může být vyhledávání prostředkem k nalezení zdrojů pro hlubší výzkumy, jiní se snaží najít seznam firem nabízejících určitou službu, další chtějí ve výsledcích vidět e-shopy, kde by si koupili to, co potřebují, nebo se přes vyhledávač dostat na konkrétní stránku.
Seznamácký vyhledávač je navržen tak, aby co nejlépe vyhovoval široké škále potřeb uživatelů. Proto musí být vyhledávací algoritmy schopné interpretovat různé typy dotazů a nabídnout relevantní výsledky. Tyto algoritmy zohledňují mnoho faktorů, jako jsou relevance obsahu, popularita webových stránek, a dokonce i geografické umístění.
V dnešní době Vyhledávání na Seznamu využívá pokročilé strojové učení a umělou inteligenci prostřednictvím modelů strojového učení nazývaných „streamy“. Jako součást procesu sestavování výsledné stránky vyhledávače (SERP) vstupují streamy do „míchačky“. Míchačku si můžeme představit jako algoritmus, který je zodpovědný za sestavení SERPu z různých streamů tak, aby nejlépe odpovídal uživatelskému záměru, tedy tomu, co si uživatel při vyhledávání přeje najít.
Uživatelský záměr se odkazuje na úmysl nebo požadavek, který má uživatel při zadávání dotazu do vyhledávacího nástroje. Je to specifický cíl, informace nebo akce, kterou uživatel očekává, že mu vyhledávač poskytne prostřednictvím výsledků vyhledávání.
Uživatelské záměry ve Vyhledávání můžeme shrnout do čtyř hlavních kategorií:
1. Získat informace
Nadčasové informace: Uživatel hledá všeobecné informace o určitém tématu, entitě nebo jevu, které nevyžadují aktuálnost, například historické události, vědecká fakta, teorie atd.
Aktuální informace: Uživatel potřebuje aktuální informace, jako jsou výsledky sportovních zápasů, program kulturních akcí, aktuální kurzy měn, počasí, aktuální slevové nabídky, otevírací doby obchodů apod.
2. Získat zboží
Koupit nebo prodat: Uživatel plánuje obchodní transakci, jako je koupě, prodej nebo výměna zboží nebo služeb. Hledá konkrétní produkty, ceny, srovnání nabídek, bazarové inzeráty, slevové akce apod.
3. Najít firmu
Konkrétní firma nebo služba: Uživatel hledá konkrétní firmu, instituci nebo webovou službu. Může se jednat o vyhledávání podle názvu firmy, oboru činnosti, konkrétní služby, recenzí, kontaktů, adresy, navigace, fotografií apod.
4. Přejít na konkrétní stránku
Uživatel chce přejít na konkrétní stránku. Má jasnou představu o stránce, na kterou chce přejít, i když nezná nutně URL. Například ví, že chce stránku konkrétního prodejce, firmy, úřadu, konkrétní online služby, dokumentu z konkrétní domény apod. Uživateli není jedno, na kterém webu získá informace.
Nový SERP mícháme na míru každému dotazu
Streamové složení a zastoupení streamů v SERPech, které připravila starší míchačka, bylo pro všechny dotazy se stejným uživatelským záměrem téměř identické. Pokud byl uživatelský záměr vyhodnocen jako „Najít firmu“, výsledky v SERPu byly sestaveny z výsledků poskytovaných firemním a informačním streamem. U uživatelského záměru „Získat zboží“ výsledky pocházely od zbožového srovnávače a informačního streamu. Jak se ale vypořádat s dotazy, které mají více než jeden potenciální záměr?
Nová dynamická míchačka, která nově míchá organické výsledky v našem Vyhledávání, je založená na pravděpodobnostech všech možných uživatelských záměrů, díky čemuž může uživateli namíchat SERP přímo na míru podle konkrétního dotazu.
Poté, co uživatel do Vyhledávání zadá dotaz, analyzujeme ho, abychom mimo jiné vypočítali pravděpodobnosti jednotlivých uživatelských záměrů. Tyto pravděpodobnosti poté použijeme jako vstupní parametry do vzorce d’Hondtovy metody.
Pomáhá nám metoda, kterou známe z politiky
Co je to d’Hondtova metoda? Tato metoda se v České republice používá například při výpočtu rozdělení mandátů v zastupitelstvech obcí a krajů, ale také při volbách do Evropského parlamentu a do roku 2017 i při volbách do Poslanecké sněmovny.
Před přidělením každého mandátu se porovnávají d’Hondtova skóre každé strany a mandát získá strana s nejvyšším skóre. Jednotlivá d’Hondtova skóre (N) se vypočítají jako podíl získaného počtu hlasů (V) a počtu již získaných mandátů (s) zvýšených o jedna.
I když tato metoda byla původně vyvinuta pro rozdělování mandátů v politických volbách, v našem případě byla adaptována na výběr a pořadí výsledků z různých streamů na základě vypočítané pravděpodobností uživatelských záměrů. Streamy s vyššími pravděpodobnostmi jsou v SERPu zastoupeny více, čímž se zajišťuje, že výsledky budou co nejvíce odpovídat potřebám uživatele.
Ve Vyhledávání neustále pracujeme na tom, abychom zajistili, že výsledky, které se dostanou k uživatelům našeho vyhledávače, budou co nejlepší a nejpřesnější. Kromě hledání způsobů, jak zlepšit kvalitu našich modelů strojového učení, se zaměřujeme i na přesnější detekci uživatelského záměru a ladění míchačky, která poskytne uživateli výsledný SERP.
Říká se, že obrázek někdy vydá za tisíc slov. Proto vyhledávání obrázků na Seznamu neustále vylepšujeme, abychom vám mohli doručit co nejrelevantnější výsledky. I proto jsme do obrázkového hledání přidali novinku – funkci Podobné obrázky. Pojďme se na ni podívat podrobněji.
Seznam interně vyvíjí velké jazykové modely nazvané SeLLMa (Šelma), které mohou v mnohém konkurovat komerčně dostupným modelům. Diana Hlaváčová hostům Seznam fóra představila, co naše jazykové modely umí a v jakých produktech je využíváme.
Vyhledávání informací na internetu se stalo nedílnou součástí našich životů. Ať už potřebujeme rychle zjistit, jak opravit zaseknutý zip, najít nejlepší kavárnu v okolí nebo vybrat dárek k narozeninám – internetové vyhledávače jsou často naší první zastávkou. A s rostoucí sofistikovaností technologií se mění i způsob, jakým s vyhledávači komunikujeme.
Zpracování osobních údajů
Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.
Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:
za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.
Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.
Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.
Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.