V květnu tohoto roku společnost Seznam.cz uspořádá workshop v anglickém jazyce s názvem „Recommendation Systems and User Representations” na vědecké konferenci Machine Learning Prague 2022. Účastníci setkání se seznámí se současným stavem výzkumu doporučovacích systémů, včetně architektur hlubokých neuronových sítí, které se v nich používají. Součástí semináře bude praktická část, během níž si účastníci budou schopni natrénovat hlubokou neuronovou síť, kterou aplikují na řešení problému doporučování zpráv na připravených datových sadách. Výklad i praktická část se pak zaměří na řešení vybraných praktických problémů doporučování, zejména řešení tzv. „cold start” problému pomocí metod reprezentace uživatele.
Náhled pod pokličku DS
Pokud jste nedávno navštívili jakýkoliv zpravodajský portál, tematicky zaměřené webové stránky nebo jste nakupovali v online obchodě, možná jste se setkali s nabídkou článků nebo produktů, které byly označené jako „oblíbené články”, „podobné produkty”, nebo dokonce „uživatelé, kteří si koupili tento produkt, měli zájem také o tyto produkty”. Ve všech případech vám tyto nabízené položky byly předloženy doporučovacími systémy (DS), které jsou v dnešní době poskytovateli online služeb v široké míře využívány.
Nabídky online služeb v poslední dekádě vzrostly více než o řád a počet položek (produktů online obchodu, článků na zpravodajském portálu atd.) nabízených jednotlivou online službou může být v řádech statisíců až milionů. Pro běžného uživatele internetu se výběr z tak velkého množství produktů a služeb stal velmi obtížným a nepříjemným úkonem – často citovaná psychologická studie z roku 2000 na základě dobře navržených experimentů došla k závěru, že příliš bohatá nabídka možností při rozhodování obvykle působí odpudivě. Doporučovací systémy byly navrženy jako odpověď technologických firem na tuto situaci. Správně navržený doporučovací systém zjednoduší a zefektivní uživatelův výběr cílových služeb a produktů. Uživatel tím získá pozitivní pocit z užívání služby, a to se s velkou pravděpodobností promítne do delšího času, který na stránkách poskytovatele služby stráví, do vyššího počtu služeb, položek, nebo produktů, které si prohlédne, a samozřejmě na výši tržeb, kterou poskytovatel služby zaznamená.
Historie doporučovacích systémů sahá do 70. let minulého století, kdy se začaly objevovat první vědecké články o metodách doporučování. Rychlý rozvoj DS a jejich masivní uvádění do provozu nastaly začátkem tisíciletí, tedy v době, kdy se velké e-commerce projekty začaly blížit profitabilitě. V poslední dekádě v DS jasně převládly přístupy založené na analýze dat a s nimi technologie strojového učení.
Společnost Seznam.cz využívá doporučovací systém na své obsahové síti od roku 2016 a od roku 2019 doporučování nabízí jako službu „Seznam Doporučuje” pro partnerské weby. Případová studie z roku 2019 uvádí 22% zvýšení čtenosti článků webu po zavedení služby do provozu.
Dalším výrazným dopadem překotného vývoje DS v poslední dekádě je neustále se zvyšující poptávka po IT profesionálech s expertní znalostí v oblasti strojového učení pro uplatnění v doporučovacích systémech. Například vyhledávání na pracovní příležitosti na profesní síti LinkedIn dotazem „recommendation technology” vrátí několik stovek pracovních příležitostí. Seznam.cz v této oblasti nabízí hned několik pozic.
Neustále pracujeme na tom, aby se ve Vyhledávání na Seznamu zobrazovaly co nejlepší výsledky. I proto jsme nedávno nasadili úpravy, které zlepšují relevanci organického hledání. Co se změnilo a z čeho úpravy vycházejí?
V posledním článku o doporučovacích systémech jsme vyzdvihli schopnost doporučovacích systémů (DS) výrazně zvýšit úroveň nabízených služeb, díky které v posledních letech pronikly do všech oblastí, kde jsou obsah nebo služby nabízeny koncovým uživatelům. Metody strojového učení, které se v DS využívají, jsou ze stejného důvodu předmětem pokročilého výzkumu v mnoha prestižních technologických společnostech. V …
Uživatelé očekávají, že s pomocí vyhledávače najdou na internetu informace, které zrovna potřebují. Aby však vyhledávač mohl na jejich dotaz správně odpovědět, musí udržovat na svých serverech lokální kopii webu, kde nesmí žádná důležitá webová stránka chybět. Navíc by všechny měly být ve stejném stavu, jako na internetu. Databázi pro vyhledávač tvoří vyhledávací robot, který …
Zpracování osobních údajů
Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.
Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:
za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.
Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.
Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.
Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.