Přejít na obsah

#RobotZlepšení výběru stránek ke crawlování a indexaci

Tým Vyhledávání 4. července 2018

Výběr stránek, které SeznamBot crawluje a indexuje, má podobu skórování všech stránek, které SeznamBot zná a jejich následného řazení podle hodnot skóre. V uplynulých týdnech jsme provedli úpravy tohoto skórování, které se projeví následujícími změnami při výběru dokumentů ke crawlování a indexaci. Lepší predikce kvality stránky podle URL – URL stránky je pro robota jeden ze …


Big Data Processing API „Euphoria“ publikujeme jako opensource

29. března 2017

V posledních letech se množí technologie pro zpracování velkých dat, které přináší zajímavé možnosti využití. Ke zpracování velké dávky dat (batch) se přidaly i možnosti zpracování v reálném čase, kdy data vznikají (stream). Robot vyhledávače zpracovává miliardy uložených webových stránek a zároveň denně stahuje obsah stovek milionů URL z internetu. Vždy hledáme ty nejvhodnější technologie …


Robot rychleji následuje odkazy

21. února 2017

Po vylepšeních v rychlosti Freshbota jsme se podívali i na rychlost v tzv. „velkém robotovi“. Ten na rozdíl od Freshbota prochází násobně větší objemy stránek. Robot nyní reaguje dříve na obsah stránky a nová stránka se dostane do indexu dvakrát rychleji. Doposud stránka procházela složitějším zpracováním. Kvůli závislostem trvalo i několik dní od stažení URL než z …


Zvýšili jsme limit velikosti sitemapy na 50MB

25. ledna 2017

Na konci listopadu 2016 se ve standardu sitemap zvedl limit na velikost souboru sitemapy z 10 MB na 50 MB. Od letošního ledna jsme navýšili tento limit i pro zpracování sitemap a sitemap indexů v SeznamBotovi. Limit aplikujeme u komprimované sitemapy až poté, co ji robot rozbalí. Nadále platí, že limit počtu URL v sitemapě …


Vylepšením procesu stahování jsme zrychlili Freshbota

16. ledna 2017

Freshbot, který do hledání dodává nově vzniklé zpravodajské články, stahuje od listopadu téměř o 30% rychleji. Rychlost jsme zlepšili díky novému procesu stahování webových stránek, jehož nejdůležitější částí je nová komponenta Dolores. Novinky z internetu se tak dostanou dříve do hledání a k uživatelům. V průběhu roku 2016 jsme přidávali počty zdrojů, kde Freshbot hledá nový obsah, a …


Seznam.cz hledání jede na Steroidech

14. prosince 2016

V článku o zvětšení velikosti databáze robota jsme objasnili, že vyhledávač pracuje se dvěma databázemi – jednu obsluhuje robot a ve druhé se hledá. Databázi robota jsme zvětšili v průběhu léta a na podzim jsme plánovali pokračovat databází hledání, tzv. indexem. Ten naposledy rostl v roce 2012, a to z 500 milionů na 700 milionů internetových …

Zpracování osobních údajů

Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.

Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:

  • za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;
  • za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.

Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.

Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.

Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.

Beru na vědomí