10. 12. 2013

Seznam.cz otevře část své vyhledávací technologie pro týmy v projektu StartupYard 2014

Po dvou letech vzájemné spolupráce se StartupYardem se Seznam.cz rozhodl ještě více toto partnerství prohloubit. Týmům, které se budou účastnit jarního běhu akcelerátoru v roce 2014, otevře Seznam.cz část své vyhledávací technologie…

…Usnadní jim tak práci na projektech, které pracují s velkými daty a daty získanými z internetu.

Seznam.cz se o své know-how se začínajícími podnikateli dělí již několik let. Konkrétně s pražským akcelerátorem StartupYard bude Seznam.cz spolupracovat již třetí rok. Protože se bude StartupYard v roce 2014 specializovat na projekty v oblasti velkých dat, hledání a datové analytiky nad daty z internetu, rozhodl se Seznam.cz nabídnout účastníkům jarního běhu StartupYardu část technologie, na které funguje vyhledávání Seznam.cz. Chce tím usnadnit rozběh jejich projektů. Týmům nabídne soubor dokumentů, které zaindexoval robot Seznam.cz a které byly předem klasifikovány dle určitých parametrů.

„Tento projekt je pro nás výzvou. Naši fulltextovou technologii jsme si vyvinuli sami a stojí na ní zhruba 30 % našich tržeb, které přináší Sklik. I tak jsme se rozhodli část své technologie nabídnout jako pomoc pro evropské týmy, které se budou účastnit jarního běhu StartupYardu. Věříme, že právě tato data pomohou přinést na trh nové zajímavé projekty zaměřené na velká data a hledání. Těším se na další nápady týmů, nejen na celkem obligátní nástroje na monitoringy médií nebo prediktivní marketing,“ komentoval krok společnosti Seznam.cz její generální ředitel Pavel Zima.

„Pro rok 2014 jsme si ve StartupYardu vytyčili ambiciózní cíl: chceme do Prahy přilákat ty nejambicióznější a nejnadějnější projekty v oblasti datové analytiky, hledání nebo velkých dat obecně. Chceme jim pomoci, aby se z jejich projektů staly fungující firmy, které na trhu obstojí. K tomu využíváme i naše specializované mentory. S těmi se mohou týmy, které z Evropy do Prahy přivezeme a nabídneme jim po celé tři měsíce běhu programu i bezplatné ubytování, setkat právě díky jarnímu běhu StartupYardu. Do balíčku, který začínajícím firmám ve StartupYardu nabízíme, přidává Seznam.cz další velmi hodnotný dílek skládačky. Už se nemohu dočkat, s jakými projekty využívajícími tuto technologii týmy na jaře přijdou,“ doplňuje Cedric Maloux, výkonný ředitel StartupYardu.

Hledací technologie, kterou používá Seznam.cz, je postavena na technologiích Hadoop a Hbase. Týmy budou mít v jarním běhu programu akcelerátoru StartupYard přístup do testovacího clusteru. Ten obsahuje zhruba 100 milionů pravidelně aktualizovaných dokumentů z internetu. Všechna tato data jsou stažená z webových stránek a předem zanalyzovaná a rozřazená podle domén, webserverů a URL. Každá z těchto entit dále obsahuje informace o specifických signálech a dalších atributech tak, aby umožnila rychlou analýzu obsahu daných internetových stránek. Seznam.cz týmům ve StartupYard neodhalí všechny signály, které používá v produkčním vyhledávání, jelikož nemůže zcela otevřít svoje know-how. To by totiž mohlo ovlivnit a poškodit kvalitu výsledků hledání.

„V clusteru, který dostanou týmy jarního běhu StartupYardu, jsou dokumenty z Internetu, ke kterým už jsme provedli základní analýzu, respektive náš robot, a známe tak jejich obsah. Navíc k nim máme různé další informace jako například jejich jazyk a meta-popisy. Nechybí ani data o odkazech mezi stránkami a mnoho dalších atributů, které dané webové stránky mají. Zároveň můžeme relativně snadno přidat informace o dalších atributech, o které si jednotlivé týmy řeknou,“ doplňuje Marek Nový, Head of Business Development v Seznam.cz, popis části technologie, kterou Seznam.cz týmům ve StartupYardu nabídne.

Všichni zájemci o účast ve StartupYardu se zajímavým projektem z oblasti dat, hledání nebo datové analytiky se mohou hlásit až do konce ledna. Přihlášku najdou na stránkách StartupYardu. Pokud potřebujete zjistit o StartupYardu více, můžete také kontaktovat Cedrica Malouxe, výkonného ředitele StartupYard.

Roli společnosti Seznam.cz v projektu dále blíže případným zájemcům osvětlí Irena Zatloukalová, tisková mluvčí Seznam.cz.

Irena Zatloukalová,
tisková mluvčí