26. 10. 2015

Přechod na novější distribuci Hadoopu na výpočetních clusterech robota

Fulltextový crawler běží od roku 2011 produkčně na Apache Hadoop, systému pro distribuované výpočty na clusterech. V roce 2011 byl produkčně nasazen robot verze 3.0 na distribuci Hadoopu od společnosti Cloudera, tehdy na verzi CDH3. V roce 2013 jsme povyšovali verzi distribuce na CDH4 a letos na podzim probíhá povýšení na CDH5, spolu se správcem prostředků YARN. Od nového systému si slibujeme větší stabilitu výpočtů, lepší využití výpočetní kapacity a širší možnosti zavádění nových technologií pro práci s velkými daty.

Na začátku října jsme rozdělili na polovinu oba clustery, na kterých robot běží. Zatímco se instaloval nový systém na vyjmuté servery, robot s menšími omezeními využíval zbytek výpočetní kapacity. Aktuálně rozbíháme všechny komponenty crawlera na nově nainstalovaných serverech, přičemž na původních clusterech je už vypnutý.

Výpadek chodu robota jsme očekávali pouze krátký a neměl mít významný vliv na aktualizaci indexu. Bohužel však došlo k menším komplikacím při přenášení dat a rozbíhání robota na novém clusteru. Proto se výpadek mírně prodloužil. Chvilkové výpadky postihly také přidávací formulář a FreshBota, neboli robota, který stahuje novinové články a jiné aktuální zdroje informací.

V současné době jsou již všechny závažné problémy zažehnané. Nedošlo k žádné ztrátě dat, ani k propadům ve výsledcích vyhledávání. Za případné zpoždění publikace výsledků v indexu, způsobené přechodem na novější distribuci Hadoopu, se tímto omlouváme.