29. 10. 2013

Nové chování screenshot generátoru

Nová podoba vyhledávání, kterou jsme experimentálně spustili 17. října 2013, je postavena zejména na větších a aktuálnějších náhledech webových stránek. Tento článek shrnuje aktuální stav a chování screenshot generátoru.

Aktuální infrastruktura

V současné době máme dva nezávislé screenshot generátory. Původní, který se identifikuje jako „screenshot-generator 2.0“ a fotí náhledy stránek (o rozměru 100x75px), které jsou určeny pro responsivní podobu vyhledávání. Pro potřeby nové podoby vyhledávání jsme vytvořili nový screenshotátor, který fotí náhledy stránek o rozměru 320x320px pro výdej na desktopových a tabletových zařízeních. Pro mobilní telefony se fotí náhledy o rozměru 300x150px. Screenshot generátor se pro focení náhledů pro mobilních telefony tváří jako mobilní telefon, na web přistupuje pod jiným useragentem, a snaží se vyfotit mobilní podobu webu. Motivací je nabídnout uživateli takový náhled stránky, na jaký se po prokliku dostane.

Přesnější identifikaci jednotlivých screenshot generátorů jsme popsali v nápovědě. Jsou zde uvedeny aktuální IP adresy a identity useragentů jednotlivých generátorů.

Upozorňujeme, že podstrkávání jiného obsahu či designu screenshot generátoru, než jaký je běžně na URL k dispozici (tzv. cloaking), je považováno za zakázanou optimalizační praktiku a bude postihována.

Častější focení webových stránek

Původně jsme přistupovali na webovou stránku pro získání náhledu pouze jednou. Nyní je možné, že pro vyfocení URL budeme přistupovat k jedné stránce až třikrát (jednou pro původní screenshot generátor, jednou pro nový desktopový generátor, jednou pro nový mobilní generátor). Počet je závislý na četnosti výdeje konkrétních URL v rámci některého ze SERPů. Tuto zátěž chceme v rámci následujících měsíců snížit, a to konsolidací starého a nového screenshot generátoru.

Rychlé focení náhledů

Ne všechny náhledy má smysl fotit do zásoby. Každý den vydáváme velké množství SERPů obsahující URL, které se vydávají téměř ojediněle. Jedná se zejména o URL longtailových dotazů. Responsivní podoba vyhledávání zobrazuje pro tyto URL zástupné náhledy – náhled nadstránky nebo náhled homepage. U nové podoby hledání se snažíme získat náhled stránky v reálném čase. Výkon tohoto instantního screenshot generátoru je omezen, a tak se snažíme vyfotit primárně náhledy umístěné na vyšších pozicích v SERPu.

V současné době stále nový screenshot generátor ladíme. Primárně se zaměřujeme na snížení zátěže focených webů. Pokud máte nějaký podnět či připomínku, dejte nám prosím vědět do diskuse pod článkem.