16. 7.

Jak na Zboží.cz: Základní informace o XML feedu

Z prvního dílu seriálu už víte, že pro registraci na Zboží.cz je nutné mít vytvořený XML feed. V tomto díle se dozvíte, co je dobré vědět, aby úspěšně fungoval.

XML feed je datový soubor s informacemi o zboží, které e-shop prodává. Obsahuje název každé položky, její popis, adresu v e-shopu, prodejní cenu, dostupnost, atd. Najdete ho na URL adrese, která se vyplňuje při registraci na Zboží.cz, ze které si vyhledávač tento soubor pravidelně stahuje. Výsledkem pak je, že se tyto informace z XML feedu zobrazují na Zboží.cz.

XML feed musí být vytvořen přesně podle specifikace Zboží.cz a není možné jej použít pro jiný vyhledávač zboží. Pokud e-shop běží na některém z podporovaných e-shopových řešení, je jeho získání pro vyhledávač Zboží.cz snadné. Ostatním e-shopům obvykle vytvoří XML feed jejich programátor. Specifikace feedu je dostupná jak v češtině, tak v angličtině.

Před registrací do Zboží.cz doporučujeme ověřit v našem validátoru, zda lze vytvořený datový soubor v praxi použít. Jsou možné tři výsledky kontroly platnosti zadaných údajů:

1) XML feed je v pořádku

2) XML feed je potřeba opravit

(feed lze použít, některá data z něj se ale nezpracují)

3) XML feed nejde použít

Třetí případ znamená, že je v XML feedu kritická chyba, kvůli níž ho robot Zboží.cz odmítne zpracovat. Nejčastěji bývá problém s chybějící kořenovou značkou, která znamená, že jde o soubor vytvořený podle aktuální specifikace. Může se i stát, že v něm chybí u všech položek některý z pěti povinných tagů (PRODUCTNAME, DESCRIPTION, URL, PRICE_VAT a DELIVERY_DATE), nebo je vyplněný zcela chybně.

Kořenová značka musí být uvedena přesně v této podobě:

<SHOP xmlns=”http://www.zbozi.cz/ns/offer/1.0″>

V naší nápovědě jsou vypsány další příklady problémů s XML feedem a jejich řešení. Pokud vám validátor stále píše, že feed nejde použít, rádi vám poradíme na e-mailu zbozi@firma.seznam.cz.

Po úspěšném vytvoření XML feedu a registraci do Zboží.cz lze v administračním rozhraní nastavit, jak často si budeme soubor stahovat. Doporučujeme zaktivovat variantu “co nejčastěji”, protože se díky tomu každá změna v XML souboru (např. úprava prodejní ceny) dostane na web Zboží.cz velmi rychle.

URL feedu je možné kdykoli editovat (např. při změně shopsystému). Pozor na to, že po každé provedené změně se všechny položky odpárují.

V administračním rozhraní je dostupná historie zpracování feedu. Najdete zde například informace jako kdy se soubor naposledy stáhnul, kolik položek se úspěšně nahrálo na Zboží.cz, kolik je v XML feedu duplicit, tedy položek se stejnou hodnotou v tagu PRODUCTNAME. Ukazuje také, kolik položek je chybných. Jedná se o ty, které mají třeba chybně vyplněnou dostupnost (DELIVERY_DATE) nebo mají diakritiku v URL. Chybné položky a duplicity se do Zboží.cz nenahrají.

Je možné si také zobrazit diagnostiku chyb, která vypíše od každého typu chyby až pět příkladů. Detailní popis chyb je k dispozici ve validátoru.

V příštím díle se podíváme na význam nejdůležitějších tagů v XML feedu.

Důležité informace na závěr

Existují nástroje, které vám s XML feedem dokážou pomoci, jako například Mergado.

V nápovědě je možné si stáhnout příklad XML feedu.

XML feed by neměl obsahovat položky, které jsou vyprodané, neprodejné nebo na Zboží.cz zakázané (použité a rozbalené zboží, elektronické cigarety, atd.)

Soubor XML feedu může být zkomprimovaný ve formátech Gzip a Zip.

K prvnímu stáhnutí a zpracování feedu dojde krátce po registraci do Zboží.cz. Soubor se zpracovává nezávisle na tom, zda je v Peněžence kredit a přestává se stahovat po vyřazení obchodu ze Zboží.cz.

Nelze mít dvě provozovny se stejným XML feedem (URL feedu musí být vždy v rámci Zboží.cz unikátní). Jedna provozovna jich ale může mít i více.

Pokud se robotovi nepodaří XML feed stáhnout nebo je nezpracovatelný, na Zboží.cz se zobrazují informace z posledního úspěšného zpracování. Trvá-li jeho nedostupnost déle než šest dní, vlastníkovi účtu pošleme e-mailové upozornění. Obchodům, jejichž feed se 14 dní nepodařilo ani jednou (při minimálně třech pokusech) stáhnout nebo byly nezpracovatelné, se smažou nabídky a přestávají se na Zboží.cz zobrazovat.

Při stahování feedu platí určitá omezení:

Data musí začít téct do tří minut od zahájení požadavku na stahování.

Pokud klesne rychlost stahování pod 128 kbps na déle než minutu (včetně), je přenos přerušen.

Limit na velikost feedu je 1 GB a vztahuje se na stahovaná data, tedy v případě komprimace na zkomprimovanou podobu.

V případě, že robot při zpracování XML feedu narazí na URL obrázku, čeká na jeho stažení maximálně pět vteřin. Když se mu obrázek do té doby nepodaří stáhnout, přeskočí ho a pokračuje dále ve zpracování. Nastane-li tato chyba během zpracování stokrát, další obrázky se nestáhnou.

Za tým Zboží.cz Stanislav Rulc

Stanislav Rulc

Konzultant Zboží.cz