29. 6. 2011

canonical: Jak a kdy používat kanonické URL

Před časem jsme začali sledovat využívání kanonických linků a po zhodnocení byla jejich podpora přidána do nového robota. Uvedeme pár tipů, jak se canonical hodí použít a nepoužít, tak aby měly pro web pozitivní dopad a zabránilo se zbytečným chybám.

Cílem kanonizace URL na webu je zjednoznačnění struktury adres. Díky tomu se na serveru fulltextoví roboti méně ztrácí a vědí přesněji, která stránka je z pohledu webmastera ta důležitější. Velkou výhodou kanonických linků je jejich jednoduchá integrace využití jak ve statických tak i na dynamických webech.

Vhodné použití

Jak je to správně: máme web, který obsahuje nějaké seznamy. Typicky seznam prodejců nebo uživatelských hodnocení. Web je navržen tak, že při kliku na jednotlivé názvy  sloupců se mění hodnota parametru sort v URL a současně se seřadí zobrazované data dle požadovaného sloupce. Ostatní se skryjí. V důsledku tedy vznikají z pohledu vyhledávačů duplicitní stránky:

  • example.com/produkt123
  • example.com/produkt123?sort=name
  • example.com/produkt123?sort=id
  • example.com/produkt123?sort=price

No a teď ten fígl: pokud do <head> uvedete, která stránka je ta nejsprávnější např.: <link rel=”canonical” href=”http://www.example.com/produkt123″ />, tak tím jednoznačně řeknete robotovi, kterou podobu URL má ideálně do vyhledávání zařadit, a současně označujete její duplicity. Pro web je výhoda v lepším řízení a směrování robota po doméně.

Obdobná situace může nastat např. při směrování na domovské stránky webů – example.com/index.php místo na požadované example.com. Nicméně to jsou situace, které fulltexty bez větších problému zvládají.

Nevhodné použití

Příkladem chybného použití je canonical na redirektech. Tedy, cíl kanonických URL nemá být redirekt (je to podobné, jako když vás na úřadě pošlou k přepážce č. 5, která je zavřená s cedulkou „Obslouží vás u přepážky 105“). Cílová stránka tedy musí mít obsah, aby si robot mohl snadno ověřit podobnost původního a kanonického dokumentu.

Asi nejhorším použitím je směrování robota neakceptujícího cookie po navštívení kanonické URL zpět na původní „škaredou URL“. Tedy robot jde na URL A, tam zjistí, že kanonická podoba je URL B no a když na ni vleze, tak server zjistí, že cookie nejsou ze strany robota podporované a šupem ho pošle zpět na URL A. Krásné zacyklení, že;)

Další příklady použití kanonizace.

Případné zkušenosti a připomínky ke kanonizací můžete psát do diskuse pod článkem.