27. 4. 2011

SeznamBot/3.0

První veřejná verze databáze je v testu.

Vážená veřejná odbornosti,

přepsání samotného mechanismu pro získávání stránek s sebou nese změny v logice generování hledací databáze. Proto jsme se jako obvykle rozhodli přistoupit ke zveřejnění testovací verze hledání s dostatečným předstihem před tím, než půjdeme do ostrého provozu. Na tradiční adrese http://searchtest.seznam.cz naleznete obsah nové výdejové databáze. Celkový počet zaindexovaných stránek je zhruba stejný jako v současné výdejové databázi, tj. necelých 400 miliónů.

Pomozte nám při odhalování nedostatků této testovací (alfa) verze databáze. Zkontrolujte prosím své weby.

Co nás zajímá?

Nejde o pořadí. Testujeme obsah databáze. Chceme zjistit, zda v databázi nic důležitého nechybí.

  • Zcela chybějící domény
    Pokud při hledání s operátorem site: (např. site:seznam.cz) není nalezena žádná stránka z domény.
  • Málo proindexované domény/počet zaindexovaných stránek pro jednotlivé weby.
    Odhad počtu vyhledaných stránek při hledání s operátorem site: by neměl být výrazně nižší než v současném hledání.
  • Chybějící navigační stránka, typicky hlavní strana webu.
    Na navigační dotaz chybí ve výsledcích ta jediná správná stránka (př.: dotaz konopiště -> chybějící HP konopiště)
  • Četnost návštěv robota na jednotlivých url.
    V přístupových lozích vašich webů lze porovnat periody návštěv současného a nového robota. Stránky, které se často mění, by měly být navštěvovány ve výrazně kratším intervalu než stránky neměnné.
  • Jakékoli další nesrovnalosti a nestandardní chování robota (ignorování návštěvních period, definic v robots.txt, meta tag noindex aj.).

Co není předmětem testování?

Předmětem testování není pořadí stránek. Nejedná se o finální verzi hledání. Pořadí stránek vzhledem ke konkrétním dotazům není konečné, váhy hledání se budou ještě výrazně měnit.

Pokud narazíte na chybějící stránku/doménu nebo jinou chybu související s robotem, dejte nám prosím vědět. Všechny vaše podněty budeme vyhodnocovat, ale není v našich silách jednotlivě odpovídat v komentářích. V případě závažných reportů, k nimž budeme potřebovat detailnější informace, vás kontaktujeme na e-mailu.
Za vaše konstruktivní připomínky předem díky.