28. 7. 2014

Nová verze přepisu dotazu

V příštích dnech budeme nasazovat novou verzi našich vyhledávacích algoritmů. Drobné změny pouštíme každou chvíli, ale tahle bude větší. Tentokrát měníme interní způsob přepisu dotazu.

Pro naše hledající uživatele by změna neměla být nijak zásadně patrná. Stále platí, že naše algoritmy se snaží do výsledků dávat co nejrelevantnější výsledky. Z našich interních měření vyplývá, že nová verze dosahuje stejné kvality řazení výsledků.

Naopak ti, kdo pravidelně sledují pozici svých stránek na různé dotazy, změnu pravděpodobně zaregistrují. Přepis dotazu do strojově uchopitelné formy stojí totiž na začátku procesu hledání, a tak má na výpočet pořadí výrazný vliv. Porovnáním obou verzí nám medián změny výsledků vyšel kolem 28 procent. To lze přibližně interpretovat tak, že se po nasazení změn mezi deseti výsledky na první stránce objeví tři jiné. Ze zkušenosti očekáváme, že se více změn objeví v komerčních dotazech, protože ty jsou konkurenčnější a každá větší změna algoritmů v nich udělá vítr.

Přepis dotazu měníme kvůli tomu, abychom ho mohli do budoucna rozvíjet, a tím vyhledávání dále zlepšovat. Například tak, že k jednomu dotazu poskytneme odpovědi, které zahrnují více různých významů dotazu. Dosavadní verze přepisu dotazu byla na limitu svých možností.

Jako přepis dotazu označujeme soustavu algoritmů, která dotaz zadaný uživatelem upraví do formy, se kterou umí pracovat vyhledávač procházející index. Během přepisu dotazu se například provádí oháčkování, skloňování slov, expanze zkratek a zapojuje se mnoho dalších modulů. Tyto moduly sice necháváme stejné, ale měníme formát jejich komunikace a následné procházení indexu. Interně tuto změnu označujeme jako „grafy a varianty“.