12. 10. 2011

Odpovídač praktických dotazů (1)

V produkčním hledání je nasazena nová komponenta, která dokáže odpovídat na vybranou množinu praktických dotazů. Stručná odpověď na dotaz je zobrazena přímo na stránce s výsledky vyhledávání. Pro snadné rozpoznání je odpověď uvozena ikonou žárovky.

V současné době jsme vytvořili podporu pro 8 oblastí, které uživatelé často dotazují a po vyhledavači požadují rychlou, stručnou a přesnou odpověď. Jedná se o tyto oblasti:

Počet uvedených oblastí není konečný a hodláme jej v brzké době rozšiřovat. Pokud máte tip na oblast, která může být pro uživatele zajímavá, vepište ji do diskuse pod článkem. Pokud to bude možné, vytvoříme pro ni podporu.

Z technologického hlediska je odpovídač praktických dotazů vybudován nad relační databází. Data každé oblasti jsou reprezentovány jednou relační tabulkou. Například tabulka pro telefonní předčíslí států obsahuje 5 atributů – název státu česky, název státu anglicky, název kontinentu česky, předvolba státu. Každá tabulka má definovanou vyhledávací strategii, ve které jsou určeny sloupce pro vyhledávání, sloupce pro výpis odpovědi uživateli, věta, která se navrací uživateli včetně formátování.

Rozšířit odpovídač o další oblast znamená vytvořit další tabulku, naplnit jí daty a nadefinovat vyhledávací strategii. Poměr vynaložené práce na realizaci komponenty odpovídače a přidané hodnoty pro uživatele, kterou tímto získá, je hodně příznivá.

Definici vyhledávací strategie stěžuje množství možných způsobů zápisu dotazu. Například dotaz „mezinárodní předvolba Velká Británie“ může uživatel zapsat také jako „mezinárodní předvolba Velké Británie“ (změna pádu) nebo „předčíslí Anglie“. Obdobně, dotaz „předvolba +44“ může být zapsán například jako „telefonní předvolba 0044“. Při realizaci odpovídače jsme vytvořili podporu pro většinu možných forem dotazů.

Při odpovídání se snažíme uživateli dodat stručnou a přesnou odpověď. Odpověď vydáme pouze tehdy, když jsme si jisti, že jsme úplně pochopili dotaz zadaný uživatelem. V technologické řeči to znamená, že se nám podaří v konkrétní relační tabulce identifikovat na základě dotazu daný záznam (nebo záznamy) a daný atribut. Vymezené buňky jsou poté odpovědí na uživatelský dotaz. Mohou nastat situace, kdy pro jeden dotaz navrátíme více než jednu odpověď; to nastává zejména v případě dotazování se na PSČ.

Pokud narazíte na fráze, na které nyní nereagujeme a měli bychom, dejte nám vědět v diskusi ke článku. Pokud to bude možné, tak odpovídač o danou frázi rozšíříme.