5. 9. 2011

Našeptavač: osm vylepšení

Našeptavač prošel v posledních týdnech důkladnou revizí. Oproti předchozí verzi obsahuje osm významnějších vylepšení a rozšíření.

Za zmínku stojí rovněž rozšíření databáze našeptávaných dotazů, kterou jsme provedli před několika týdny. Oproti předchozí verzi je pětinásobná. Nyní ale konkrétně k jednotlivým vylepšením.

  1. Jak se to správně píše? Raiffaissen? Reifaisen? Raifaizen?
    V našeptavači je implementována korekce chybně psaných dotazů. Pokud do něj vepisujete nekorektní tvar určitého slova, například s fonetickou chybou, je vám nabídnuta korektní varianta. Tento dotaz je oproti ostatním dotazům zvýrazněný. Kromě výše uvedených příkladů můžete vyzkoušet dotazy vhirpul, alianz, tv barandov.
  2. Boldování dotazů
    Pro zrychlení orientace v našeptávaných dotazech ztučňujeme části dotazů, které se liší od zadaného uživatelského dotazu.
  3. Levostranné našeptávání
    Předchozí verze našeptavače dokázala rozšiřovat dotaz pouze doplňováním dalších slov zprava od napsaného textu. Pro určitou množinu dotazů je ale přirozenější rozšiřovat slova doleva, proto se pro ně zobrazují ve spodní části našeptavače i levostranná rozšíření zadávaného dotazu. Vyzkoušejte zadat třeba slova bábovka, budějovice, chorvatsko.
  4. Korektní našeptávání navigačních dotazů
    Uživatelé často zadávají do vyhledávání doménová jména v nekorektních tvarech (např. idnes.cz, i dnes cz, i dnes.cz). Našeptavač se snaží tyto nekorektní formy detekovat, opravit a nabízet pouze korektní tvary.
  5. Zohlednění diakritiky
    Velká skupina uživatelů nezadává dotazy s diakritikou. Důvodů může být mnoho. Pro nás to ale znamená, že pokud uživatel při psaní dotazu nezadal žádné písmeno s diakritikou, tak při našeptávání nabízíme dotazy jak s, tak bez diakritiky. Pokud ale uživatel vepisuje dotaz s diakritikou, je při našeptávání zohledněna. Pro nalezení dotazu „přání“ zkuste zadat „pra“ a „přá“.
  6. Nenašeptáváme telefonní čísla
    Nechceme našeptávat dotazy, které mají osobní charakter. Pokud jste dříve zadali do našeptavače například 775, nabídly se vám vyhledávaná telefonní čísla. Uhodnete, o jaký druh telefonních čísel měli uživatelé největší zájem?
  7. Seskupování dotazů
    Pro lepší orientaci seskupujeme našeptávané dotazy podle prvních slov. Pro vyzkoušení třeba dotaz „če“.
  8. Našeptávání znaků +, -, &
    Není co dodat, vyzkoušejte dotazy „c&a“, „byt 3+1“, „t-mobile“.

Vylepšený našeptavač je dostupný na http://searchtest.seznam.cz/. Doufáme, že tyto změny povedou k zadávání širších, kvalitnějších a různorodějších dotazů.

Pokud máte nápady, jak ještě lépe vylepšit našeptavač, nebo pokud mátě nějaké připomínky k výše uvedeným změnám, napište je do diskuse pod článkem. I když výše popsané změny jej pomohly  značně vylepšit, práce na zlepšení nekončí.