29. 8. 2011

Aktuálně připravovaná oprava vyhledávače

V tomto příspěvku vám představím právě připravovanou opravu, která zvýší relevantnost výsledků na určité typy dotazů.

Možná jste zaregistrovali, že na určité typy dotazů vracíme tématicky naprosto odlišné typy výsledků, než které by se daly očekávat. Problémy nám v současné době dělají dotazy, které mají v původním tvaru více lemmat, případně mají ve svém expandovaném tvaru lemma naprosto odlišné, nebo mají jiný význam, který je natolik častý, že naprosto vytlačí správné výsledky původního dotazu.

Problémovým slovem je například slovo kosa, které má dvě lemmata:

  1. kosa (žací nástroj)
  2. kos (kos černý)

Lemma kos má tvar kosa ve svém druhém pádu jednotného čísla. Největším problémem je to, že kos je také odháčkovaný základní tvar slova kós.

Jak jistě víte, všechny vyhledávače již umí slova skloňovat. V našem případě se slovo kosa expanduje například do těchto tvarů:

Je vidět, že se mezi expandovanými tvary slova kosa nachází také tvar kos. Právě toto slovo způsobuje v současné době problémy v relevanci vrácených výsledků, což si můžete sami vyzkoušet.

Tento problém se dá vyřešit několika způsoby, kterým se v současné době věnujeme a v brzké době se můžete těšit na jejich nasazení minimálně do testovacího provozu. Budeme rádi, pokud nám pošlete další dotazy, které způsobují stejný problém tohoto typu.