23. 4. 2008

Oprava překlepů v dotazech

Oprava překlepů ve fulltextovém hledání Seznamu — k vyzkoušení na testovací verzi

Do řady “features” fulltextového hledání na Seznamu přibývá další novinka – oprava překlepů v dotazech 🙂 Nasazena je zatím první verze algoritmu na searchtest.seznam.cz, v krátké době můžete ještě očekávat drobné změny.

Význam opravy je jasný — například pro dotaz piza Koloseum nabídne

Opravy se počítají plně automaticky na základě toho, co uživatelé sami opravují. Nejde tedy o “ruční slovníky” slov, která jsou nebo nejsou mluvnicky správně. Z toho plyne jednak to, že se opravují i “nečeská” slova, a dále to, že se algoritmus může mýlit — zvláště u vysoce specializovaných dotazů. Při opravách se proto snažíme být pokud možno konzervativní, hlavně u krátkých dotazů. Třeba co myslíte – je dotaz fizyka překlep? Na první pohled ano, ale přesto existují stránky (a jazyky), kde je toto slovo korektní a úmyslné. A takových slov jsou spousty. Jinak řečeno, z jednoho slova je nemožné vyvodit, co přesně chtěl uživatel hledat, a proto opravu často nenabízíme. Oproti tomu při datazu gravitace fizyka už je kontext jasný a opravátor nabízí

Podobně můžete srovnat výsledky opravy:

Doufáme, že Vám bude tato dlouho očekávaná 😉 funkcionalita k užitku a zpříjemní Vám hledání. Jde o první verzi systému, Vaše připomínky a podněty jsou pochopitelně vítány.