ACM SIGIR (Special Interest Group on Information Retrieval) je konference, která se zabývá pořízením, organizací, ukládáním, vyhledáváním a šířením informací – a to všechno z teoretického a praktického pohledu.
Tento rok se konference konala v krásném malém městečku Ann Arbor ve státě Michigan.
Chris Manning (Stanford)’s SIGIR keynote:
“I’m certain that deep learning will come to dominate SIGIR over the next couple of years … just like speech, vision, and NLP before it.”
Téma neuronových sítí tentokrát určitě dominovalo nad ostatními. Řešily se především možnosti a cesty používání NN (Neural Network) v doporučování a vyhledávání (např. jak překonat tzv. semantic gap).
Dalším velkým tématem bylo vysvětlování modelů strojového učení. K tématu přišly otázky typu: „Proč model (lesy nebo neuronové sítě) rozhodnul tak, a ne jinak? Jaké vlastnosti to ovlivnily nejvíce? Máme doporučovat nejpopulárnější věci (hudba, články) nebo více diverzifikovat?“
Dalšími zajímavými tématy bylo:
– jak pracovat s omezenými či zašumělými daty
– pseudo-relevance feedback
– optimalizace vyhodnocování lesů (random forest) pro rankování
Přišlo nám, že komunita vědců a lidé z praxe často řeší odlišné problémy, nicméně tyto 2 světy nemůžou existovat úplně separátně a proto bychom měli více spolupracovat s různými instituty, především školami.
Bylo nám ctí potkat se s mnoha lidmi z oboru z jiných zemí. Zároveň nám všem přišlo, že ve fulltextu řešíme věci obdobně jako ostatní firmy ve světě.