A/B testy IV: Jak pracujeme s ochrannými metrikami?

23. června 2023 Vyhledávání

V rámci seriálu o A/B testech se tentokrát podíváme na metriky, kterými vyhodnocujeme naše testy. Konkrétně se zaměříme na metriky ochranné, které slouží k tomu, abychom určili, zda je test v kondici pro vytváření závěrů.

Metriky pro A/B testy můžeme rozdělit do několika skupin. Některé z nich reflektují chování uživatelů, jako jsou například kliknutí, čas strávený na stránce nebo průchod procesem zakoupení zboží. Technické metriky zatím sledují rychlost odpovědi stránky nebo výkon potřebný pro zajištění odpovědi. Poslední skupinou jsou metriky samotných testů, jako je třeba SRM (Sample Ratio Mismatch).

Ochranné metriky by měly zajišťovat, že výsledky testu jsou validní a zároveň nedochází k nepřímému zhoršení produktu. Výběr ochranných metrik vždy záleží na produktu i na samotné testované změně. Pro technický tým, pro který je klíčovou metrikou rychlost stránky, může být ochranná metrika například TODO. Na druhou stranu pro tým, který přináší nové funkce do produktu, může mít rychlost stránky jako ochrannou metriku. I přesto, že online produkty mají mnoho podob existuje několik metrik, které lze obecně využít jako ochranné.

Sample Ration Mismatch

Jedná se o stav kdy se v A/B testu nepodaří rozdělit návštěvníky rovnoměrně mezi testovací a kontrolní skupinu. To může vést k neplatným výsledkům A/B testu, protože výsledky nebudou zahrnovat náhodný vzorek celé populace. Pro ověření, zda test netrpí SRM, lze použít online kalkulačku.

V Seznamu jsme při implemntaci nového rozdělování uživatelů do testů omylem zanesli chybu. Při náhodném výběru v úvodní části jsme vybírali uživatelské skupiny 1–1000. Při přidělení uživatele do skupiny ale algroitmus vracel skupiny v rozsahu 0–999. Tím uživatelé ve skupině 0 nikdy nebyli zaneseni do testu a test s vybranou skupinou 1000 měl v jedné variantě o několik procent méně uživatelů. Sledováním metriky SRM se nám podařilo tento problém odhalit.

Čas načtení

Rychlost a responzivita produktu je často opomíjená. Uživateli je přece jen nakonec zobrazeno to, co hledá, jen to možná trvá o sekundu více. Vyhledávač společnosti Miscrosoft vyčíslil, že zrychlení stránky o 100 milisekund zvýšil obrat o 0,6% (v absolutních číslech to znamená nárůst v řádu stovek milionů korun). Zrychlení načtení stránek má dopady i na samotné chování uživatelů.

Existuje několik experimentů, které sledovaly chování uživatelů, když odpovědi produktu byly zpomaleny o několik milisekund. U živatelů například došlo k zpomalení do prvního kliku o dvojnásobek zpomalení produktu.

Chybové odpovědi

Ve složitějších produktech může jedna malá změna na jednom konci kompletně rozbít proces na tom druhém. Je tedy dobré pracovat také s metrikou, která sleduje chybové stavy produktu. V tomto směru stavy mohou být HTTP odpovědi 5XX nebo 4XX nebo interní chyby v produktu v podobě chybových vyjímek. Tyto informace jsou často celkově měřeny týmy provozujícími produkt, ale při A/B testu nejsou všichni uživatelé vystaveni změně, která chyby způsobuje. A proto nástroje, které upozorňují na nárůst chyb, nemusí tak malé navýšení vyhodnotit jako problematické.

V Seznamu všechny výše uvedené metriky využíváme jako ochranné. A v dalším dílu se podíváme na metriky, které využíváme pro zhodnocení, zda test přispěl ke kýženému výsledku, či nikoliv.

Za tým Vyhledávání Tomáš Lála

Sdílet na sítích

Češi si nejvíc vyhledávají dovolené v Egyptě, Řecku a Itálii. Stále víc je láká Albánie

Data ze Seznam.cz Vyhledávání ukazují, že Češi nejvíc vyhledávají dovolenou v Egyptě, Řecku a Itálii. Stále častěji ale hledají inspiraci na dovolenou i v méně tradičních destinacích. Mnohem více je zajímá třeba Albánie, která si v posledních letech získává srdce českých turistů. Podle dat Seznam.cz Vyhledávání za posledních osm let zájem o tuto zemi vzrostl hned o 125 %.

Když se vyhledávač mění v odpovídač. Jak fungují AI sumarizace?

Už více než 10 let internetové vyhledávače postupně mění svou funkci – z tradičního webového rozcestníku se posouvají do pozice zprostředkovatele obsahu s cílem odpovídat na uživatelské dotazy přímo. V Seznamu interně říkáme, že se vyhledávač proměňuje v odpovídač. Jaké kroky podnikáme, abychom tomuto trendu šli naproti, jak fungují naše AI sumarizace a co na to uživatelé?

Buďte v obraze díky sumarizacím ve Vyhledávání

Jak slaví Vánoce v Rakousku a kdy je nejlepší čas navštívit Zanzibar? Už nemusíte brouzdat internetem a pracně získávat informace. Naše Vyhledávání to rádo udělá za vás. Díky nové funkcionalitě sumarizací vám informace poskládá do jedné ucelené odpovědi a ke každé větě transparentně přidá i zdroj. Začínáme pozvolna, ale postupně pokrytí novinky rozšiřujeme.

Zpracování osobních údajů

Za účelem využití služby „Newsletter Seznam.cz” dostupné na internetové adrese (URL) https://blog.seznam.cz (dále jen „Služba“) uživatelem Služby (dále jen „Uživatel“) je společnost Seznam.cz, a.s., IČO 261 68 685, se sídlem Radlická 3294/10, 150 00 Praha 5, provozovatel Služby (dále jen “Provozovatel”) oprávněna zpracovávat osobní údaje Uživatelů (zejména adresné a popisné údaje v rozsahu níže uvedeném), které tito Uživatelé poskytnou Provozovateli v rámci užívání Služby.

Osobní údaje Uživatele budou zpracovány Provozovatelem v nezbytném rozsahu za účelem poskytování Služby, a to zejména za těmito účely:

za účelem zařazení kontaktních údajů do databáze Provozovatelem a za účelem zasílání obchodních nabídek Uživateli ze strany Provozovatele;

za účelem zařazení kontaktních údajů do kontaktů Provozovatele za účelem vzájemné budoucí komunikace Provozovatele a Uživatele.

Takové zpracování osobních údajů je zákonné, jelikož je nezbytné pro splnění smlouvy, na jejímž základě Uživatel užívá Službu, a jejíchž smluvní stranou je Uživatel, jako subjekt osobních údajů.

Provozovatel postupuje při zpracování osobních údajů v souladu s nařízením Evropského parlamentu a Rady (EU) č. 2016/679 o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (obecné nařízení o ochraně osobních údajů, dále jen „nařízení“), zákonem č. 110/2019 Sb., o zpracování osobních údajů, zákonem č. 111/2019 Sb., kterým se mění některé zákony s přijetím zákona o zpracování osobních údajů, zákonem č. 480/2004 Sb., o některých službách informační společnosti, zákonem č. 127/2005 Sb., o elektronických komunikacích a dalšími právními předpisy upravující ochranu osobních údajů.

Podrobnější informace o nakládání s osobními údaji jsou uvedeny na internetových stránkách Provozovatele, a to v příslušné sekci.