Теперь, когда мы разобрались с искажениями, давайте пройдемся по способам, которые позволяют этих искажений избегать.
1️⃣Чтобы провести корректный тест, нам нужны 2 абсолютно идентичные группы пользователей. Самый простой способ убедиться, что группы не отличаются между собой — провести АА-тест.
Если группы распределяются равномерно по кол-ву пользователей/сессий и ведут себя одинаково, запускаем основной тест. Ну, а если нет, внимательно изучаем каждую группу, чтобы найти проблему.
2️⃣Не менее важная часть АБ-тестирования — это проверка готовых данных перед их анализом. Часто на этом этапе вылазят аномалии, ошибки и «слоны».
Типичный пример ошибки — это запуск двух АБ-тестов параллельно. К примеру, одновременные эксеприменты с поисковой выдачей и чекаутом. Оба элемента влияют на конверсию, и могут влиять друг на друга. Это может исказить результаты тестирования.
3️⃣Нельзя останавливать АБ-тест до достижения статистической значимости. То есть, такого количества накопленных событий (конверсий), при котором результаты не будут случайными.
Это правило общеизвестно, но им часто пренебрегают. На всякий случай делюсь простым
калькулятором АБ-тестов. Он помогает понять, являются ли результаты теста статистически значимыми, или нужно подождать.