Основные продуктовые метрики

Возврат пользователей (Retention)
25%
Пользователи, вернувшиеся на N-й день (25)Все пользователи, пришедшие в 1-й день (100)
×100%
Конверсия (CR)
10%
Число пользователей, совершивших действие (100)Все пользователи (1000)
×100%
Пожизненная ценность (LTV)
5 000 ₽
Средний чек (500) × Количество покупок за жизнь (10)
Средний доход на пользователя (ARPU)
100 ₽
Общий доход (100 000 ₽)Количество пользователей (1000)
Квартет Эскомба — Анализ графиков

Квартет Эскомба — визуализация и анализ

ПоказательABCD
Среднее X9999
Дисперсия X11111111
Среднее Y7.57.57.57.5
Дисперсия Y4.134.134.124.12
Корреляция (X,Y)0.820.820.820.82
Уравнение регрессииy = 3 + 0.5x
Набор A
Анализ: Данные хорошо ложатся на прямую линию. Это «нормальный» линейный набор, где корреляция действительно отражает зависимость.
Набор B
Анализ: Зависимость нелинейная — данные изгибаются по параболе. Средние и корреляция совпадают, но реальная форма данных совершенно другая.
Набор C
Анализ: Почти все точки выстроены в линию, но одна выброс (outlier) сильно выше других. Он значительно искажает вид графика.
Набор D
Анализ: Почти все точки имеют одинаковое значение X, кроме одной, удалённой далеко вправо. Эта одна точка создаёт ложную корреляцию.
Парадокс Симпсона

Парадокс Симпсона — Анализ по полу

Пол / Параметр Параметр 1 Параметр 2 Больше
Мужчины 50/150 (33.3%) 180/360 (50%) Параметр 2
Женщины 200/250 (80%) 36/40 (90%) Параметр 2
Итого 250/400 (62.5%) 216/400 (54%) Параметр 1
Интерпретация:
В Параметре 2 мужчины и женщины показывают более высокий процент успеха, но при объединении всех блоков (Итого) общий результат Параметра 1 выше из-за большего количества наблюдений. Это классический Парадокс Симпсона, который демонстрирует, что агрегированные данные могут менять выводы по сравнению с раздельными группами.