Scatterplot-матрицы, lag-plot и ACF по дневному payin (P2P / Intent / портфель). Цель — понять структуру данных до выбора модели: есть ли общий фактор, сезонность, предикторы.
r₁ = 0.98), однако первая разность формально НЕ белый шум
(LB p≈0.001) — слабый остаточный сигнал. Внешние предикторы (weekend/IPL) его не пробивают;
naive не используем.season_length=1 корректно. Weekend влияет на
потери, но не на уровень payin (r = −0.01).Облака вытянуты по диагонали, все корреляции зелёные 0.54–0.94 (MPP↔MRJB 0.94, ORBIT↔KOW 0.81). Общий фактор спроса.
Пиры P2P реально со-двигаются — synthetic-control и top-down оправданы. (Ранее на сырой шкале я видел 0.07 — это был артефакт доминирующего мерчанта; лог-шкала вскрыла истинную связь.)
Тугой кластер KPMI/KOW/MOXB/MLBT (0.76–0.90), но строка/столбец MPM Intent — красные корреляции, облако наклонено вниз: движется в противофазе.
Это «Northern Territory» из Hyndman — серия с обратной динамикой. Агрегат Intent мешает противоположные сигналы → вынести MPM отдельно, это может починить Intent_total (провал верификации: bias −15%, coverage 60%).
vs lag-1 — тугая диагональ r=0.98 (near-random-walk). ·
vs IPL — облака non-IPL и IPL почти совпадают r=0.13 (слабый лифт уровня). ·
P2P vs Intent — рыхлое положительное облако r=0.56 (общий портфельный фактор, но с разбросом).
Вывод: dynamic regression с weekend/IPL не поможет — необъяснённой дисперсии нет.
Все лаги 1–14 дают тугую диагональ (r 0.9+). Цвета дней недели перемешаны вдоль диагонали, лаг 7 не выделяется и не разрыхляется.
Сильный тренд/персистентность, но нет недельной сезонности
(в пивном примере Hyndman лаг 4 выделялся — у нас аналога нет). Подтверждает season_length=1.
ACF высокий и медленно спадает с лагом (r₁≈0.9+), значимо выше границы ±1.96/√T. Пунктиры на кратных 7 (недельных) лагах не дают всплесков — нет «scalloped» узора сезонности.
Классика тренд-доминированного ряда без сезонности (Hyndman §2.8): медленный спад = тренд, отсутствие пиков на лаге 7/14 = нет недельного цикла. Модель = тренд-tracking (EWMA/ARIMA), сезонная компонента не нужна.
Ljung-Box по первой разности: p ≈ 0.001 (везде <0.05) →
разности НЕ белый шум, остаётся слабая структура. Но при T≈500 тест
сверхчувствителен — «значимо» ≠ «практически полезно». Guerrero λ = 0.30–0.45.
Payin — не чистый random-walk (структура есть, хоть и слабая), поэтому naive не нужен. И λ≈0.35 > 0 → дисперсия растёт с уровнем: Box-Cox(λ≈0.35) стабилизирует её (§3.1) → проще паттерн, потенциально точнее. Конкретное улучшение пайплайна.