Диагностика рядов · Hyndman FPP §2.6–2.8

Скрытые связи в payin — и что они значат для прогноза

Scatterplot-матрицы, lag-plot и ACF по дневному payin (P2P / Intent / портфель). Цель — понять структуру данных до выбора модели: есть ли общий фактор, сезонность, предикторы.

данные с 2025-01-01 · лог-шкала для со-движения · 6 топ-мерчантов на рельс

Что нашли — три вывода

1
Потолок точности низкий, но структура есть. Payin near-random-walk (r₁ = 0.98), однако первая разность формально НЕ белый шум (LB p≈0.001) — слабый остаточный сигнал. Внешние предикторы (weekend/IPL) его не пробивают; naive не используем.
2
Недельной сезонности нет. В lag-plot и ACF нет всплеска на лаге 7 → season_length=1 корректно. Weekend влияет на потери, но не на уровень payin (r = −0.01).
3
Intent неоднороден — контрарный MPM. Кластер KPMI/KOW/MOXB/MLBT со-движется (0.76–0.90), но MPM Intent движется против (r −0.18…−0.24). Он загрязняет Intent-агрегат → корень провала верификации Intent_total.
§2.6 · Scatterplot matrix

P2P: мерчанты со-двигаются

P2P scatterplot matrix

Что видно

Облака вытянуты по диагонали, все корреляции зелёные 0.54–0.94 (MPP↔MRJB 0.94, ORBIT↔KOW 0.81). Общий фактор спроса.

Что значит для прогноза

Пиры P2P реально со-двигаются — synthetic-control и top-down оправданы. (Ранее на сырой шкале я видел 0.07 — это был артефакт доминирующего мерчанта; лог-шкала вскрыла истинную связь.)

§2.6 · Scatterplot matrix

Intent: кластер + один контрарный

Intent scatterplot matrix

Что видно

Тугой кластер KPMI/KOW/MOXB/MLBT (0.76–0.90), но строка/столбец MPM Intent — красные корреляции, облако наклонено вниз: движется в противофазе.

Что значит для прогноза

Это «Northern Territory» из Hyndman — серия с обратной динамикой. Агрегат Intent мешает противоположные сигналы → вынести MPM отдельно, это может починить Intent_total (провал верификации: bias −15%, coverage 60%).

§2.6 · Payin vs predictors

Предикторы: только лаг силён

payin vs predictors

Что видно и что значит

vs lag-1 — тугая диагональ r=0.98 (near-random-walk). · vs IPL — облака non-IPL и IPL почти совпадают r=0.13 (слабый лифт уровня). · P2P vs Intent — рыхлое положительное облако r=0.56 (общий портфельный фактор, но с разбросом). Вывод: dynamic regression с weekend/IPL не поможет — необъяснённой дисперсии нет.

§2.7 · Lag plot

Персистентность без недельного узора

lag plot

Что видно

Все лаги 1–14 дают тугую диагональ (r 0.9+). Цвета дней недели перемешаны вдоль диагонали, лаг 7 не выделяется и не разрыхляется.

Что значит для прогноза

Сильный тренд/персистентность, но нет недельной сезонности (в пивном примере Hyndman лаг 4 выделялся — у нас аналога нет). Подтверждает season_length=1.

§2.8 · ACF / коррелограмма

Медленный спад = тренд, без «фестонов»

ACF correlogram

Что видно

ACF высокий и медленно спадает с лагом (r₁≈0.9+), значимо выше границы ±1.96/√T. Пунктиры на кратных 7 (недельных) лагах не дают всплесков — нет «scalloped» узора сезонности.

Что значит для прогноза

Классика тренд-доминированного ряда без сезонности (Hyndman §2.8): медленный спад = тренд, отсутствие пиков на лаге 7/14 = нет недельного цикла. Модель = тренд-tracking (EWMA/ARIMA), сезонная компонента не нужна.

§2.9 White noise · §3.1 Transform

Остатки не идеально чистые — и данные хотят Box-Cox

white noise residual ACF

Что видно

Ljung-Box по первой разности: p ≈ 0.001 (везде <0.05) → разности НЕ белый шум, остаётся слабая структура. Но при T≈500 тест сверхчувствителен — «значимо» ≠ «практически полезно». Guerrero λ = 0.30–0.45.

Что значит для прогноза

Payin — не чистый random-walk (структура есть, хоть и слабая), поэтому naive не нужен. И λ≈0.35 > 0 → дисперсия растёт с уровнем: Box-Cox(λ≈0.35) стабилизирует её (§3.1) → проще паттерн, потенциально точнее. Конкретное улучшение пайплайна.

Итог для прогноза. Ряд payin — тренд-доминированный near-random-walk без недельной сезонности, поэтому потолок точности низкий (модели близки), внешние предикторы его не пробивают, naive не используем. Два улучшения из анализа: (1) Box-Cox(λ≈0.35) для стабилизации дисперсии (§3.1); (2) вынести контрарный MPM Intent из агрегата — поднимет достоверность Intent_total. Метод: Hyndman Forecasting: Principles and Practice (3rd ed), §2.6–2.9, §3.1.