콘텐츠로 이동

ADR-010: v9 Baseline Extension → v10 Multi-Model VQ × Structured Codebook × Peak-Specialized FL

상태: Accepted (2026-04-25)

맥락

선행 Phase 학습점

v6~v9 전체 phase에서 다음 사실이 축적되었다.

  1. VQ codebook이 collapse(util 3~6%)해도 PAPE는 개선된다 (ADR-009 archive의 V4/V5 데이터) → codebook은 정보 채널보다 regularizer에 가깝다.
  2. 모델 아키텍처가 peak 예측 성능의 주요 driver:
  3. v6 NF-baseline NHITS PAPE 39.26 (seed=42)
  4. v9-06 NBEATSx PAPE 점추정 1위 34.58 (n=15, 95% CI [30.71, 38.46]) — 통계적으로 R1b / N-HiTS와 구별 불가하나 점추정 기준 20-model 1위
  5. v9-06 SCINet Watch PASS (PAPE 42.35 / HR@1 34.48), MSE 20-model 1위 (0.498)
  6. FL + Peak-Weighted Loss + 개인화 경로(R1b)의 시너지로 v6 R1b가 FedPM+DLinear 조합에서 PAPE 37.36 달성
  7. Memory Alignment 단독으로는 collapse 방지 실패 (v8 V4/V5, ADR-008/009)
  8. decomposition+attention 계열 (Autoformer/Informer/FEDformer/Pyraformer/Crossformer)은 peak 축 구조적 약점:
  9. v9-05 Transformer 3종 PAPE 52-53 전수 FAIL
  10. v9-06 TSLib 2종 (Pyraformer/Crossformer)도 FAIL 재현

v9-05/v9-06 결론 (관련 reporter: report/version9/reporter/v9-05_baseline_ext_summary.md, report/version9/reporter/v9-06_baseline_ext_2_summary.md)

  • H9-6a Strict FAIL: 20-model 전수 PAPE ≤ 43 AND HR@1 ≥ 37 미충족 (B1이 HR@1 0.08pp 차로 최근접)
  • VQ 후보 잠정 선별: SCINet (hierarchical SCI-Block) + NBEATSx (basis expansion) 2종 — "VQ backbone 확정"이 아니라 "VQ 이식 실험 진입 자격 최초 획득" 수준
  • 사용자 결정 필요 사항 4건 중 #1 VQ 이식 실험 착수를 채택

전환 필요성

v9 baseline extension은 "DLinear 대체 VQ-친화 backbone 탐색"이 목표였다. v9-06에서 후보 2종(SCINet/NBEATSx) + 추가 검증 가치 있는 2종(NHITS/Crossformer)을 확보했으므로, backbone 탐색 phase를 종료하고 VQ 이식 phase로 전환한다.

결정

v10 새 phase 정의

Multi-Model VQ × Structured Codebook × Peak-Specialized FL

모델 아키텍처의 귀납 편향을 VQ 구조에 이식하여 collapse 없이 peak 특화 FL을 달성한다. 각 모델의 자연스러운 블록 분해를 codebook 축으로 매핑:

실험 Backbone VQ 전략 근거
E1 NBEATSx Decomposition Codebook (3 CB: trend/seasonal/generic) basis expansion stack 분리
E2 NHITS Frequency-Band Codebook (3 CB: low/mid/high-freq) pooling-kernel hierarchy
E3 SCINet Residual Quantization (3 level × M=32) SCI-Block binary tree
E4 Crossformer Product Quantization (4 sub × M=16) DSW embedding + TSA seg

계승 사항 (v9에서 v10으로)

  • MLflow 로깅 규약: EpochMLflowCallback 패턴 + per-epoch train_loss/val_loss 강제 (v9-06 Critical C1 해결분)
  • VQ 후보 선별 근거: v9-06 결과 (SCINet Watch PASS, NBEATSx PAPE 점추정 1위)
  • Peak-Weighted Loss α=2.0: v6 R1b 설정 계승
  • Memory Alignment γ=0.95 / δ=0.7: v8 ADR-008 설정, 발산 시 γ=0.8 rollback 옵션
  • 집계 프로토콜: 5-apt per-household 평가 → v10에서 100가구 풀로 확장
  • Gating 기준: Strict (PAPE ≤ 43 AND HR@1 ≥ 37) 유지. Watch 는 v10에서 재정의 필요 (v9-06 Major 1 지적)

폐기 사항

  • v9 baseline 탐색 트랙 종료: 추가 NF/TSLib 모델 평가는 future work. v9-05/06은 superseded로 전환
  • ETSformer: TSLib 소스 CUDA device mismatch로 SKIP 상태. v10에서 재시도 안 함 (구조상 peak smoothing 계열로 분류)
  • v9-05 Autoformer/Informer/FEDformer + v9-06 Pyraformer/Crossformer single-track: attention + decomposition 계열 FAIL 재현 확립, v10에서 E4(Crossformer+PQ)만 다변량 sub-code 가설로 재도전
  • DLinear + VQ (v6 R1b 포함): ADR-009 near-collapse 교훈. B3 (v6 R1b 재현) 재학습 생략, 기존 MLflow 기록 인용만

v10 phase 설계 파라미터 (user 승인 2026-04-25)

항목 변경 근거
데이터 UMass Smart Home 100가구 (기존 EC50 = Energy Community 50가구의 확장) 기존 데이터 소스 일치 확인
Train/Cold split 50/50 원안 70/30에서 변경, cold-start 검증력 강화
Seeds {42} 단일 (1차), 확장은 결과 관찰 후 결정 원안 3-seed에서 축소, wall-clock 절약 우선
외생변수 미사용 (단변량 통일) E1~E4 공정 비교, H10-2 재작성 (trend basis 자체가 alignment anchor)
베이스라인 재학습 전체 스킵 v9-01/v9-06 recap 인용, B0/B1/B2/B3 신규 실행 없음
Per-epoch 로깅 강제 CLAUDE.md 규약 + v9-06 EpochMLflowCallback 계승
Cold unfreeze Ablation 항목 등록 Future work
병렬 실행 exp-expert 4명 병렬 dispatch + 실험 subprocess 4개 병렬 (GPU 공유 OOM 시 순차 fallback) 단일 RTX 5070 Ti 제약 하 최대 병렬화

가설 H10-1~H10-5

ID 가설 검증 기준
H10-1 NHITS + Frequency-band CB 에서 high-freq CB 가 peak 정보 집중 PAPE < B0 (42.51), high-freq CB util > 50%
H10-2 NBEATSx + Decomp CB 에서 trend block basis expansion 자체가 alignment anchor (외생변수 없음) round-wise alignment drift 감소
H10-3 SCINet + RQ 가 같은 통신량으로 collapse 회피 전체 CB util > 50%, MSE ≤ B0 (0.515)
H10-4 Crossformer + PQ 가 sub-space 분할로 cold-start 성능 우수 50가구 cold-start PAPE 최선
H10-5 모델 아키텍처 × VQ 구조 정합성 유의미 4 조합 중 정합이 비정합보다 PAPE 낮음

귀결

긍정적

  • v9 baseline 탐색에서 얻은 정량 근거(점추정 PAPE/HR@1 순위, 구조 카테고리 패턴)를 다음 단계 VQ 이식의 baseline으로 활용 가능
  • 4 모델 × 4 VQ 전략 설계가 구조적으로 자연(각 모델의 분해 공간 ↔ codebook 축) → 각 조합의 성공/실패가 "구조 정합성" 명제의 증거/반증으로 해석 가능
  • Peak 특화 FL을 단일 아키텍처가 아닌 아키텍처 간 비교로 접근 → 논문의 main contribution 확장

부정적/Open risks

  • SCINet/Crossformer 포팅 비용: v9-06에서 src/tslib/ THUML 버전 이미 통합했으나, FL trainer 호환성 재확인 필요
  • 단일 seed(42) 의사결정: H10-5 (정합성 유의미) 검증에 통계적 근거 약함. 3-seed 확장 여부는 1차 결과 관찰 후 ADR-010-addendum으로 보강
  • Cold-start 50가구의 UMass 풀 분포: 50가구 hold-out이 seen 50가구와 분포 동질 여부 사전 검증 필요 (KL-divergence 또는 load profile clustering)
  • ADR-009 DLinear+VQ near-collapse 재발 위험: 4 모델 × VQ 이식 중 하나 이상이 collapse할 가능성. Stage 2 smoke에서 util < 20% 시 자동 alert

문서 전환

  • v9 baseline extension track: v9-05/v9-06 관련 project_state/ 문서를 superseded로 전환 (해당 문서 존재 시)
  • v9 관련 TODO: todos/archive/로 이동
  • 새 v10 track TODO: todos/track-g_v10_multi_model_vq.md 생성

참조 문서

  • 선행 ADR: docs/decisions/ADR-008_v7_to_v8.md (Memory Alignment 원형), docs/archive/decisions/ADR-009_v8_to_v9_vq_redesign_archived_2026-04-21.md (DLinear+VQ collapse 기록)
  • 선행 reporter: report/version9/reporter/v9-05_baseline_ext_summary.md, report/version9/reporter/v9-06_baseline_ext_2_summary.md
  • v10 초안 설계: report/version10/lab-leader/v10-01_fl_aspect.md (작성일 2026-04-25, 본 ADR 승인 후 exp-designer 정식 설계서로 승격)
  • v10 정식 설계서 예정 위치: report/version10/lab-leader/v10-02_vq_multi_model_design.md (또는 exp-designer 산출물)
  • 참고 논문: Oreshkin et al. 2019 (NBEATS), Challu et al. 2022 (NHITS), Liu et al. NeurIPS 2022 (SCINet), Zhang & Yan ICLR 2023 (Crossformer), Jégou et al. 2011 (PQ), Lee et al. CVPR 2022 (RQ-VAE)