콘텐츠로 이동

Exp6 Phase 3b: DLinear Residual 결과 보고서

  • 실험: FeDPM + DLinear Residual Path
  • 날짜: 2026-04-15
  • 스크립트: experiments/distillation/v6_0415_fedpm_original.py --phase 3b

1. 실험 설계

가설

VQ path(FL 공유)가 공통 패턴을 잡고, DLinear(로컬 유지)가 가구별 고유 패턴을 보정하면 PAPE가 개선될 것이다.

구조

y_hat = y_vq (VQ path, FL codebook 기반, 공통 패턴)
      + y_dlinear (DLinear path, 로컬 전용, 가구별 개인화)
  • VQ path: 원본 FeDPM (Encoder → PMR → Decoder), lr=1e-5
  • DLinear path: Series Decomposition → Linear(96→24), lr=1e-6 (VQ의 1/10)
  • DLinear 추가 파라미터: 4,656 (총 모델의 0.4%)
  • Peak-Weighted Loss: alpha=2.0, beta=2.0

2. 결과

Apt P1 MSE R1b MSE P1 PAPE R1b PAPE P1 HR R1b HR
Apt6 0.801 0.908 39.59 38.55 21.9 21.8
Apt15 0.180 0.183 38.67 36.62 18.6 17.3
Apt30 0.095 0.110 45.75 41.42 27.9 21.4
Apt51 0.678 0.861 47.92 35.43 46.7 28.0
Apt88 0.962 1.064 41.44 39.95 23.7 22.9
Mean 0.543 0.625 42.67 38.40 27.8 22.4

3. 핵심 발견

PAPE 전 가구에서 개선

  • 평균 PAPE: 42.67% → 38.40% (-4.27%p)
  • 최대 개선: Apt51 -12.49%p (47.92% → 35.43%)
  • 최소 개선: Apt6 -1.04%p

MSE는 악화

  • 평균 MSE: 0.543 → 0.625 (+0.082)
  • MSE-PAPE 트레이드오프가 명확히 존재

HR 하락

  • 평균 HR: 27.8% → 22.4% (-5.4%p)
  • DLinear가 피크 크기를 더 정확히 맞추지만(PAPE↓), 피크 시점(HR)은 오히려 부정확

4. Phase 3a (MLP Residual)와 비교

Residual 유형 MSE PAPE HR 판정
없음 (P1) 0.543 42.67% 27.8% 기준
MLP (R1) 0.539 45.70% 28.5% FAIL (PAPE 악화)
DLinear (R1b) 0.625 38.40% 22.4% PASS (PAPE 최선)

MLP는 RevIN 후 피크 정보 소실로 평균 보정만 학습 → 피크 smoothing. DLinear는 원본 입력을 직접 받아 trend/seasonal 분해 → 가구 고유 피크 패턴 보정 가능.

5. 의의

  • PAPE 38.40%는 전체 Exp6 중 최선 (NHITS 39.73%도 능가)
  • VQ(공통) + DLinear(개인화) 역할 분담 구조의 유효성 확인
  • 다만 MSE 악화(+15%)는 비피크 구간 정확도 희생을 의미 → 실용적 trade-off 검토 필요