콘텐츠로 이동

v10 reporter

v10 Phase 종합 보고서 — VQ Multi-Model Ablation Negative Result

Source: report/version10/reporter/v10-05_phase_summary.md

v10 Phase 종합 보고서: VQ Multi-Model Ablation의 Negative Result

0. Executive Summary

v10 phase는 ADR-010에 의거하여 4종 (모델 × VQ 구조) 조합 — NBEATSx+DecompCB (E1), NHITS+FreqBand (E2), SCINet+RQ (E3), Crossformer+PQ (E4) — 의 정합성을 평가하기 위해 설계되었다. 50가구 in-fed split (7:1:2)에서 19개 모델 (Phase1 7 Local baseline + B0~B4 5 baseline + 4 VQ + 4 VQ_simple = 20 중 가용 19) 의 동시 비교를 수행한 결과, 다음 4가지가 확인되었다:

  1. VQ 4종 모두 baseline FedAvg 대비 PAPE 점추정 악화 (E1 +8.63, E2 +40.31, E4 +25.78; E3는 noVQ baseline 부재).
  2. Codebook collapse가 4 모델 모두에서 동시 발생 (E1 9.14%, E2 5–7%, E3 26.54%, E4 sub_3/4 12–14%) — 모델 변경만으로는 V4/V5에서 관찰된 collapse 회피 불가능.
  3. ADR-010의 핵심 가설 H10-1~5 모두 FAIL 또는 검정 불가:
  4. H10-1 (E2 high-freq peak): broad-based collapse로 강한 FAIL
  5. H10-2 (E1 trend anchor): drift metric 미로깅 → 검정 불가 → Watch (사후성 정의 비고)
  6. H10-3 (E3 RQ collapse 회피): util 26.54% << 50% threshold → FAIL
  7. H10-4 (E4 PQ cold-start): cold-start 평가 미실행 → NOT_TESTED
  8. H10-5 (정합성): seed=42 단일 → 통계 검정 불가
  9. Simple ablation (C/M 모두 제거) 6변수 묶음이라 component 분리 불가. E2_simple은 PAPE만 보면 본판 대비 개선되었으나 다축 검증 (MSE 1.40, std_ratio 0.066, corr -0.003, best_round=0)으로 "더 극단적 단조 상수 collapse" 로 판정.