종합 판정: CONDITIONAL REJECT (실질 개선 3건, 해결 위장 4건, 악화 1건, 신규 결함 4건). v2는 v1 대비 문서 수준에서는 대폭 개선됐으나, 논리 구조 수준에서 Branch E 발동 불가라는 치명적 결함이 새로 발생함. Workshop 제출(D+7)을 Branch 판정 미결 상태로 강행하게 만드는 구조적 모순이 존재함.
v2는 v1의 HARKing 구조와 175-runs workload overrun에 대해 다섯 가지 표면 지표에서 개선을 보였다. Branch E 신설, Branch D 대칭화, 초록 강화 조항 삭제, Tier 1a/1b 분할, γ ≤ 0.95 상한이 그것이다. 이 중 초록 강화 조항 삭제(C5)와 γ 상한(M3)은 실질 해결로 판정한다. Branch 5분기 대칭화(C1, H2)도 문서 수준에서 대칭을 확보했다.
exp-critic 적대적 검토 결과 REJECT (현 6단계 그대로) → 단계 0.5 Vertical Slice Smoke Test 삽입 시 CONDITIONAL PASS. 본 문서는 5건의 Critical 사각지대(silent NaN, PAPE dual definition, scaler leakage, figure 비재현성, paired seed 깨짐)를 단계 0.5 + per-run fail-fast hook + 단계 1 early checkpoint 의 3-layer 안전망으로 차단한 재설계안.
v2 보고서(v6_0418_fl_baseline_critique.md)는 "선택지 B(Peak Loss 단독 논문)로 전환"을 권고했다.
그러나 사용자가 아래 초록을 변경 불가 확정 상태로 전달했다. 초록은 명시적으로 FL framework 논문으로 포지셔닝된다.
Accurate peak load forecasting is critical to power system operation, but household-level forecasting remains difficult due to load variability. Since consumption data are privacy-sensitive, federated learning (FL) offers a natural framework for collaborative modeling without centralized data collection.
We propose a peak-aware FL framework with two components: (i) a peak-weighted SmoothL1 loss that emphasizes peak-time samples during training, and (ii) a dual-path architecture that combines a shared vector-quantized (VQ) codebook for federated pattern exchange with a lightweight DLinear residual for per-household personalization. We evaluate models using PAPE (Peak Absolute Percentage Error) and HR (Hit Rate), metrics tailored to peak-region accuracy.
Across a broad set of baselines, the proposed model achieves the best peak accuracy, reducing PAPE by 9.8% relative to local-only training. Notably, our 4.6K-parameter model surpasses a 50M-parameter foundation model, showing that loss design and personalization outweigh model scale for household peak forecasting under privacy constraints.
[2026-04-19 전환 노트] 이 문서(v3)는 보존됨. 후속 계획은 todos/track-e_vq_codebook_research.md로 발전됨.
v3의 통계 요건(5-seed, Wilcoxon, bootstrap CI), Branch A/B/C/D 구조, Claim rollback 조건 테이블은 track-e에 전면 계승됨.
핵심 변경: Branch D의 의미가 "VQ 포기"에서 "Vanilla VQ 한계 입증 + 개선 기법 필요성 정당화"로 재프레임됨.
track-e는 v3보다 공격적: VQ 개선 기법(EMA, RESET, K-means init, β sweep 등) 실험을 Tier 1 핵심으로 격상.