콘텐츠로 이동

초록 방어 계획: Claim별 증거 연결 및 실험 설계

0. 전제: 방향 재정의

v2 보고서(v6_0418_fl_baseline_critique.md)는 "선택지 B(Peak Loss 단독 논문)로 전환"을 권고했다.
그러나 사용자가 아래 초록을 변경 불가 확정 상태로 전달했다. 초록은 명시적으로 FL framework 논문으로 포지셔닝된다.

Accurate peak load forecasting is critical to power system operation, but household-level forecasting remains difficult due to load variability. Since consumption data are privacy-sensitive, federated learning (FL) offers a natural framework for collaborative modeling without centralized data collection.
We propose a peak-aware FL framework with two components: (i) a peak-weighted SmoothL1 loss that emphasizes peak-time samples during training, and (ii) a dual-path architecture that combines a shared vector-quantized (VQ) codebook for federated pattern exchange with a lightweight DLinear residual for per-household personalization. We evaluate models using PAPE (Peak Absolute Percentage Error) and HR (Hit Rate), metrics tailored to peak-region accuracy.
Across a broad set of baselines, the proposed model achieves the best peak accuracy, reducing PAPE by 9.8% relative to local-only training. Notably, our 4.6K-parameter model surpasses a 50M-parameter foundation model, showing that loss design and personalization outweigh model scale for household peak forecasting under privacy constraints.

이 초록을 방어하거나, 방어 불가능한 문구만 최소 수정한다. 초록 자체를 교체하는 안은 없다.

v2 권고는 이 문서에 의해 대체된다. v2 파일은 의사결정 이력으로 보존한다.


1. Claim별 방어 가능성 판정 (갱신)

# Claim 현재 증거 방어 가능? 필요 보강 우선도
C1 "FL offers a natural framework … privacy-sensitive" 서술적 동기 O 서술 보강만. 실험 불필요. -
C2 "peak-weighted SmoothL1 loss … emphasizes peak-time samples" P1 vs V1 PAPE 비교, MSE 등가 검증 O 유지. -
C3 "shared VQ codebook for federated pattern exchange" codebook util 3~6%, R1b 단일 seed X y_vq=0 ablation으로 VQ 기여 정량화. go/no-go 판정 후 문구 수정 여부 결정. P0
C4 "DLinear residual for per-household personalization" R1b PAPE 38.40%, FedRep 비교 없음 FedRep/Ditto 최소 2종 비교. novel personalization claim 방어. P1
C5 "best peak accuracy across broad set of baselines" FL=FedAvg 단 하나 X FedProx/FedRep/Ditto 최소 2~3종 추가. "broad set" claim 방어. P1
C6 "reducing PAPE by 9.8% relative to local-only training" B0(42.55)→R1b(38.40): -9.76% ≈ 9.8%. 단일 seed. multi-seed(≥3) 재현. CI 계산 후 수치 방어. P1
C7 "4.6K-parameter model surpasses 50M-parameter FM" TimeMoE-50M 대비 성립 (Exp6 결과) O 유지. 강점. -

요약: C3, C5가 Critical X → 방어 불가 상태. C4, C6는 보강 필요. C1, C2, C7은 현재 증거로 방어 가능.


2. y_vq=0 결과별 분기 전략 (go/no-go)

y_vq=0 ablation은 이 논문의 핵심 분기점이다. 결과에 따라 C3 claim 처리가 달라진다.

Branch A: y_vq=0이 R1b보다 유의미하게 나쁨 (PAPE 차이 > 2%p)

판정: VQ codebook이 실제 기여함. C3 claim 유지 가능.

초록 처리: 변경 없음. "shared VQ codebook for federated pattern exchange" 그대로 유지.

보강 방향: - codebook util 수치를 논문 본문에 투명하게 기재 (예: "6% utilization but contributes 2.1%p PAPE reduction") - util 개선 실험은 선택적 (codebook size M 축소 또는 commitment loss 강화) - FedRep 비교로 "VQ codebook 공유"가 FedRep의 shared representation보다 무엇이 나은지 논증

논문 기여 서술: "Peak-aware FL framework with VQ codebook for federated pattern sharing + DLinear for personalization"


Branch B: y_vq=0 ≈ R1b (PAPE 차이 < 1%p)

판정: VQ 기여가 통계적으로 0. C3 claim을 그대로 유지하면 리뷰어에게 즉시 반박 당함.

초록 처리: "federated pattern exchange" → "shared representation learning" 으로 최소 수정 제안.

구체적 수정안:

기존: "a shared vector-quantized (VQ) codebook for federated pattern exchange"
수정: "a shared vector-quantized (VQ) codebook for federated representation alignment"

이 수정의 논리: codebook util이 낮더라도 VQ quantization 자체가 FL aggregation에서 representation을 정규화(regularize)하는 역할을 할 수 있음. "pattern exchange" (정보 전달)이 아닌 "alignment" (구조 정렬)로 프레이밍하면, codebook util 논쟁을 우회하면서 FL-specific role을 유지할 수 있다.

추가 논증: - DLinear 단독 (y_vq=0)과 R1b의 수렴 속도 비교 → VQ가 초기 수렴을 안정화하는지 확인 - 학습 안정성(loss variance across rounds) 비교 → VQ가 regularizer 역할이면 분산이 낮을 것

논문 기여 서술: "Peak-aware FL framework with VQ codebook as federated regularizer + DLinear for personalization"


Branch C: 차이 1~2%p (경계)

판정: 통계적으로 불확실. multi-seed 결과와 종합 판단.

초록 처리: multi-seed CI 계산 후 분기 결정. 3-seed R1b 재실행을 먼저 완료한 뒤 판정.


3. critic 지적과 초록 Claim 직접 매핑

critic 지적 (v6_0418_fl_baseline_adversarial_review.md) 대응 Claim 실험 초록 방어 효과
y_vq=0 ablation 미실시 → VQ 기여 0 가능성 C3 y_vq=0 ablation (D+1) "VQ codebook for federated pattern exchange" 방어 또는 문구 최소 수정 결정
FedRep 동일 구조 문제 → novel personalization 미성립 C4 FedRep baseline (D+3) "dual-path … per-household personalization" novelty 방어
FL baseline FedAvg 단 하나 → "broad set" 허위 C5 Ditto/FedProx 추가 (D+4~5) "broad set of baselines" claim 방어
R1b 단일 seed → 9.8% 수치 불신뢰 C6 3-seed 재실행 (D+2) "reducing PAPE by 9.8%" 수치 통계적 방어
통신 비용 측정 0건 → "통신 효율" 주장 무효 (초록 無) 측정 코드 추가 (D+5) 초록에는 없으나, 논문 본문 claim 방어용
Non-IID 측정 없음 (초록 無) Wasserstein matrix (D+3) 논문 본문 FL motivation 방어용

핵심: 초록에 "통신 효율"이라는 표현이 없으므로, 통신 비용 미측정 문제는 초록 방어와 직결되지 않는다. 논문 본문에서 해당 주장만 삭제하면 된다.


4. D+1~D+7 실험-섹션 매핑 테이블

일자 실험 담당 초록 Claim 논문 섹션 산출물
D+1 AM y_vq=0 ablation: R1b VQ path 강제 0, PAPE/MSE/HR 비교 engineer + exp-expert C3 (go/no-go) §4.2 Ablation Branch A/B/C 분기 결정 + 비교 테이블
D+1 PM y_vq 기여 비율 측정: |y_vq|/(|y_vq|+|y_dlinear|) per-client exp-expert C3 보강 §4.2 기여 비율 테이블
D+2 AM R1b 3-seed 재실행 (seed 42/123/456): PAPE CI + P1/B0 대비 paired t-test exp-expert C6 §5 Results "9.8% reduction" 통계적 CI 제시
D+2 PM Per-client PAPE 분포 박스플롯 (기존 결과 재분석) exp-expert C5 보강 §5 fairness figure
D+3 AM FedRep baseline 구현: shared encoder + DLinear personal head, 동일 파라미터 예산 engineer C4 §5 FedRep vs R1b 비교
D+3 PM Non-IID heterogeneity 측정: 5가구 Wasserstein-1 exp-expert C1 보강 §2 FL Motivation heterogeneity 지표
D+4 AM Ditto baseline: 동일 아키텍처, λ∈{0.1, 1.0} engineer + exp-expert C5 §5 Ditto vs R1b
D+4 PM FedProx baseline: μ∈{0.01, 0.1} engineer + exp-expert C5 §5 FedProx vs R1b
D+5 통신 비용 측정 코드 추가: per-round bytes, FedAvg vs R1b 비교 engineer (논문 본문 only) §4.1 bytes/round 테이블 (본문 claim 방어)
D+6 전체 결과 통합: 베이스라인 비교 테이블 확정 exp-expert C5 최종 §5 논문 Table 2 초안
D+7 초록 최종 확정: Branch 분기 반영, 문구 수정 여부 결정 lab-leader 전체 Abstract 확정 초록

5. venue 재평가

v2는 "에너지 저널 major revision (선택지 B)"을 권고했다. 초록이 FL framework 논문으로 확정된 만큼 venue 판단을 재검토한다.

현재 초록의 강점

  • "4.6K params > 50M FM": on-device efficiency 각도에서 구체적 임팩트
  • PAPE/HR 지표 설계: peak-region 특화 metric으로 differentiation
  • Privacy-sensitive household data + FL: application 동기 명확
  • FL 환경에서의 personalization: 실용적 기여

보강 완료 후 (D+7 기준) venue 후보

1순위: IEEE Transactions on Smart Grid (TSG) - IF ~9.0. Energy + AI 논문 다수 게재. - FL 프레이밍보다 "household peak prediction + ESS" 응용 각도로 포지셔닝. - "FL contribution"이 아닌 "FL training setup for privacy-preserving peak forecasting"으로 제출 가능. - v2의 "에너지 저널" 판정과 일치하면서 FL 초록을 수용할 수 있는 venue. - 조건: BESS 시뮬레이션 연결 필수. FedRep/Ditto 비교 필요.

2순위: Applied Energy (AE) - IF ~11.2. 더 광범위한 에너지 시스템 논문. - ML/FL 방법론 논문보다 "에너지 운영 효율 개선" 기여 강조가 유리. - MSE 20% 악화의 BESS 비용 영향을 quantify해야 함 (현재 미완). - 조건: BESS 시뮬레이션 연결 + 경제적 임팩트 수치화.

3순위: NeurIPS/ICLR Workshop (FL for Real World, FL-ICML) - Workshop 수준에서는 현재 보강 실험만 완료해도 제출 가능. - "Preliminary FL framework for peak forecasting" 프레이밍. - Full paper가 아니므로 리뷰 기준이 낮음. BESS 연결 없이도 가능. - 장점: 빠른 피드백, 커뮤니티 노출.

v2의 "AAAI/AISTATS application track" 판단 재검토: - AAAI/AISTATS는 FL 방법론 contribution을 요구. 현재 VQ codebook 기여도가 불확실한 상태에서는 리스크 높음. - D+1 ablation 결과(Branch A)가 나온 후에만 고려.

권고: D+7 실험 완료 후 TSG 또는 AE 중 선택. BESS 연결 완성도에 따라 결정.


6. 수정 불가 vs 수정 가능 문구 정리

초록 문구 상태 조건
"peak-aware FL framework" 변경 불가 논문 포지셔닝 핵심
"peak-weighted SmoothL1 loss" 변경 불가 C2 방어됨
"VQ codebook for federated pattern exchange" Branch B에서만 수정 y_vq=0 결과 후 결정
"DLinear residual for per-household personalization" 변경 불가 FedRep 비교로 방어
"broad set of baselines" 변경 불가 FedRep/Ditto/FedProx 추가로 방어
"9.8% relative to local-only" 변경 불가 3-seed 재실행으로 수치 방어 (CI 범위에 9.8% 포함 시)
"4.6K-parameter model surpasses 50M FM" 변경 불가 현재 증거로 방어됨

최소 수정 가능 지점: "federated pattern exchange" → Branch B 발동 시 "federated representation alignment" (단어 2개 교체).


7. 프로세스 gate check (v7 재발 방지)

v2 §3의 진단: "critic 지적 5개 중 4개 미해결 상태로 최종 보고서 유입".

v7에서는 아래 gate check를 도입한다:

D+1 gate (y_vq=0 결과): - exp-expert가 결과 해석 후 Branch A/B/C 분기를 lab-leader에게 보고 - lab-leader가 C3 claim 유지/수정 여부 확정 - 확정 후 D+2 이후 실험 진행

D+5 gate (FedRep + Ditto 결과): - exp-critic이 "broad set of baselines" 및 "personalization novelty"에 대해 adversarial review - critic이 PASS 판정 후에만 논문 초안 착수

D+7 gate (전체 통합): - lab-leader가 초록 7개 claim 방어 가능성 최종 점검 - 모든 P0/P1 항목 방어 완료 확인 후 thesis-writer에게 초안 위임


이 문서는 확정된 초록의 claim별 방어 경로를 설계한 v7 착수 전 의사결정 문서이다. v2 보고서는 이 문서에 의해 방향이 수정되었으나 이력 보존을 위해 삭제하지 않는다. 핵심 분기는 D+1 y_vq=0 ablation 결과에 종속된다.