콘텐츠로 이동

v6 카테고리

초록 방어 계획 v3: critic 전면 반영판

Source: report/version6/lab-leader/v6_0419_abstract_defense_plan_v3.md

[2026-04-19 전환 노트] 이 문서(v3)는 보존됨. 후속 계획은 todos/track-e_vq_codebook_research.md로 발전됨. v3의 통계 요건(5-seed, Wilcoxon, bootstrap CI), Branch A/B/C/D 구조, Claim rollback 조건 테이블은 track-e에 전면 계승됨. 핵심 변경: Branch D의 의미가 "VQ 포기"에서 "Vanilla VQ 한계 입증 + 개선 기법 필요성 정당화"로 재프레임됨. track-e는 v3보다 공격적: VQ 개선 기법(EMA, RESET, K-means init, β sweep 등) 실험을 Tier 1 핵심으로 격상.

초록 방어 계획 v3: Critic 전면 반영 + 실행 가능 단일 플랜


[v3 변경 이력] v1 대비 diff

v6 Baseline Reference (v7-recomputed via shared metrics module)

Source: report/version6/exp-expert/v6_baseline_reference.md

v6 Baseline Reference for v7 Smoke Sanity Review

⚠️ 의무 경고 (critic M3 대응, cycle 2/2 2026-04-19)

본 reference는 'Gate 판정 근거'로 사용 금지. smoke 해석 시 오직 "수치 규모 sanity (order-of-magnitude)"로만 참고할 것.

근거: - 표본은 N=1 seed (seed=42) 단일 run. IQR/분산/bootstrap 계산 원천 불가. - cycle 1 revision에서 제안한 ±5 tolerance 밴드는 통계 근거 부재로 본 cycle 2/2 에서 철회한다. - v7 smoke의 "합리성" 판정은 v7 내부 3-seed paired 분산으로만 수행. - smoke_analysis.py는 자동 footer로 본 경고를 verdict 보고서에 삽입한다.

실험 비판 보고서: Exp6 결과 시각화 설계 문서 (v6_0419_exp6_figures_design.md)

Source: report/version6/exp-critic/v6_0419_exp6_figures_review.md

실험 비판 보고서: Exp6 결과 시각화 설계 문서 (v6_0419_exp6_figures_design.md)

  • 작성일: 2026-04-19
  • 대상 실험: report/version6/exp-expert/v6_0419_exp6_figures_design.md
  • 근거 원보고서: report/version6/lab-leader/v6_0415_exp6_final_report.md
  • 검토자: exp-critic
  • 종합 판정: REVISE REQUIRED

요약 (Executive Summary)

실험 비판 보고서: FeDPM MVP Phase 1 (V1 Vanilla FeDPM)

Source: report/version6/exp-critic/v6_0415_exp6_fedpm_phase1_review.md

실험 비판 보고서: FeDPM MVP Phase 1 (V1 Vanilla FeDPM)

작성일: 2026-04-15 대상 실험: experiments/distillation/v6_0415_fedpm_mvp.py (Phase 1, 3회 실행) 설계서: report/version6/lab-leader/v6_0415_exp6_design.md 종합 판정: REJECT -- 구조적 구현 오류 및 실험 공정성 문제로 결과 신뢰 불가


요약 (Executive Summary)

Exp6 3-Seed 반복 및 MSE 등가 검증 보고서

Source: report/version6/exp-expert/v6_0415_exp6_3seed_mse_equiv.md

Exp6 3-Seed 반복 및 MSE 등가 검증 보고서

  • 실험: FeDPM Phase 2 통계적 유의성 검증
  • 날짜: 2026-04-15
  • 스크립트: experiments/distillation/v6_0415_fedpm_original.py

1. 3-Seed 반복 실험 (alpha=2.0, beta=2.0)

목적

Phase 2 최적 설정(alpha=2.0, beta=2.0)의 결과가 seed에 의존적인지 확인.

실험6 Phase 1 중간 리뷰 — FeDPM Codebook MVP

Source: report/version6/exp-expert/v6_0415_exp6_phase1_interim.md

실험6 Phase 1 중간 리뷰: FeDPM Codebook MVP

1. 실험 개요

항목 내용
목표 FeDPM Codebook MVP — 연합학습 가능성 + 피크 성능 확인
핵심 가설 (H6-1) Vanilla FeDPM(V1)은 FedAvg+DLinear(B1)과 동등하거나 낮은 MSE를 달성한다
판정 기준 V1 mean MSE ≤ B1 mean MSE
설계서 report/version6/lab-leader/v6_0415_exp6_design.md
데이터 EC50 중 5가구 (Apt6, Apt15, Apt30, Apt51, Apt88), seq_len=96, pred_len=24
날짜 2026-04-15

실험6 Phase 2: Peak-Weighted Loss 적용

Source: report/version6/exp-expert/v6_0415_exp6_phase2_peak_loss.md

실험6 Phase 2: Peak-Weighted Loss 적용

1. 목적

Phase 1에서 원본 FeDPM 아키텍처의 MSE(0.579)가 B0(0.522)과 유사한 수준으로 학습됨을 확인. 단, PAPE가 49.77%로 B0(42.55%) 대비 악화 — 피크 예측 정확도 개선이 필요.

Phase 2는 Peak-Weighted Loss를 적용하여 PAPE를 직접 공략한다.

2. Phase 1 결과 요약 (원본 FeDPM)

실험6 Phase 3: Residual Path 심층 분석 및 DLinear Residual 설계

Source: report/version6/exp-expert/v6_0415_exp6_phase3_residual_analysis.md

실험6 Phase 3: Residual Path 심층 분석 및 DLinear Residual 설계

1. Phase 3 결과 요약 (Residual MLP)

H6-3: FAIL

P1 (Phase 2 최선) R1 (Phase 3) Δ
MSE 0.543 0.539 -0.004 (유사)
PAPE 42.67% 45.70% +3.03%p (악화)
HR 27.8% 28.5% +0.7
CB Util 3.8% 4.1% +0.3

Exp6 Phase 3b: DLinear Residual 결과 보고서

Source: report/version6/exp-expert/v6_0415_exp6_phase3b_dlinear_residual.md

Exp6 Phase 3b: DLinear Residual 결과 보고서

  • 실험: FeDPM + DLinear Residual Path
  • 날짜: 2026-04-15
  • 스크립트: experiments/distillation/v6_0415_fedpm_original.py --phase 3b

1. 실험 설계

가설

VQ path(FL 공유)가 공통 패턴을 잡고, DLinear(로컬 유지)가 가구별 고유 패턴을 보정하면 PAPE가 개선될 것이다.