v6 카테고리¶

2026년 4월 21일
카테고리 v6, v6 lab-leader
읽는시간 11분

초록 방어 계획 v3: critic 전면 반영판

Source: report/version6/lab-leader/v6_0419_abstract_defense_plan_v3.md

[2026-04-19 전환 노트] 이 문서(v3)는 보존됨. 후속 계획은 todos/track-e_vq_codebook_research.md로 발전됨. v3의 통계 요건(5-seed, Wilcoxon, bootstrap CI), Branch A/B/C/D 구조, Claim rollback 조건 테이블은 track-e에 전면 계승됨. 핵심 변경: Branch D의 의미가 "VQ 포기"에서 "Vanilla VQ 한계 입증 + 개선 기법 필요성 정당화"로 재프레임됨. track-e는 v3보다 공격적: VQ 개선 기법(EMA, RESET, K-means init, β sweep 등) 실험을 Tier 1 핵심으로 격상.

초록 방어 계획 v3: Critic 전면 반영 + 실행 가능 단일 플랜

[v3 변경 이력] v1 대비 diff

2026년 4월 20일
카테고리 v6, v6 exp-expert
읽는시간 5분

v6 Baseline Reference (v7-recomputed via shared metrics module)

Source: report/version6/exp-expert/v6_baseline_reference.md

v6 Baseline Reference for v7 Smoke Sanity Review

⚠️ 의무 경고 (critic M3 대응, cycle 2/2 2026-04-19)

본 reference는 'Gate 판정 근거'로 사용 금지. smoke 해석 시 오직 "수치 규모 sanity (order-of-magnitude)"로만 참고할 것.

근거: - 표본은 N=1 seed (seed=42) 단일 run. IQR/분산/bootstrap 계산 원천 불가. - cycle 1 revision에서 제안한 ±5 tolerance 밴드는 통계 근거 부재로 본 cycle 2/2 에서 철회한다. - v7 smoke의 "합리성" 판정은 v7 내부 3-seed paired 분산으로만 수행. - smoke_analysis.py는 자동 footer로 본 경고를 verdict 보고서에 삽입한다.

2026년 4월 19일
카테고리 v6, v6 exp-critic
읽는시간 9분

실험 비판 보고서: Exp6 결과 시각화 설계 문서 (v6_0419_exp6_figures_design.md)

Source: report/version6/exp-critic/v6_0419_exp6_figures_review.md

실험 비판 보고서: Exp6 결과 시각화 설계 문서 (v6_0419_exp6_figures_design.md)

작성일: 2026-04-19
대상 실험: report/version6/exp-expert/v6_0419_exp6_figures_design.md
근거 원보고서: report/version6/lab-leader/v6_0415_exp6_final_report.md
검토자: exp-critic
종합 판정: REVISE REQUIRED

요약 (Executive Summary)

2026년 4월 15일
카테고리 v6, v6 exp-critic
읽는시간 8분

실험 비판 보고서: FeDPM MVP Phase 1 (V1 Vanilla FeDPM)

Source: report/version6/exp-critic/v6_0415_exp6_fedpm_phase1_review.md

실험 비판 보고서: FeDPM MVP Phase 1 (V1 Vanilla FeDPM)

작성일: 2026-04-15 대상 실험: experiments/distillation/v6_0415_fedpm_mvp.py (Phase 1, 3회 실행) 설계서: report/version6/lab-leader/v6_0415_exp6_design.md 종합 판정: REJECT -- 구조적 구현 오류 및 실험 공정성 문제로 결과 신뢰 불가

요약 (Executive Summary)

2026년 4월 15일
카테고리 v6, v6 exp-critic
읽는시간 3분

exp-critic 리뷰: Phase 2 Beta Sweep 결과

Source: report/version6/exp-critic/v6_0415_exp6_phase2_beta_sweep_review.md

exp-critic 리뷰: Phase 2 Beta Sweep 결과

판정: CONDITIONAL PASS

H6-2의 형식적 기준(P1 PAPE < V1 PAPE)은 충족하나, 실질적 의미는 매우 약하다.

1. beta=2.0 선택의 타당성

2026년 4월 15일
카테고리 v6, v6 exp-expert
읽는시간 2분

Exp6 3-Seed 반복 및 MSE 등가 검증 보고서

Source: report/version6/exp-expert/v6_0415_exp6_3seed_mse_equiv.md

Exp6 3-Seed 반복 및 MSE 등가 검증 보고서

실험: FeDPM Phase 2 통계적 유의성 검증
날짜: 2026-04-15
스크립트: experiments/distillation/v6_0415_fedpm_original.py

1. 3-Seed 반복 실험 (alpha=2.0, beta=2.0)

목적

Phase 2 최적 설정(alpha=2.0, beta=2.0)의 결과가 seed에 의존적인지 확인.

2026년 4월 15일
카테고리 v6, v6 exp-expert
읽는시간 5분

실험6 Phase 1 중간 리뷰 — FeDPM Codebook MVP

Source: report/version6/exp-expert/v6_0415_exp6_phase1_interim.md

실험6 Phase 1 중간 리뷰: FeDPM Codebook MVP

1. 실험 개요

항목	내용
목표	FeDPM Codebook MVP — 연합학습 가능성 + 피크 성능 확인
핵심 가설 (H6-1)	Vanilla FeDPM(V1)은 FedAvg+DLinear(B1)과 동등하거나 낮은 MSE를 달성한다
판정 기준	V1 mean MSE ≤ B1 mean MSE
설계서	`report/version6/lab-leader/v6_0415_exp6_design.md`
데이터	EC50 중 5가구 (Apt6, Apt15, Apt30, Apt51, Apt88), seq_len=96, pred_len=24
날짜	2026-04-15