콘텐츠로 이동

v9 카테고리

v9-02 Chronos-Bolt LoRA Fine-tuning 실험 설계

Source: report/version9/exp-designer/v9-02_chronos_lora_design.md

v9-02: Chronos-Bolt-Small LoRA Fine-tuning + FL/VQ 연관 설계

1. 목적 및 가설

1.1 핵심 연구 질문

Chronos-Bolt-Small (47.7M, T5 기반) 의 LoRA fine-tuning 이 EC50 5가구(Apt6/15/30/51/88) 데이터에서 zero-shot baseline 대비 피크 예측 성능을 유의하게 개선하는가? 그리고 이 구조가 v6 FL/VQ 자산(FeDPM, Peak-Weighted Loss, DLinear residual)과 유의미하게 결합 가능한가?

1.2 가설 (H9-2, H9-3)

v9-01 Stage 1 HR 민감도 재평가 + v6 Baseline Recap

Source: report/version9/reporter/v9-01_stage1_hr_sensitivity_recap.md

v9-01 Stage 1 — HR 민감도 재평가 + v6 Baseline Recap

§0 요약 (Executive Summary)

v9 phase Stage 1 의 목적은 세 가지였다: (1) H9-1 가설 검증 — v6 Exp6 에서 관찰된 FM (Chronos-Bolt, HR@tol=1 = 37.7%) 의 HR 우위가 허용범위를 ±30분(tol=1)에서 ±1h(tol=2)로 완화할 때 증폭되는지, (2) v6 13 baseline 재현성 확보 — v9 Stage 2 (Chronos LoRA) 비교군 고정, (3) Peak-Weighted Loss 순수 효과 분리 — P1(α=2, β=2) vs P1_MSE_eq(α=2, β=100) 대조로 β 의존성 검증.

결과: H9-1 은 FAIL. tol=1 에서 Chronos-Bolt 가 37.71%로 1위였으나 tol=2 로 완화하면 B1 (DLinear FedAvg) 이 49.39%로 역전한다. FM 계열의 hr_delta(9.96~10.85) 가 DLinear 계열(12.02~12.47) 보다 낮아, FM 의 HR 우위는 증폭이 아니라 약화된다. v6 baseline 은 R1b 포함 전 항목이 ±0.5~2.6%p 범위에서 재현되었으며, 재현 시 FedPM --beta 2.0 override 가 필수임을 확인했다. Peak-Weighted Loss 는 β=100 구간에서 peak weighting α=2 의 효과가 무력화되어 PAPE 가 +5.66%p 악화됨 (42.85 → 48.51) 을 실측으로 입증했다.

v9 Stage 2 (Chronos-Bolt LoRA fine-tuning) 는 설계·구현 준비 완료, exp-expert dispatch 대기 상태이다.