논문 참조¶
Machine learning in peak demand forecasting foundations, trends, and insights
-
기본 정의
-
최대 수요 선별 (Maximum Load): 특정 기간 내에서 관측된 최대 전력 수요
-
데이터 축약 (Data Reduction)
- 일반 부하 예측: 전체 패턴 예측
- Peak 예측: 구간 내 최댓값 또는 최댓값 & 발생 시간 쌍을 추출
-
예측 지평(Horizon)에 따른 선정 기준
-
단기 : 몇 시간에서 7일 이내 (일일 최대 부하)
- 중기 : 1주에서 12개월 미만 (주간 or 월간 최대 부하)
-
장기 : 1년 이상 기간 (연간 최대 부하)
-
특수 선정 기법 (Extreme Values)
-
임계치 기반 이벤트 감지 (Clasf based)
-
극값 이론 (Extreme Value Theory, EVT) : 통계적으로 드문 극단적인 부하를 모델링
- 합성 데이터 생성 등에 활용
-
Outputs
-
Peak Value : 특정 기간 내 최대 부하값
- Peak Time : 해당 최대 부하가 발생한 정확한 시점
기타 다양한 방법¶
전력 데이터의 특성과 분석 목적에 따라 다음과 같은 다양한 피크 정의 및 탐지 기법을 활용할 수 있습니다.
1. 통계적 임계치 기반¶
- 백분위수(Percentile): 상위 5%(\(Q_{95}\)), 1%(\(Q_{99}\)) 등을 피크로 정의
- 표준편차 기반: \(Mean + k \times Std\) (주로 \(k=2, 3\) 사용)
- 강건 통계(Robust Statistics): 중앙값 및 MAD(Median Absolute Deviation) 기반 탐지
- IQR 기반: \(Q_3 + 1.5 \times IQR\) (상자 그림의 Outlier 기준)
2. 동적 및 변동성 기반¶
- 이동 통계(Rolling Statistics): 시점별 이동 평균/표준편차를 이용한 동적 임계치 적용
- 변화율(Derivative): 부하의 급상승 시점(\(d(load)/dt\)) 및 이후 고점 구간 탐지
- 국소 최대 탐지: find_peaks 알고리즘을 통한 돌출도(Prominence), 거리(Distance) 기준 탐지
3. 모델 및 이론 기반¶
- 분해 기반(STL): 계절성/추세를 제거한 잔차(Residual)에서의 이상 상방 이탈
- 이상치 탐지 모델: Isolation Forest, LOF(Local Outlier Factor), One-Class SVM 등 기계학습 활용
- 상태 공간 모델: 은닉 마코프 모델(HMM) 등을 통한 '고부하 상태' 구간 추정
- 예측 오차 기반: 실제값과 예측값의 차이가 큰 구간을 피크 신호로 결합
피크 구간(Peak Area) 정의 및 정제¶
단순히 '최댓값 한 점'을 찾는 것을 넘어, 실무에서는 "피크가 얼마나 지속되고 에너지가 집중되었는가" 가 중요
1. 피크 영역의 핵심 요소¶
- 강도(Intensity): 피크의 높이 (최대 부하값)
- 지속시간(Duration): 임계값 초과 상태가 유지되는 시간 (예: 최소 10분 이상 지속 시 인정)
- 면적(Area): 기준선(Baseline) 대비 초과된 총 에너지양 (Area Over Baseline)
2. 권장 실무 절차¶
- 후보 생성: 통계적/동적 임계치 등 복수의 규칙을 적용하여 후보 구간을 추출합니다.
- 노이즈 제거: 너무 짧은 이탈(Spike)이나 돌출도가 낮은 작은 변동은 최소 지속시간 및 Prominence 조건을 적용해 필터링합니다.
- 영향력 평가: 높이, 면적, 지속시간을 결합한 스코어링을 통해 관리 대상 피크를 확정합니다.
- 모델 연계: 예측 모델의 과소 예측 구간(잔차 상방 이탈)을 피크 보완 신호로 활용하여 정확도를 높입니다.
분석 대상별 고려 사항 (개별 vs 집단)¶
데이터의 집계 수준에 따라 피크를 정의하는 적합한 접근 방식이 달라집니다.
1. 개별 가구 (Individual Household)¶
- 특성: 특정 가전기기(에어컨, 인덕션 등) 사용에 따른 급격한 스파이크(Spike)가 빈번함. 변동성이 매우 크고 '0'에 가까운 기저 부하가 존재할 수 있음.
- 피크 정의 전략:
- 단순 임계치보다는 지속 시간(Duration) 조건을 반드시 결합하여 일시적인 노이즈를 걸러내야 함.
- 평균보다는 중앙값(Median)이나 IQR 등 이상치에 강건한 통계량을 기준선으로 사용함이 유리함.
2. 집단/단지 부하 (Aggregate/Community Load)¶
- 특성: 여러 가구의 사용 패턴이 합쳐져 시계열이 상대적으로 부드러워지며(Smoothing), 명확한 계절성과 시간대별 패턴(Diurnal Cycle)을 보임.
- 피크 정의 전략:
- STL 분해나 이동 평균을 통해 계절적 패턴을 제거한 후, 평소 대비 상방으로 이탈하는 구간을 탐지하는 방식이 효과적임.
- 개별 스파이크보다는 시스템 전체의 용량 부담을 주는 '지속적인 고부하' 구간을 찾는 데 집중함.