Index


Figures


Tables

Yoon† and Jeong††: Electric Power Demand Prediction Using Deep Learning Model with Temperature Data

Hyoup-Sang Yoon† and Seok-Bong Jeong††

Electric Power Demand Prediction Using Deep Learning Model with Temperature Data

Abstract: Recently, researches using deep learning-based models are being actively conducted to replace statistical-based time series forecast techniques to predict electric power demand. The result of analyzing the researches shows that the performance of the LSTM-based prediction model is acceptable, but it is not sufficient for long-term regional-wide power demand prediction. In this paper, we propose a WaveNet deep learning model to predict electric power demand 24-hour-ahead with temperature data in order to achieve the prediction accuracy better than MAPE value of 2% which statistical-based time series forecast techniques can present. First of all, we illustrate a delated causal one-dimensional convolutional neural network architecture of WaveNet and the preprocessing mechanism of the input data of electric power demand and temperature. Second, we present the training process and walk forward validation with the modified WaveNet. The performance comparison results show that the prediction model with temperature data achieves MAPE value of 1.33%, which is better than MAPE Value (2.33%) of the same model without temperature data.

Keywords: Electric Power Demand Prediction , Deep Learning , WaveNet , Temperature Data

윤협상† , 정석봉††

기온 데이터를 반영한 전력수요 예측 딥러닝 모델

요 약: 최근 전력수요를 예측하기 위해 통계기반 시계열 분석 기법을 대체하기 위해 딥러닝 기법을 활용한 연구가 활발히 진행되고 있다. 딥러닝 기반 전력수요 예측 연구 결과를 분석한 결과, LSTM 기반 예측 모델의 성능이 우수한 것으로 규명되었으나 장기간의 지역 범위 전력수요 예측에 대해 LSTM 기반 모델의 성능이 충분하지 않음을 확인할 수 있다. 본 연구에서는 기온 데이터를 반영하여 24시간 이전에 전력수요를 예측하는 WaveNet 기반 딥러닝 모델을 개발하여, 실제 사용하고 있는 통계적 시계열 예측 기법의 정확도(MAPE 값 2%)보다 우수한 예측 성능을 달성하는 모델을 개발하고자 한다. 먼저 WaveNet의 핵심 구조인 팽창인과 1차원 합성곱 신경망 구조를 소개하고, 전력수요와 기온 데이터를 입력값으로 모델에 주입하기 위한 데이터 전처리 과정을 제시한다. 다음으로, 개선된 WaveNet 모델을 학습하고 검증하는 방법을 제시한다. 성능 비교 결과, WaveNet 기반 모델에 기온 데이터를 반영한 방법은 전체 검증데이터에 대해 MAPE 값 1.33%를 달성하였고, 동일한 구조의 모델에서 기온 데이터를 반영하지 않는 것(MAPE 값 2.31%)보다 우수한 전력수요 예측 결과를 나타내고 있음을 확인할 수 있다.

키워드: 기온 데이터, 딥러닝, 웨이브넷, 전력수요 예측

I. 서론

국내 전력거래는 2001년 전력산업구조 개편 이후 한국전 력거래소를 통해 발전사 간 경쟁입찰 체제를 기반으로 하고, 원자력, 수력, 화력, 태양광 등 다양한 방식의 발전사가 전력 수요 예측을 통해 결정되는 거래 가격을 기준으로 전력을 공급하고 있다[1]. 최근 태양광 발전설비 보급이 증대됨과 동시에 신재생에너지의 전력계통 연계가 확대되고 있다. 소규모 태양광 발전 설비를 사용해서 생산한 전력을 자체 소비하고 남는 전력을 전력거래소를 통해 공급하는 상황에서 정확한 전력수요 예측의 중요성이 점점 커지고 있다[2].

과거에는 전력수요를 예측하기 위해 전통적인 회귀분석, 지수평활법, 자동회귀누적이동평균(autoregressive integrated moving average; ARIMA)[3-5] 등 시계열 데이터 분석 방 법을 활용한 연구가 주류를 이루었으나, 최근 들어 LSTM (long short-term memory)[6], GRU(gated recurrent unit)[7] 등의 순환 신경망(recurrent neural network; RNN) 계열 딥러닝을 활용한 방법으로 전환되고 있고, 다양한 딥러닝 모델의 성능을 비교하여 전력수요에 적합한 모델을 구축하고자 하는 시도가 있다[8-12].

[8]에서는 2016년 1월부터 3월까지 수집된 가정의 전력 사용량 데이터를 학습하여 다층퍼셉트론(multi layer perceptron;MLP), RNN, LSTM 등에 대해 성능을 평가한 결과 LSTM이 가장 우수한 평균 절대 퍼센트 오차(mean absolute percent error; MAPE) 13.37%를 나타내고 있다. [9]에서는 2013년 1월부터 2021년 3월까지 다양한 예측모델을 병합한 스태킹 앙상블 기법을 적용한 결과 MAPE 1.83%의 성능을 확인할 수 있다. [10]에서는 심층강화학습(dense reinforcement learning; DRL) 기법을 활용하여 전력 생산 환경 및 수요와 공급을 예측하고 있으나, 초저지연 처리장치와 초대형 저장 장치가 필요하며 획기적인 발전이 선행되어야 심층강화학습 적용이 가능하다는 한계점을 밝히고 있다. [11]에서는 2013 년부터 2016년까지 수집된 데이터에 대해 전력수요 패턴이 다른 평일과 특수일 데이터, 기상 데이터 등을 반영하여 LSTM 기법을 적용하였고, 전체 데이터세트에 대해 가장 우 수한 결과를 갖는 LSTM의 MAPE 값이 2.74%임을 나타내고 있다. [12]에서는 2001년부터 2017년까지 다층퍼셉트론, RNN, LSTM, 퍼지추론시스템 기반 적응네트워크(adaptive network based fuzzy inference system; ANBFI) 기법을 비교한 결과 LSTM 기법의 RMSE(root mean squared error)가 0.065로 가장 우수하다고 제안하였다. [13]에서는 SVM(support vector machine), SVR(support vector regression)과 같은 머신러닝 기법을 사용하여 전력수요 데 이터와 함께 기상 데이터를 이용하면 평균 15% 이내의 최대 오차율 감소 효과가 있음을 제시하고 있다.

현재까지 많은 전력수요 예측 연구에 활용된 LSTM 모델 은 딥러닝 기법 중에서 성능이 우수한 것으로 판명되었지만, 장기간의 데이터를 대상으로 할 때 예측 성능이 저하하는 것 으로 나타나고 있으며 이를 해결하기 위한 대안으로 1차원 합성곱 신경망(convolutional neural network; CNN)을 기반으로 하는 모델의 사용에 관한 연구도 진행되고 있다 [15-17]. 특히 오디오 샘플 예측을 목적으로 1차원 CNN을 기반으로 개발된 WaveNet[14] 등을 활용한 예측 모델이 장기간의 전력수요 예측에 효과적임으로 확인되었다[15].

Table 1에서는 지금까지 살펴본 연구 결과 중에서 딥러닝 기반의 전력수요 예측 모델에 대한 주요 내용을 요약하여 제 시하고 있고, 모델에 사용된 데이터의 시간 및 지역적 범위에 대해 구분하여 비교하고 있다. 기존 연구를 비교한 결과는 다음과 같다. [8]과 [9]는 특정 지역에 한정하여 전력수요를 예 측하는 반면 [9]와 [11]은 광역 또는 전국적 단위의 전력수요 예측을 다루고 있다. 또한, [8]과 [11]은 3년 이내의 데이터를 사용하는 반면 [9]와 [11]은 비교적 장기간의 데이터를 사용 하고 있다. 동일한 데이터를 대상으로 하는 연구가 아니므로 성능을 직접 비교하는 것은 무리이지만, 수치상으로는 여러머신러닝 기법을 중첩한 [9]의 결과가 가장 우수하다고 판단 할 수 있다. 하지만 여러 머신러닝 기법을 중첩하기 위한 계 산시간과 비용을 고려하면 현재의 시계열 데이터 분석에 사용하는 통계기반 기법과 차별성이 높다고 할 수 없다.

Table 1.

Deep Learning Model Summary
Research Data Model MAPE(%)
Period Region
[8] `16.01~03 Local LSTM 13.37
[9] `13~`21 Nationwide Stacking 1.83
[11] `13~`16 Nationwide LSTM 2.74
[15] `10~`18 Local WaveNet 2.31

[18]에서는 통계적 기법과 머신러닝 기법의 전력수요 분석 에 대해 비교하고, 결측 데이터를 보간하여 정확도를 높이는 방법에 대해 제안하고 있다. 또한, 전력수요 예측을 예측 범 위에 따라 초단기, 단기, 중기, 장기로 구분하고 기상 데이터 등 추가 정보를 활용하는 방안을 소개하고 있다. [18]에 따르 면 전력수요 예측 모델을 선정할 때 고려해야 하는 요인은 데이터 수집 기간, 예측 대상 기간과 지역, 전력수요 데이터 및 추가 데이터 사용 여부 등이 될 수 있다.

현재까지 주로 사용되고 있는 LSTM 기반의 예측 모델은 예측 대상 지역이 전국 또는 광역 단위이며 중기 이내의 예측 범위에 대해 우수하지만 1차원 CNN 기반 WaveNet 모델은 지역 단위 장기간 예측에 대해서도 우수한 예측 성능을 얻을 수 있음을 확인하였다.

본 연구에서는 전국 전력망에서 분리된 도서 지역의 전력 수요 예측을 목적으로 하고 있으며 현재 사용하고 있는 통계 기반 시계열 예측 기법의 정확도인 MAPE 값 기준 2%를 능 가하는 모델을 개발을 목표로 한다. 이를 위해, [13]에서 규명된 바와 같이 전력수요에 유의한 영향을 끼치는 것으로 예상되는 기상 환경을 대표하는 인자로 기온 데이터를 반영한 WaveNet 기반 딥러닝 모델을 제안하고자 한다.

먼저, 2장에서는 전력수요에 사용하는 데이터와 모델 구축 절차를 소개하고, 3장에서는 WaveNet 기반 예측 모델의 구조를 살펴본다. 4장에서는 모델의 타당성을 확인하기 위하여 학습과 훈련에 전혀 사용하지 않은 새로운 데이터를 사용하여 기온을 반영한 모델과 그렇지 않은 모델의 차이를 분석하 고자 한다. 마지막으로, 5장에서는 본 연구의 한계와 추후 연구를 비롯한 결론을 제시하고자 한다.

2. 전력수요 데이터 및 예측 모델 구축 절차

2.1 전력수요 데이터

본 연구에서 딥러닝 모델을 구축하여 예측하고자 하는 전력 수요 데이터는 국내 도서 지역에 있는 소규모 광역자치단체에서 1시간 간격으로 측정된 것이다. 또한, 기상 조건을 반 영하기 위해 해당 지역에 있는 기상 관측소에서 측정하여 수집된 기온 데이터를 기상 자료 개방포털[19]을 통하여 수집한다.

Fig. 1.

Power Demand and Temperature Data
1.png

Fig. 1에서 나타나는 바와 같이 전력수요는 냉난방이 필요 한 시기에 증가하고 그렇지 않은 시기에는 감소하는 일정 패 턴이 반복되고 있으며 매년 전력수요가 증가하는 추세를 관찰할 수 있다. 기온 데이터에는 전력수요에서 나타나는 증가 추세가 나타나지 않지만, 계절의 변화에 따른 패턴은 확인할 수 있다.

전력거래소에서는 전력수요 예측을 통해 공급하고자 하는 전력을 구매하고 전력공급자는 구매계약에 따라 전력을 생산하게 된다. 따라서 통상적으로 24시간 이전에 전력수요를 예측해야 하는 상황을 반영하여 본 연구에서는 기온 데이터를 반영하여 예측 시점 기준 24시간 이후에 발생하는 24시간 동 안의 전력수요를 예측하는 딥러닝 모델을 구축하는 것을 목표로 한다.

전력수요 및 기온 데이터는 특정 시점에 관찰된 시간별 데이터 형식으로 측정 및 수집되고 있다(Table 2의 ‘Original Data’ 열 참조). [TeX:] $$d_i$$[TeX:] $$t_i$$는 각각 i 시점에 관측된 전력수요와 기온을 나타낸다. 딥러닝 예측 모델의 입력값의 크기는 모델 구조에 따라 달라진다. 예측 시점 기준 과거 w시점(time step) 동안 의 데이터가 주입되고 24시간 이후부터 24개 시점에서 전력 수요를 예측하고자 한다면, w+48개의 데이터가 학습과 검증 에 필요하다. 입력값과 목표값 사이의 존재하는 24개의 데이 터는 학습과정에서 사용하지 않지만, 데이터 변환 속도를 높 이기 위해 제거하지 않았으므로 존재하게 된다.

Reshaped Data 형식으로 변환된 데이터가 모델에 주입 되며, 전력수요 데이터는 과거의 데이터를 사용하는 반면 기 온 데이터는 예측하고자 하는 전력수요가 발생하게 되는 시점의 데이터를 사용한다. 엄밀한 모델 구축을 위해서는 전력 수요 발생 시점의 기온 예측값을 사용하는 것이 타당하지만, 기온 예측값을 수집하는 것이 불가능하여 실제 기온 측정값을 사용한다. 모델의 출력데이터는 w+48 시간 간격 이후의 Reshaped Data에 있는 w+48개의 데이터와 비교한다. 예를 들어 w+49 시점에서는 [TeX:] $$\left[\left(d_2, t_{26}\right), \cdots,\left(d_{w+49}, t_{w+73}\right)\right]$$와 같이 총 w+48개의 데이터가 있다. [TeX:] $$\left[\left(d_2, t_{26}\right), \cdots,\left(d_{w+1}, t_{w+25}\right)\right]$$ 데이터는 모델의 입력값으로 사용되고, [TeX:] $$\left[\left(d_{w+25}, t_{w+59}\right), \cdots\right.\left.\left(d_{w+49}, t_{w+73}\right)\right]$$ 데이터는 목푯값으로 사용된다. 입력값과 목 푯값 사이의 존재하는 24개의 데이터는 학습과정에서 사용하 지 않지만, 데이터 생성 속도를 높이기 위해 제거하지 않아 존재한다.

Table 2.

Shape of Input Data
Time step Original Data Reshaped Data
1 [TeX:] $$\left(d_1, t_{25}\right)$$ [TeX:] $$\left(d_1, t_{25}\right)$$
2 [TeX:] $$\left(d_2, t_{26}\right)$$ [TeX:] $$\left(d_1, t_{25}\right), \quad\left(d_2, t_{26}\right)$$
w [TeX:] $$\left(d_w, t_{w+24}\right)$$ [TeX:] $$\left(d_1, t_{25}\right), \cdots,\left(d_w, t_{w+24}\right)$$
w+48 [TeX:] $$\left(d_{w+48}, \quad t_{w+72}\right)$$ [TeX:] $$\left(d_1, t_{25}\right), \cdots,\left(d_{w+48}, t_{w+72}\right)$$
w+49 [TeX:] $$\left(d_{w+49}, \quad t_{w+73}\right)$$ [TeX:] $$\left(d_2, t_{26}\right), \cdots,\left(d_{w+49}, t_{w+73}\right)$$
2.2 예측 모델 구축 절차

일반적으로 딥러닝을 활용한 예측 절차는 전력수요 예측 모델 구축, 하이퍼파라미터 설정, 모델 학습 및 데이터 검증, 모델 적용 등 순서대로 진행되지만, 본 연구에서는 [15]에서 시계열 데이터 분석에 우수한 성능을 입증한 WaveNet 구조 와 WFV(walk forward validation)[20] 검증 기법, 하이퍼 파라미터 설정 방법을 활용하고자 한다. 다만, [15]에서 고려하지 않고 있는 기상 데이터를 모델에 반영하기 위해 개선된 모델을 제안하고 있으며 상세한 모델 구축 과정은 3장에서 다루고자 한다.

하이퍼파라미터는 학습과정에서 결정되는 파라미터와 달 리 분석자가 별도로 설정해야 하는 파라미터를 의미한다[21]. 본 연구에서는 기온 데이터를 반영하지 않은 [15]의 결과와 비교하여 기온 데이터 반영의 효과를 확인하기 위하여 동일 한 하이퍼파라미터 설정을 사용하고자 한다.

3. 전력수요 예측 모델 구축

3.1 모델 구조

전력수요 예측 모델은 과거 일정 기간의 전력수요 데이터 와 수요 발생 시점의 기온 데이터를 입력데이터로 사용한다. 딥러닝을 이용한 전력수요 연구에는 시계열 데이터 분석에 적합한 RNN 기법의 일종인 LSTM, GRU 등이 활용되거나 1차원 합성곱(1D CNN) 구조와 RNN을 결합한 모델이 활용 되었다. 비교적 짧은 기간의 전력수요 데이터를 사용하여 예측할 때는 기존의 모델이 잘 동작 하였지만, 장기간의 데이터를 활용할때는 RNN 모델의 한계점이라 할 수 있는 앞 부분의 데이터에 대한 학습이 반영되지 않는 문제가 존재한다. 이러한 문제를 해결하기 위해 1초당 수만개의 데이터를 담고 있는 음성 신호 예측을 위해 개발된 WaveNet 구조를 활용 하고자 한다[14].

WaveNet은 팽창인과(delated and causal) 특성을 갖는 1 차원 합성곱(1D CNN) 기반의 모델(delated causal Conv1D) 이며, 일반적인 1D CNN 구조와 달리 미래의 데이터를 사용 하지 않고 과거의 데이터만 사용하는 causal 패딩과 팽창 비율(delation rate)이 2배씩 증가하는 구조를 통해 장기 시계 열 데이터 분석에 적합한 특성을 갖는다. Fig.2의 가장 하단의 입력층에서 1시간 간격으로 데이터가 각 뉴런에 주입된다. 과거 데이터(좌측 노드)와 현재 데이터는 다음 계층으로 주입되도록 하는 것이 causal 특성이고 다음 계층으로 올라 갈수록 데이터 입력이 2배씩 벌어지는 것이 delation 특성이 라고 수 있다. Conv1D(i)는 팽창 비율(delation rate)이 i인 1D CNN을 나타내고 상단으로 올라갈수록 팽창 비율이 2배 씩 증가하는 구조로 되어있다. Fig. 2에서는 예시로서 팽창 비율이 8인 구조까지만 나타내었지만 16, 32, 64 등 팽창 비율이 2의 거듭제곱 형태로 필요에 따라 Conv1D 층을 추가로 적층하는 것이 가능하다. 또한, 반복적으로 Fig. 2에서 나타난 구조를 적층하는 것이 가능하다.

Fig. 2.

Delated Causal Convolutional Network Architecture
2.png

본 연구에서 사용된 WaveNet의 구조는 Fig. 3과 같다. Fig. 3의 좌측에 있는 박스는 각각 <1, 2, 4, 8, 16, 32, 64, 128>의 팽창 비율을 갖는 총 8개의 팽창인과 Conv1D가 적 층되어 있는 Conv1D 블록의 구조를 나타내고 있다. Fig. 3 의 Input 박스로 표현된 입력데이터는 전력수요 데이터와 기 온 데이터로 구성된다. 모델에 기온 데이터를 반영하기 위해 입력데이터로 주입하는 방법과 최종 계층에서 계산된 전력수 요를 보정하는 방법을 비교하였으나 입력 모델로 주입하는 방 법의 성능이 우수하여 입력값에 기온 데이터를 포함하고자 한다. 입력데이터는 총 5개의 Conv1D 블록을 지나며, 각 블록 에서 계산된 서로 다른 수용범위(Receptive Field)의 지역 결 괏값(local output)은 Fig. 3의 ADD 블록에서 모두 합산되어 Conv1D 층으로 전달된다. 이때 활성함수는 Relu(rectified linear unit)를 사용한다. 가장 우측에 있는 Conv1D 층에서는 활성 함수를 사용하지 않고 결괏값이 계산되고 이 값이 전력수요의 예측값으로 사용된다. 참고로 오른쪽 2개의 Conv1D는 팽창인과 특성을 갖지 않는 일반적인 Conv1D층 이다.

Fig. 3.

Structure of the Proposed Model
3.png

본 연구에서 사용된 모델은 입력값과 출력값을 처리하는 방법에 있어서 오디오 데이터를 다루기 위한 WaveNet 연구 에서 사용한 방식과 차이가 있다. WaveNet은 표본화, 양자 화를 거친 오디오 입력데이터를 분석하여 동일한 형태의 출 력값을 예측하는 분류 문제를 다루며, 16비트 정숫값 (0~65,535)으로 이루어진 오디오 데이터([TeX:] $$x_1, \ldots, x_{t-1}$$)을 입력 값으로 하여 예측값([TeX:] $$x_t$$)의 조건부 확률 [TeX:] $$p\left(x_t \mid x_1, \ldots, x_{t-1}\right)$$을 계산한다. 따라서, 예측값은 65,535개의 확률값으로 구성된 소 프트맥스로 표현된다. 이처럼 많은 종류의 결괏값을 소프트 맥스로 처리할 때 계산량이 심각하게 증가하는 문제를 해결 하기 위해 Equation (1)과 같은 [TeX:] $$\mu$$-law companding 변환 을 통해 결괏값을 256개의 값으로 변환하여 소프트맥스를 계산하고 계산 결과를 재변환하여 16비트 정숫값을 계산하게 된다. 단, [TeX:] $$\mu=255$$이고, [TeX:] $$-1<x_t<1$$이다.

(1)
[TeX:] $$f\left(x_t\right)=\sin \left(x_t\right) \frac{\ln \left(1+\mu\left|x_t\right|\right)}{\ln (1+\mu)}$$

오디오 예측 문제의 성능을 평가하기 위해 계량적인 정확 도를 사용하기도 하지만, 주로 오디오를 듣고 평가자가 판단 하는 주관적인 의견(mean opinion score; MOS)을 기준으로 하여 모델 성능을 평가한다. 참고로 Tensorflow 라이브러리로 작성된 WaveNet의 코드는 [22]에서 확인할 수 있다.

본 연구에서는 시계열 데이터 회귀 문제와 같이 전력수요 예측값과 실제값의 차이를 기준으로 모델의 성능을 평가하므로 출력값은 소프트맥스 활성함수를 사용하지 않고 모델에서 생성하는 값을 그대로 사용한다. 입력값으로 서로 다른 척도 를 갖는 전력수요와 기온을 동시에 사용하므로 입력값([TeX:] $$x_t$$)을 정규화한다(Equation (2) 참조). 단, [TeX:] $$\mu_x$$[TeX:] $$\sigma_x$$는 각각 입력데 이터의 평균과 표준편차이다.

Table 3.

Hyperparameter Combination
Hyperparameter Used Alternatives
Input Length 7×24 14×24, 28×24
Batch Size 24 32, 48
# of WaveNet Blocks 5 3, 7
Dilation Rates 7 4, 10
Learning Rate Scheduler Exponential Piecewise

(2)
[TeX:] $$f\left(x_t\right)=\frac{x_t-\mu_x}{\sigma_x}$$

모델의 학습을 위해 손실함수(loss function)로 출력값과 실제값의 평균제곱오차(mean squared error; MSE)를 사용 하지만, 최종 성능 평가는 MAPE를 사용한다.

3.2 하이퍼파라미터 설정

하이퍼파라미터는 딥러닝 연구에서 모델 외부에서 별도로 설정해주어야 하는 값을 의미하고, 학습 성능을 향상하기 위해 하이퍼파라미터 최적화의 중요성이 매우 크므로 이와 관련된 다수 연구가 진행되었다[21].

본 연구는 전력량 예측에 기온 정보를 반영한 WaveNet 구조의 타당성을 확인하기 위한 것으로 기온 정보를 반영하지 않은 연구와 동일한 기준에서 비교하기 위하여 [15]에서 사용한 하이퍼파라미터를 변경 없이 사용하고자 한다. 설정 가능한 하이퍼파라미터는 다음과 같으며, 설정값은 Table 3 과 같다.

입력값의 길이(Input Length) : 모델에 주입하는 전력 수요 및 기온 데이터의 길이(개수)

배치 크기(Batch size) : 모델에 주입하는 데이터 묶음 크기[23]

WaveNet 블록 반복 횟수(# of WaveNet Blocks) : WaveNet이 중첩된 블록의 개수

팽창 비율(Dilation Rates) : Fig. 2와 같이 Conv1D 블 럭의 중첩개수를 의미

학습률 스케줄링(Learning Rate Scheduling) : 학습 속도 및 정확도 향상을 위한 모델의 가중치 변화량 조절 기법

4. 전력수요 예측 모델 성능 분석

본 연구에서 제안하는 기온 데이터를 반영한 WaveNet 전 력수요 예측 모델의 성능을 확인하고 기온 데이터를 반영하지 않은 결과와 비교하기 위하여 AMD EPYC 7302(16 Core CPU)와 Nvidia RTX 3090 GPU(24GB RAM)이 장착된 하드웨어 환경에서 Tensorflow 버전 2.7을 사용하여 분석을 수행한다. 성능 분석 절차는 다음과 같다.

0) 데이터 분할 : 전체 전력수요 및 기온 데이터를 학습데 이터(80%)와 학습 중 검증 데이터(15%), 최종 모델 검증 데이터(5%)로 분할한다.

1) 학습과정 : 전반부 80%에 해당하는 데이터로 학습을 총 50회 수행한다.

2) 모델 선정 및 예측 정확도 분석 : 모델을 선정하기 위해 손실함수로 MSE를 사용하고 총 50회 반복 학습(epochs) 중에서 학습 중 검증 데이터(15%)에 대해 계산한 MSE 값이 가장 낮은 모델을 선정한다.

3) 홀드아웃+WFV 검증 방법 예측 정확도: 최종 모델 검증데 이터를 사용하고 WFV 단계를 적용하여 후반부 5%에 해당하는 최근 데이터로 정확도를 측정한다. 최종 측정 단계에서 Equation (3)과 같이 MAPE를 사용한다.

Fig. 4.

Loss (MSE) in Training and Vaildation
4.png

(3)
[TeX:] $$M A P E=\frac{100}{n} \sum_{t=1}^n\left|\frac{y_t-\hat{y}_t}{y_t}\right|(\%)$$

학습 및 학습 중 검증과정은 총 50회(epochs) 반복하며 학습과정마다 MSE와 MAPE를 학습데이터 및 학습 중 검증 데이터에 대해 계산한다. Fig. 4에는 각 학습 및 검증 단계의 MSE 값을 나타내고 있다.

Fig. 4의 아래쪽 실선은 학습 단계에서 손실함수 값(MSE)을 나타내고 위쪽 실선은 학습 중 검증 단계에서 손실함수 값을 나타낸다. 학습이 진행됨에 따라 모델의 손실함수 값은 점차 감소하고 있지만, 학습 중 검증과정에서는 24회째 반복에서 가장 낮은 값을 나타내고 있다. 학습이 진행됨에 따라 학습 중 검증 손실함수 값은 줄어들지 않고 변동하며 과적합 현상이 발 생하고 있다. 매 학습 단계를 진행하면서 손실함수의 값이 직전 학습 단계에서보다 감소할 때마다 WaveNet 모델의 가중치를 저장하여, 손실함수의 값이 가장 작은 모델을 구할 수 있다.

본 연구에서는 입력데이터가 1시간 간격으로 모델에 주입 되고 24시간 이후의 전력수요를 예측하는 것을 목적으로 한다. 학습이 종료되면 모델을 사용하여 예측, 평가, 학습을 병행하는 WFV를 실시한다. WFV는 검증 데이터를 1시간 간격으로 입력 데이터를 모델에 주입하여 24시간 이후의 전력 수요를 예측하고, 실제값과 비교하여 성능을 평가하고, 모델의 가중치를 갱신하는 과정으로 진행된다. 데이터의 후반부 5%로 구성된 검증데이터를 사용하며 실제 활용 단계에서도 동일한 방식으로 전력수요를 예측하게 된다.

Fig. 5.

Power Demand Prediction with Temperature Data
5.png

기온 데이터를 반영한 모델의 성능을 평가하기 위해 WFV 검증을 통해 예측한 결과는 Figs. 5, 6을 통해 확인할 수 있다. Figs. 5, 6에서 Actual 값은 학습에 사용하지 않은 검증용 데이터의 실제 전력수요를 나타내는 수치이고, Forecast 값은 모델을 통해 예측한 값을 나타낸다. 예측 성능 평가를 위해 전력수요 예측 정확도 평가에 통상적으로 사용하는 MAPE 값(Equation (3) 참조)을 사용한다.

Fig. 5는 검증용 데이터를 대상으로 본 연구에서 제안하고 있는 기온을 반영하여 예측한 전력수요 데이터의 실제값과 모델을 통해 예측된 값을 비교한 결과이고 성능 평가를 위해 계산한 MAPE 값은 1.33%이다. 전력수요가 증가하다가 감소 하는 형태의 계절적 요인에 기인한 거시적 패턴과 낮과 밤의 영향에 기인한 미시적 패턴의 변화에 본 연구에서 제안한 모델이 Fig. 6의 결과와 비교하여 더 정확하게 대응하고 있음을 확인할 수 있다.

Fig. 6에서는 기온 데이터를 포함하지 않고 예측한 실제값과 예측값의 차이를 확인할 수 있다.

Fig. 5와 Fig. 6을 비교하면 전력수요가 증가하다가 감소하 는 변화가 발생하는 타임 스텝 2,000부터 3,000구간에서 기존 모델은 유의한 오차가 발행함을 확인할 수 있지만 기온 데이터를 반영한 모델에서는 정확도가 개선됨을 알 수 있다.

본 연구에서 제안한 기온 데이터를 포함한 모델과 기온 데이터를 포함하지 않은 기존 모델의 성능을 비교하기 위해 Table 4에서는 두 가지 모델의 MAPE 값을 비교한다. 전력 수요 데이터가 증가하는 0부터 1,099까지 구간, 전력수요가 고점에 도달 후 하락하는 1,100부터 2,199까지 구간, 전력 수요가 하락하는 2,200 이후 구간을 나누어 비교한다.

전체 데이터에 대한 MAPE 값은 기온을 반영한 모델에서는 1.33%를 나타내고 기온을 반영하지 않은 모델에서는 2.31%를 나타내고 있다. 또한, 세 구간 모두 본 연구에서 제안한 모델의 성능이 우수함을 확인할 수 있다. 기온 데이터를 추가한 모델에서 전력수요 예측 성능이 높게 나타난 이유는 냉난방용 전력 소비 변동, 자가 소비용 태양광 발전량 변동 등 전력 수요에 기온이 유의한 영향을 미치기 때문으로 판단된다.

Fig. 6.

Power Demand Prediction w/o Temperature Data
6.png

Table 4.

Performance Comparison
Time Steps Mean absolute percentage error (%)
With Temp. W/O Temp.
[0, 1099] 1.09 2.04
[1100, 2199] 1.41 2.29
[2200, 3407] 1.48 2.60
Total 1.33 2.31

5. 결 론

본 연구에서는 기온 데이터를 반영한 WaveNet 딥러닝 기법 을 적용하여 24시간 이후의 전력 소비량을 예측하는 모델을 제안하고 있다. 기존 연구에서 전력수요를 예측하기 위해 사용하 는 딥러닝 모델인 RNN, CNN 계열의 네트워크 보다 장기간의 데이터를 예측할 때 우수한 것으로 알려진 WaveNet을 기반으 로 하고 WFV 검증 기법을 사용하여 정확도가 향상된 모델을 구축하고 MAPE 값을 성능지표로 하여 성능을 분석하였다.

기온 데이터 추가에 의한 성능 향상을 비교하기 위해 [15] 에 사용된 데이터와 동일한 학습환경, 하이퍼파라미터 및 검 증데이터를 사용하였다. 전력수요에 변동이 큰 상황에서도 예측 성능이 보장됨을 확인하기 위해 전력 수요가 증가하다 하락하는 구간의 데이터를 검증 데이터로 사용하였다. 본 연구에서 제안된 기온 데이터를 추가한 딥러닝 모델은 모든 구간에서 기온 데이터를 추가하지 않은 모델에 비해 우수한 성능을 나타내었다.

전력수요를 예측하기 위해 기온 데이터를 사용하려면 전력 수요가 발생하는 시점 기온을 사전에 예측해야 한다. 일반적 으로 전력거래의 특성으로 인해 특수일(공휴일 등)에 전력수요가 급격히 감소하는 현상이 나타나고, 전력수요를 과소 예측하는편이 과대 예측하는 것보다 선호되는 상황을 본 연구에서 제안하는 모델에 반영되지 않은 한계점을 지니고 있어 개선이 필요하다고 할 수 있다. 추후 연구를 통해 본 연구의 한계점을 보완하고 전력 거래에 활용할 수 있는 전력 수요 예측 시스템을 구축하고자 한다.

Biography

윤 협 상

https://orcid.org/0000-0003-3306-7327

e-mail : hsyoon@cu.ac.kr

1997년 KAIST 산업공학과(학사)

2000년 KAIST 산업공학과(석사)

2007년 KAIST 산업공학과(박사)

2010년 ~ 현 재 대구가톨릭대학교 컴퓨터정보학부 부교수

관심분야 : 이미지 인식, 실험계획법, 하이퍼파라미터 최적화

Biography

정 석 봉

https://orcid.org/0000-0002-6209-1935

e-mail : sbjung@kiu.ac.kr

1999년 KAIST 산업경영학과(학사)

2001년 KAIST 산업공학과(석사)

2005년 KAIST 산업공학과(박사)

2010년 ~ 현 재 경일대학교 철도학부 교수

관심분야 : 이미지 인식, 스마트팜, 철도전력예측

References

  • 1 G. Kim, G. Lee, I. Choi, and J. Kim, "Forecasting strategy for hydropower power market price by power demand analysis and forecast," Proceedings of the KIEE Conference, pp.656-657, 2011.custom:[[[https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE01775692]]]
  • 2 K. H. Kim, B. Chang, and H. K. Choi, "Deep learning based short-term electric load forecasting models using one-hot encoding," Journal of IKEEE, Vol.23, No.3, pp.852-857, 2019.custom:[[[https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09218072]]]
  • 3 T. Hong, M. Gui, M. Baran, and H. L. Willis, "Modeling and forecasting hourly electric load by multiple linear regression with interactions," Proceedings of the IEEE Power and Energy Society General Meeting, pp.1-8, 2010.doi:[[[10.1109/pes.2010.5589959]]]
  • 4 T. Hong, P. Wang, and H. L. Willis, "A naïve multiple linear regression benchmark for short term load forecasting," Proceedings of the IEEE Power and Energy Society General Meeting, Vol.2, pp.1-6, 2011.doi:[[[10.1109/pes.2011.6038881]]]
  • 5 A. Karim and S. Ariffin, "Electricity load forecasting in UTP using moving averages and exponential smoothing techniques," Applied Mathematical Sciences, Vol.7, No.77-80, pp.4003-4014, 2013.doi:[[[10.12988/ams.2013.33149]]]
  • 6 S. Hochreiter and J. Schmidhuber, "Long short-term memory," Neural Computation, Vol.9, No.8, pp.1735-1780, 1997doi:[[[10.1007/978-3-030-03243-2_856-1]]]
  • 7 K. Cho, B. van Merriënboer, C. Gulcehre, D. Bahdanau, F. Bougares, H. Schwenk, and Y. Bengio, "Learning phrase representations using RNN encoder-decoder for statistical machine translation," Proceedings of Empirical Methods in Natural Language Processing, pp.1724-1734, 2014.custom:[[[https://arxiv.org/abs/1406.1078]]]
  • 8 D. Lee, Y. Sun, S. Kim, I. Sim, Y. Hwang, and J. Kim, "Comparison of power consumption prediction scheme based on artificial intelligence," The Journal of the Institute of Internet, Broadcasting and Communication, Vol.19, No.4, pp.161-167, 2019.doi:[[[10.7236/JIIBC.2019.19.4.161]]]
  • 9 J. Lee and D. Kim, "A study on short-term electricity demand prediction using stacking ensemble of machine learning and deep learning ensemble models," Proceedings of ACK 2021, Vol.28, No.2, pp.566-569, 2021.doi:[[[10.3745/PKIPS.y2021m11a.566]]]
  • 10 S. Lee, J. Seon, S. Kim, and J. Kim, "Power trading system through the prediction of demand and supply in distributed power system based on deep," Journal of the Institute of Internet, Broadcasting and Communication, Vol.21, No.6, pp.163-171, 2021.doi:[[[10.7236/JIIBC.2021.21.6.163]]]
  • 11 J. Park, D. Shin, C. Kim, C. Author, and C. Kim, "Deep learning model for electric power demand prediction using special day separation and prediction elements extention," Journal of Advanced Navigation Technology, Vol.21, No.4, pp.365-370, 2017.custom:[[[https://koreascience.kr/article/JAKO201726163356540.pdf]]]
  • 12 J. Choi, "Performance comparison of machine learning in the prediction for amount of power market," Journal of the Korea Institute of Electronic Communication Sciences, Vol.14, No.5, pp.943-950, 2019.doi:[[[10.13067/JKIECS.2019.14.5.943]]]
  • 13 H. Tak, T. Kim, H.-G. Cho, and H. Kim, "A new prediction model for power consumption with local weather information," Journal of the Korea Institute of Electronic Communication Sciences, Vol.16, No.11, pp.488-498, 2016.doi:[[[10.5392/jkca.2016.16.11.488]]]
  • 14 A. van den Oord, et al., "WaveNet: A generative model for raw audio," arXiv preprint arXiv:1609.03499, 2016.custom:[[[https://arxiv.org/abs/1609.03499]]]
  • 15 H.-S. Yoon, "Time series data analysis using wavenet and walk forward validation," Journal of the Korea Society for Simulation, Vol.30, No.4, pp.1-8, 2021.doi:[[[10.9709/JKSS.2021.30.4.001]]]
  • 16 I. E. Livieris, P. Emmanuel, and P. Panagiotis, "A CNN-LSTM model for gold price time-series forecasting," Neural Computing and Applications, Vol.32, No.23, pp.17351-17360, 2020.doi:[[[10.1007/s00521-020-04867-x]]]
  • 17 A. Tealab, "Time series forecasting using artificial neural networks methodologies: A systematic review," Future Computing and Informatics Journal, Vol.3, No.2, pp.334-340. 2018.doi:[[[10.1016/j.fcij.2018.10.003]]]
  • 18 J. Moon, S. Park, and E. Hwang, "A multilayer perceptron- based electric load forecasting scheme via effective recovering missing data," KIPS Transactions on Software and Data Engineering, Vol.8, No.2, pp.67-87, 2019.doi:[[[10.3745/KTSDE.2019.8.2.67]]]
  • 19 KMA Weather Data Service, (Internet), https://data.kma.go. kr/.custom:[[[https://data.kma.go.kr/]]]
  • 20 T. T. Ngoc, L. van Dai, and D. T. Phuc, "Grid search of multilayer perceptron based on the walk-forward validation methodology," International Journal of Electrical and Computer Engineering, Vol.11, No.2, pp.1742-1751, 2021.doi:[[[10.11591/ijece.v11i2.pp1742-1751]]]
  • 21 J. Bergstra, R. Bardenet, Y. Bengio, and B. Kegl, "Algorithms for hyper-parameter optimization," Proceedings of 25th Annual Conference on Neural Information Processing Systems, pp.1-9, 2011.custom:[[[https://proceedings.neurips.cc/paper/2011/file/86e8f7ab32cfd12577bc2619bc635690-Paper.pdf]]]
  • 22 I. Babuschkin, "A TensorFlow implementation of DeepMind's WaveNet paper," Github, 2022, (Internet), https://github.com/ ibab/tensorflow-wavenet.custom:[[[https://github.com/ibab/tensorflow-wavenet]]]
  • 23 D. Masters and C. Luschi, "Revisiting small batch training for deep neural networks," pp.1-18, arXiv preprint arXiv: 1804.07612, 2018.custom:[[[https://arxiv.org/abs/1804.07612]]]

Statistics


Related Articles

EPC 프로젝트의 위험 관리를 위한 ITB 문서 조항 분류 모델 연구: 딥러닝 기반 PLM 앙상블 기법 활용
H. Lee, W. Lee, B. Jo, H. Lee, S. Oh, S. You, M. Nam, H. Lee
흉부 X-ray 기반 의료영상 품질평가 보조 도구 개발
G. Nam, D. Yoo, Y. Kim, J. Sun, J. Lee
TCN 딥러닝 모델을 이용한 최대전력 예측에 관한 연구
L. J. Il
검색어 빈도 데이터를 반영한 코로나 19 확진자수 예측 딥러닝 모델
S. Jung
딥러닝을 활용한 한국어 스피치 애니메이션 생성에 관한 고찰
S. C. Kang and D. J. Kim
멀티 에이전트 에지 컴퓨팅 환경에서 확장성을 지원하는 딥러닝 기반 동적 스케줄링
J. Lim
멀티모달 방식을 통한 가스 종류 인식 딥러닝 모델 개발
S. H. Ahn, G. Y. Kim, D. J. Kim
특성맵 차분을 활용한 커널 기반 비디오 프레임 보간 기법
D. Seo, M. Ko, S. Lee, J. Park
딥러닝 기반 비디오 캡셔닝의 연구동향 분석
L. Zhi, E. Lee, Y. Kim
확률적 교차 연산을 이용한 보편적 관계 추출
J. Lee and J. Kim

Cite this article

IEEE Style
H. Yoon and S. Jeong, "Electric Power Demand Prediction Using Deep Learning Model with Temperature Data," KIPS Transactions on Software and Data Engineering, vol. 11, no. 7, pp. 307-314, 2022. DOI: https://doi.org/10.3745/KTSDE.2022.11.7.307.


ACM Style
Hyoup-Sang Yoon and Seok-Bong Jeong. 2022. Electric Power Demand Prediction Using Deep Learning Model with Temperature Data. KIPS Transactions on Software and Data Engineering, 11, 7, (2022), 307-314. DOI: https://doi.org/10.3745/KTSDE.2022.11.7.307.