Ⅰ. 서론
최근 지구온난화에 의해 국내 기온은 점차 증가하고 있는 추세 (Shim et al., 2013)이며 이로 인한 이상기상은 기상재해의 발생 빈도를 증가시키는 원인이 된다(IPCC, 2015). 우리나라는 겨울과 봄 가뭄이 심해지고 집중호우도 증가하고 있으며 한반도 태풍의 빈도와 강도 모두 증가하였다(기상청, 2020). Na and Jung (2021) 은 국내에서 비태풍 시기에 발생하는 강풍 (풍속 14m/s 이상)의 빈도와 강도가 점차 증가하는 추세라고 하였다. 이러한 기상재해 발생은 풀사료 생산에 부정적인 영향을 미칠 것으로 사료된다. 특 히 1904년부터 2000년까지 폭풍우, 강풍, 태풍 등 기상재해 발생 은 8월이 많았고 그 다음이 7월로 보고하고 있는데(Shim et al., 2003) 이 시기는 사일리지용 옥수수(Whole Crop Maize, WCM) 의 생육단계가 출수기부터 황숙기에 해당하므로 기상재해의 영향 을 가장 민감하게 받는 시기이다. 또한 Lee and Kwon (2004)은 국내 여름철 강수량 변동(1941~1970년 및 1971~2000년, 총 2회) 을 분석한 결과 전 지역에서 8월의 강수량이 증가한 것을 확인하 였는데 이러한 추세가 WCM의 생산량에 어떠한 영향을 미칠지 분석할 필요가 있다. 따라서 기온, 강수량, 풍속 등의 이상기상이 WCM의 건물수량(Dry matter yield, DMY)에 미치는 영향을 확 인하고 생산량에 미치는 피해량을 분석·평가하는 연구가 필요하다.
수량예측모델은 혼파초지, 알팔파 및 옥수수(Kim et al., 2021;Oh, 2017;Peng, 2017) 등 풀사료에서 기상요인과 관련한 연구 가 활발히 진행되고 있다. 다양한 요인을 고려하여 풀사료 생산량 을 제시하는 수량예측모델은 설정된 이상기상 조건에서 WCM의 DMY를 예측하는데 효과적일 것으로 사료되며 피해량 산출에 이 용 가능할 것으로 생각된다.
이상기상에 따른 WCM의 피해량을 산출하기에 앞서 이상기 상의 기준을 확립할 필요가 있다. 기상청은 가뭄, 폭우 및 한파 등 이상기상 기준을 제시하고 있으나 이는 사람을 대상으로 설정 한 것이므로 WCM의 생산량에 영향을 미치는 이상기상 기준은 별도로 설정할 필요가 있다. Sung (2020)은 이상저온, 이상풍, 가 뭄, 폭우 및 열대야를 WCM의 이상기상 기준으로 설정하였다. 설정한 조건 중 이상저온(일최저온도 5℃ 이하 3일 이상 지속) 조 건에서 통계 모델을 통한 WCM의 피해량은 저온이 발생한 경우 와 저온이 발생하지 않은 경우의 DMY 간 유의적인 차이가 없었 다. 또한 통계 모델을 이용하는 것은 많은 시간과 노동력이 소요 되며 특이기상 자료가 적어 피해량 산출에 어려움이 있었다. 따라 서 WCM의 피해량 산출은 다양한 요인을 고려할 수 있고 신속한 분석이 가능하며 정확성을 높이는 기계학습(Machine learning)을 이용하는 것이 유리할 것으로 판단하였다. 이와 관련하여 Jo et al. (2020a;2020b)는 WCM 수량예측에 기계학습을 이용하였을 때 통계 기반 수량예측보다 정확성이 높은 것으로 보고하였다.
본 연구는 기계학습을 통한 수량예측모델을 제작하고 이상기 상 조건에서 WCM의 DMY를 예측하여 피해량을 산출할 목적으 로 수행하였다.
Ⅱ. 재료 및 방법
1. WCM 데이터 수집 및 가공
본 연구에서 WCM 데이터는 수입적응성 시험보고서, 국립축 산과학원 시험연구보고서, 한국축산학회지, 한국초지조사료학회 지 및 사일리지용 옥수수의 재배실험에 관한 학위논문에서 수집 하였으며 출처에 따른 데이터 수는 Table 1과 같다. 데이터의 수 집 연도는 1978년부터 2017년까지이며, DMY, 재배지역, 파종일 및 수확일 등을 포함하고 있다.
WCM 데이터 가공 과정에서는 전체 WCM 데이터(n=3,232) 로부터 DMY의 이상점을 제거하였다. 먼저 DMY의 히스토그램 을 확인한 결과 분포의 꼬리에서 절삭점(cut-off)이 나타나 이를 이상점으로 판단하였다. 이상점은 7,000 kg/ha 미만 그리고 26,000 kg/ha 초과인 DMY였고 이에 해당하는 백분율이 상·하위 3%였 다. 제거한 데이터는 총 204점이었으며 최종적으로 분석에 이용 한 WCM 데이터는 총 3,028점이다. WCM 데이터 가공 전·후 DMY 값의 범위는 65~35,209 kg/ha에서 7,848~25,094 kg/ha로 변경되었다.
수량예측모델은 데이터 수가 많을수록 정확성이 증가하는 특 징을 고려하여 본 연구에서는 경기도 7개 지역(광주, 수원, 안성, 여주, 이천, 의정부 및 화성)의 WCM 데이터를 이용하여 수행하 였다. 경기도 지역은 WCM 데이터가 1,534점으로 타 도에 비해 많았으며 이는 전체 WCM 데이터의 약 47%를 차지하였다 (Table 2).
2. 기상 데이터 수집 및 가공
기상 데이터는 기상청의 기상자료개방포털에서 경기도 종관기 상대(동두천, 수원, 양평, 이천 및 파주)의 데이터를 수집하였다. 데이터 수집 연도는 WCM의 데이터 수집 연도와 같은 1978년부 터 2017년까지이며 수집한 데이터는 시간단위 기온, 강수량 및 풍속 등을 포함하고 있다.
기상 데이터 가공 과정에서 결측값은 해당 시간의 전·후 시간 측정값의 평균을 입력하는 것으로 보완하였다. 또한 기상 데이터 는 피해량 산출의 정확도를 높이기 위해 WCM의 생육기간을 고 려하여 년도별 기상 데이터 중 4월 1일부터 10월 31일까지의 기 간이 이용되었다.
3. 수량예측모델 제작
수량예측모델은 수집 후 가공한 WCM 및 기상 데이터를 기반 으로 기계학습을 통해 제작되었다. 수량예측모델은 WCM의 생 육기간 및 재배지역에 따른 기상 조건의 DMY를 학습하였으며 특정 기상 조건 하에서 DMY 예측값을 산출하였다. 모델 학습 시 WCM 데이터의 재배지역 중 경기도에 해당하면서 종관기상대가 존재하지 않는 지역은 가장 가까운 경기도 종관기상대를 적용하 였다. 따라서 종관기상대가 존재하지 않는 광주, 안성, 여주, 의정 부 및 화성의 기상 데이터는 각각 양평, 수원, 이천, 동두천 및 수 원의 것을 적용하였다. 수량예측모델 제작에 이용한 기계학습 기 법은 Linear, FM(Factorization Model), Deep, DeepCrossing, Wide&Deep, DeepFM, CIN(Compressed Interaction Network) 및 xDeepFM으로 총 8가지였다. 본 연구에서 피해량 산출을 위 하여 기계학습 기법으로 제작된 수량예측모델의 선정은 R2값이 가장 높고 평균 제곱근 오차(Root Mean Square Error, RMSE)값 이 가장 낮은 것을 선택하였다. 기계학습을 통한 수량예측모델 제 작에 사용한 프로그램은 Python 및 Tensorflow였다.
4. 이상기상 피해량 산출 방법
이상기상에 따른 DMY 피해량(DMYdamage)은 경기도 종관기 상대의 지역별 정상기상 및 이상기상을 설정하고 수량예측모델을 통해 각 기상에서의 DMY를 예측한 후 정상기상에서의 DMY 예 측값(DMYnormal)과 이상기상에서의 DMY 예측값(DMYabnormal) 간 차이를 통해 산출하였다. 피해량 산출 과정은 아래의 식과 같다.
여기서, WCM의 DMYnormal 및 DMYabnormal 산출을 위한 정상 및 이상기상은 다음과 같은 방법으로 설정하였다. 지역별 정상기 상은 WCM 데이터 수집 연도(1978~2017년)에 해당하는 년도별 기상 데이터의 평균(40년 평균)으로 설정하였다. 지역별 이상기 상은 정상기상에서 특정 기상요인(기온, 강수량 및 풍속)에 변동 값을 주어 설정하였다. 이상기상의 변동값은 세계기상기구 (WMO)의 방식(Park et al., 2015)을 준용하여 WCM 데이터 수 집 기간(1978~2017년) 내 기상요인별 평균 및 표준편차 (Standard Deviation, SD)를 계산한 후 SD의 ±1 및 ±2배수의 4 단계 수준(SD의 -2, -1, +1 및 +2배)으로 설정하였다(Table 3). 기상요인별 SD는 지역에 따라 차이가 있었으며 기온, 강수량 및 풍속이 각각 0.60~0.99℃, 0.05~0.07 mm 및 0.12~0.65 m/s의 범 위에 있었다.
Ⅲ. 결과 및 고찰
1. 이상기상 수준에 따른 WCM의 DMY 예측값
8가지 기계학습 기법에 따른 WCM 수량예측모델의 R2 및 RMSE값은 각각 0.4534~0.5442 및 0.1769~0.1938 범위였다. 본 연구에서 이용한 기계학습을 통한 WCM의 수량예측모델은 R2값 이 0.5442로 가장 높고 RMSE값이 0.1769로 가장 낮은 DeepCrossing 을 선정하였다(Table 4). 본 연구에서 WCM의 수량예측을 위해 여러 기법을 비교한 결과 DeepCrossing이 가장 우수한 결과를 보여주었다. 이는 다른 모델에 비해 R2값이 높아서 설명력이 좋 고 RMSE값이 낮아서 오류가 적은 예측을 수행한다는 것을 의미 한다. WCM의 수량예측에 사용한 데이터는 주로 시계열의 연속 된 날씨 정보이므로 시간당 기온, 강수량, 풍속 등 자체적으로 정 보를 많이 포함하고 있다. 그러므로 기계학습 기법의 정확성은 선 형회귀만 사용하는 Linear 기법에서 좋지 않고 Linear와 Deep을 결합한 Wide&Deep 기법도 선형회귀 방법을 고려하기 때문에 좋 지 않았다. 또한 행렬 분해를 사용하는 FM, DeepFM, CIN 및 xDeepFM 기법은 데이터를 2~3개 정도만 비교하기 때문에 유용 한 패턴을 찾기 어렵기 때문에 정확성이 떨어진다. 오히려 신경망 으로만 구성된 Deep 기법과 DeepCrossing 기법이 시계열 날씨 정보의 여러 데이터를 비교하기 때문에 높은 정확성을 가지는 것 으로 판단된다. DeepCrossing을 통한 수량예측모델로 산출한 정 상기상에서 WCM의 DMY 예측값은 지역에 따라 차이가 있었으 며 15,003~17,517 kg/ha 범위였다(Table 5).
DeepCrossing을 통한 수량예측모델로 산출한 이상기온에서 WCM의 DMY 예측값은 지역과 이상기온 수준에 따라 차이가 있었으며 14,947~17,571 kg/ha 범위였다(Table 6). 이상기온에 따른 WCM의 DMY 예측값은 모든 지역에서 이상기온 수준이 높아질수록 증가하는 경향을 보였으나 증가량이 미미한 수준이었 다. 기온이 상승할수록 DMY 예측값이 증가하는 이유는 WCM 의 생육 최적 온도와 관련이 있는 것으로 보인다. WCM은 일평 균기온이 최저 8℃, 최적 32~34℃, 최고 40℃일 때 생육을 시작하 며 토양 수분이 보통일 경우 일평균기온 26~32℃, 토양 수분이 충분할 경우 일평균기온 35~38℃에서 광합성 능력이 활발하다 (Lee and Kim, 2019). 경기도 지역별 WCM 생육기간의 평균기 온은 18.8~19.6℃로 이상기온에 의해 기온이 상승할 경우 오히려 WCM의 적정 생육온도에 가까워져 DMY가 증가하는 것으로 사 료된다.
DeepCrossing을 통한 수량예측모델로 산출한 이상강수량에서 WCM의 DMY 예측값은 지역과 이상강수량 수준에 따라 차이가 있었으며 14,986~17,525 kg/ha 범위였다(Table 7). 이상강수량에 따른 WCM의 DMY 예측값은 모든 지역에서 이상강수량 수준이 높아질수록 증가하는 경향을 보였으나 증가량이 미미한 수준이었 다. WCM은 습해에 약한 작물로 알려져 있음에도(Shin et al., 2017) 강수량이 증가할수록 DMY가 증가하는 결과가 나타난 것 으로 보아 본 연구에서 설정한 이상강수량(수준당 0.05~0.07 mm/hr)은 WCM의 DMY에 있어 습해 피해를 발생시키지 못하 는 수준인 것으로 판단된다. 또한 이는 6월 및 7월 강수량의 증가 가 WCM의 수확량 증가와 관계가 있다는 Kucharik and Serbin (2008)의 보고와 유사한 결과를 나타낸다. 강수량이 감소할 때 WCM의 DMY가 감소한 것은 WCM이 가뭄에 의해 피해를 받았 기 때문인 것으로 보인다. WCM은 C4 작물의 특성상 다른 작물 에 비해 가뭄에 상대적으로 강한 특성을 가지지만 기후변화로 인 하여 가뭄 현상이 지속될 경우 DMY가 감소할 것으로 예측된다 (Chung et al., 2019). 현재 가뭄에 의해 WCM의 수량이 피해를 받은 연구가 다수 보고되어 있다(Ji et al., 2011;Min et al., 2021). 따라서 본 연구의 결과를 보았을 때 WCM의 경우 국내 경기도 기상에서 습해보다 가뭄에 의한 피해가 심할 것으로 사료 된다.
DeepCrossing을 통한 수량예측모델로 산출한 이상풍속에서 WCM의 DMY 예측값은 지역과 이상풍속 수준에 따라 차이가 있었으며 14,920~17,557 kg/ha 범위였다(Table 8). 이상풍속에 따른 WCM의 DMY 예측값은 모든 지역에서 이상풍속 수준이 높아질수록 감소하는 경향을 보였으나 감소량이 미미한 수준이었 다. 본 연구에서 WCM은 풍속이 증가할수록 도복 가능성이 높아 져 DMY가 감소할 것으로 보이나 이와 관련된 연구가 없어 인과 관계를 규명하기 위한 연구가 필요하다.
2. 이상기상 수준에 따른 WCM의 피해량
이상기온, 이상강수량 및 이상풍속 수준에 따른 WCM의 피해 량은 각각 –68~89 kg/ha, -17~17 kg/ha 및 –112~121 kg/ha 범위 였다(Table 9~11). 이상기온 수준에 따른 WCM의 최대 피해량은 양평에서 시간당 기온이 1.86℃ 감소(-2 수준)할 때 89 kg/ha로 나타났다. 이상강수량 수준에 따른 WCM의 최대 피해량은 파주 에서 시간당 강수량이 0.14 mm 감소(-2 수준)할 때 17 kg/ha로 나타났다. 이상풍속 수준에 따른 WCM의 최대 피해량은 양평에 서 시간당 풍속이 0.52m/s 증가(+2 수준)할 때 121 kg/ha로 나타 났다.
본 연구에서 산출된 WCM의 최대 피해량 121 kg/ha(양평)는 정상기상에서 DMY 17,517 kg/ha의 0.7%에 해당한다. Kim et al. (2019)은 7월 폭우(월 강우량 1,000 mm 이상)가 WCM의 DMY에 미치는 영향에서 정상수량 16,447 kg/ha 중 28.9%에 해 당하는 4,745 kg/ha이 감소했다고 보고하였다. 또한 Kim and Sung (2021)은 중부내륙 지방에서 이상기상(가을 저온, 겨울 냉 해 및 봄 가뭄)이 이탈리안 라이그라스의 DMY에 미치는 영향에 서 각각 10,698 kg/ha 중 1,451 kg/ha(13.5%), 10,153 kg/ha 중 2,619 kg/ha(25.8%) 및 10,776 kg/ha 중 2,048 kg/ha(19.0%) 감 소하였다고 보고하였다. 이러한 연구들과 비교한 결과 0.7%의 피 해는 적어 이상기상에 따른 피해가 발생하였다고 판단하기 어려 운 수준이다. 본 연구에서 피해량이 적게 발생한 이유는 기계학습 에 사용된 기상 데이터가 대부분 정상기상의 범위(정상기상 ±2 기상요인별 표준편차)에서 벗어나는 이상기상 데이터가 적은 것 에 기인하는 것으로 사료된다. 경기도 기상 데이터(n=160) 중 이 상기상에 해당하는 데이터(n=26)의 비율(16%)은 정상기상에 해 당하는 데이터(n=134)의 비율(84%)보다 현저히 낮았다. 그러므 로 이상기상에 속한 데이터를 충분히 학습한 수량예측모델을 이 용하면 보다 정확한 WCM의 피해량을 산출할 수 있을 것으로 예 상된다. 이를 위해 수량예측모델은 이상기상에 속한 데이터를 반 복 학습하여 정상기상 범위에 속한 데이터와 유사한 비율로 맞출 필요가 있을 것으로 사료된다.
Ⅳ. 요약
본 연구는 기계학습을 통한 수량예측모델을 이용하여 이상기 상에 따른 WCM의 DMY 피해량을 산출하기 위한 목적으로 수 행하였다. 수량예측모델은 WCM 데이터 및 기상 데이터를 수집 후 가공하여 8가지 기계학습을 통해 제작하였으며 실험지역은 경 기도로 선정하였다. 수량예측모델은 기계학습 기법 중 정확성이 가장 높은 DeepCrossing (R2=0.5442, RMSE=0.1769) 기법을 통 해 제작하였다. 피해량은 정상기상 및 이상기상의 DMY 예측값 간 차이로 산출하였다. 정상기상에서 WCM의 DMY 예측값은 지역에 따라 차이가 있으나 15,003~17,517 kg/ha 범위로 나타났 다. 이상기온, 이상강수량 및 이상풍속에서 WCM의 DMY 예측 값은 지역 및 각 이상기상 수준에 따라 차이가 있었으며 각각 14,947~17,571 kg/ha, 14,986~17,525 kg/ha 및 14,920~17,557 kg/ha 범위로 나타났다. 이상기온, 이상강수량 및 이상풍속에서 WCM의 피해량은 각각 –68~89 kg/ha, -17~17 kg/ha 및 – 112~121 kg/ha 범위로 피해로 판단할 수 없는 수준이었다. WCM의 정확한 피해량을 산출하기 위해서는 수량예측모델에 이 용하는 이상기상 데이터 수의 증가가 필요하다.