About
home
About Me
home

감귤 착과량 예측 AI 모델 개발

프로젝트 개요

주제: 감귤 착과량 예측 AI 모델 개발

배경 요약:

감귤 재배의 핵심적인 요소인 생산량 추정은 수확 후 관리, 마케팅 계획, 노동력 배분 및 저장 전략의 기초를 제공함.
현재 감귤 생산량 추정은 제한된 인력으로 약 22,000ha의 대규모 재배지를 조사하는 데에 시간과 자원이 많이 소요되며, 관측에 기반한 조사 방식은 일관성 없는 데이터 수집으로 이어짐.
이러한 문제를 해결하기 위해, 감귤나무의 생육 상태, 엽록소, 새순 데이터를 활용하여 착과량을 예측하는 AI 모델 개발이 필요함

데이터 수집:

출처: 데이콘 (https://dacon.io)
수집기간: 2022.09.01 ~ 2022.11.28
데이터량: 2,207개 (train 70%, test 30%)

EDA

착과량 및 나무생육상태 히스토그램 분석 결과, 정규분포를 보이고 있음
2022년 9월 1일 새순이 최대값이며, 시간이 지날수록 일정하게 줄어들기 때문에 9월 이전 새순 작업을 해야 되는 것으로 분석 되었음
새순 최소값이 0이 아닌 경우(True=1)가 그러한 경우(False=0)보다 평균 착과량이 약 2배정도 높음
IQR이 겹치지 않는 것으로 보아 주목할만한 차이가 있는 것으로 분석되었음
각 변수 및 착과량(Int)과의 상관관계 히트맵과 산점도 분석 결과
적용 변수 : 착과량, 나무생육상태변수, 새순 min, 새순 max, 엽록소 통계량
나무 생육 상태, 새순 통계량, 엽록소 통계량 간의 상관관계는 매우 약한 것을 볼 수 있음
이중 새순의 min과 max가 착과량(int)와 강한 양의 상관관계를 가지고 있음

모델링

데이터 전처리 및 정규화
train data set: 1544 / test data set: 663
normalize: zscore
모델 비교 및 선정
Gradient Boosting Regressor: 평균 절대 오차(MAE)는 32.04, 평균 제곱 오차(MSE)는 1557.26, 루트 평균 제곱 오차(RMSE)는 39.44, 결정 계수(R²)는 0.9668, RMSLE는 0.3049
모델학습 및 성능
평균 제곱 오차(MSE)는 1557.26
루트 평균 제곱 오차(RMSE)는 39.44
평균 절대 오차(MAE)는 32.04로 측정되었습니다. 비교적 낮은 오차 값을 가지고 있음을 의미합니다.

모델링&결론