프로젝트 개요
주제: 감귤 착과량 예측 AI 모델 개발
배경 요약:
•
감귤 재배의 핵심적인 요소인 생산량 추정은 수확 후 관리, 마케팅 계획, 노동력 배분 및 저장 전략의 기초를 제공함.
•
현재 감귤 생산량 추정은 제한된 인력으로 약 22,000ha의 대규모 재배지를 조사하는 데에 시간과 자원이 많이 소요되며, 관측에 기반한 조사 방식은 일관성 없는 데이터 수집으로 이어짐.
•
이러한 문제를 해결하기 위해, 감귤나무의 생육 상태, 엽록소, 새순 데이터를 활용하여 착과량을 예측하는 AI 모델 개발이 필요함
데이터 수집:
•
•
수집기간: 2022.09.01 ~ 2022.11.28
•
데이터량: 2,207개 (train 70%, test 30%)
EDA
•
착과량 및 나무생육상태 히스토그램 분석 결과, 정규분포를 보이고 있음
•
2022년 9월 1일 새순이 최대값이며, 시간이 지날수록 일정하게 줄어들기 때문에 9월 이전 새순 작업을 해야 되는 것으로 분석 되었음
•
새순 최소값이 0이 아닌 경우(True=1)가 그러한 경우(False=0)보다 평균 착과량이 약 2배정도 높음
•
IQR이 겹치지 않는 것으로 보아 주목할만한 차이가 있는 것으로 분석되었음
각 변수 및 착과량(Int)과의 상관관계 히트맵과 산점도 분석 결과
•
적용 변수 : 착과량, 나무생육상태변수, 새순 min, 새순 max, 엽록소 통계량
•
나무 생육 상태, 새순 통계량, 엽록소 통계량 간의 상관관계는 매우 약한 것을 볼 수 있음
•
이중 새순의 min과 max가 착과량(int)와 강한 양의 상관관계를 가지고 있음
모델링
데이터 전처리 및 정규화
•
train data set: 1544 / test data set: 663
•
normalize: zscore
모델 비교 및 선정
•
Gradient Boosting Regressor: 평균 절대 오차(MAE)는 32.04, 평균 제곱 오차(MSE)는 1557.26, 루트 평균 제곱 오차(RMSE)는 39.44, 결정 계수(R²)는 0.9668, RMSLE는 0.3049
모델학습 및 성능
• 평균 제곱 오차(MSE)는 1557.26
•
루트 평균 제곱 오차(RMSE)는 39.44
•
평균 절대 오차(MAE)는 32.04로 측정되었습니다. 비교적 낮은 오차 값을 가지고 있음을 의미합니다.