[ 팀 프로젝트 심화 ] - 기획서 작성
주제 : [축산/식품] 질병 조기 경보를 통한 식품 공급망 리스크 관리
프로젝트 목표
- 프로젝트를 통해 해결하려는 질문이나 목표를 명확히 기술하세요. 데이터를 통해 가축의 상태를 수치화하고(Condition Score), 통계로 효과를 증명하며(ANOVA), AI의 판단 근거를 제시함으로써(XAI), 가축의 복지와 농가의 수익성을 동시에 잡는 스마트 축산 품질 관리 솔루션을 완성하는 것"입니다.
- 프로젝트의 주요 분석 내용 및 목표를 설정하세요.
- 주요 분석 내용
- 사료 급여 및 건강 지표를 이용하여 우유 생산량을 예측.
- 이상 징후 탐지를 통해 질병의 초기 징후를 감지.
- 영양, 건강, 생산성 간의 관계를 탐구.
- 지속 가능한 낙농업을 위한 AI 기반 솔루션을 구축.
- 목표
- 축산 질병 및 식품 수급 데이터의 구조와 품질 상태를 파악하고, [EDA → 통계 검정 → 머신러닝 모델링]으로 이어지는 체계적인 분석 파이프라인을 직접 수행한다.
- 다양한 변수 중 질병 확산에 통계적으로 유의미한 영향을 미치는 핵심 변수를 식별하고, 이를 바탕으로 리스크 예측 가능성을 검증한다
- 단순히 기술적 구현에 그치지 않고, 변수 선택의 근거와 분석 결과를 도메인 관점에서 해석하여 팀 차원의 통합된 논리 체계를 구축한다.
- 주요 분석 내용
- 분석 및 시각화의 중점
- 가축의 체온, 반추 시간, 그리고 외부 환경(THI)의 변화가 우유 생산량 감소에 미치는 통계적 기여도는 얼마인가?
- 가축의 질병 상태(Disease_Status)가 우유 생산량(Milk_Yield_L) 및 체중(Weight_kg)에 미치는 통계적 영향력은 얼마나 되는가?
- 초기 생체 신호(체온, 반추 시간 등)를 활용하여 향후 1~4주 내 개체별 우유 생산량이 임계점 이하로 떨어질 확률을 어느 정도의 신뢰도로 예측할 수 있는가?
- 온습도 지수가 특정 임계점을 넘어가면, 음수량이 늘고 이러한 패턴은 우유 생산량 급감 및 질병 발생으로 이어지는가?
- 개체별 우유 생산성을 극대화하는 사료 비율이 존재하는가?
- 문제의 필요성 및 중요성
- 프로젝트가 제공할 데이터 인사이트가 중요한 이유를 작성:
- 파편화된 데이터의 통합을 통한 다각적 분석 체계 마련 단편적인 질병 탐지와 개별 생산량 데이터를 하나로 통합하여 [생체 신호 - 건강 상태 - 생산 수율]로 이어지는 전주기적 분석 체계를 마련
- 생산성 변동 요인의 과학적 규명 및 관리 효율화 통계적 기법을 통해 생산량 변동의 원인을 객관적으로 분리(Variance Decomposition)해냄으로써, 관리자가 주관적 경험에 의존하던 관습에서 벗어나 데이터 기반의 '확정적 의사결정'을 내릴 수 있는 과학적 관리 기반을 제공
- 정밀 축산 구현을 위한 기초 데이터 확보 질병의 전조 신호가 생산량 저하로 이어지는 미세한 패턴을 식별함으로써, 문제가 터진 후 수습하는 '사후 처리' 방식이 아닌, 이상 징후를 조기에 감지하고 선제적으로 대응하는 지능형 예측 모델의 기틀을 마련
- 선제적인 조기 경보 인사이트를 통해 대응 전략을 수립하는 공익적 가치를 창출한다.
- 프로젝트가 제공할 데이터 인사이트가 중요한 이유를 작성:
- 데이터 출처
- 본 프로젝트는 제공된 데이터 CSV 파일을 활용하여 진행한다. 주요 데이터를 바탕으로 통계 검정과 머신러닝 분류 모델을 적용한다.
- 데이터 파일명 예시: global_cattle_disease_detection_dataset.csv , global_cattle_milk_yield_prediction_dataset.csv
- 주요 변수 예시
- 1. 가축 기본 정보 및 사육 환경 가축의 기초 체급과 그들이 머무는 환경을 나타냅니다.
- Cattle_ID, Farm_ID: 개체 및 농장 식별 번호.
- Breed, Age_Months, Weight_kg: 품종, 나이, 몸무게 (가축의 기본 스펙).
- Region, Country, Climate_Zone: 사육 지역 및 기후대.
- Ambient_Temperature_C, Humidity_percent, Season: 축사 온도, 습도, 계절 (스트레스 분석용).
- Management_System, Housing_Score: 사육 방식(방목 등)과 축사 시설 점수.
- Feed_Type, Feed_Quantity_kg: 먹인 사료의 종류와 양.
- Water_Intake_L: 물 섭취량.
- Rumination_Time_hrs: 되새김질 시간 (소화 건강의 척도).
- Walking_Distance_km, Grazing_Duration_hrs, Resting_Hours: 운동량, 방목 시간, 휴식 시간.
- Body_Temperature_C, Heart_Rate_bpm, Respiratory_Rate: 체온, 심박수, 호흡수 (비정상 징후 포착용).
- FMD_Vaccine ~ Rabies_Vaccine (8종): 구제역 등 주요 질병 백신 접종 여부.
- [Target 1] Disease_Status: 현재 건강 상태 (정상 또는 44종의 질병명).
- [Target 2] Milk_Yield_L: 오늘의 우유 생산량 (최종 예측 목표).
- Previous_Week_Avg_Yield: 지난주 평균 생산량 (비교 기준점).
- Parity: 출산 횟수.
- Lactation_Stage, Days_in_Milk: 현재 수유 단계 및 기간 (생산 주기에 따른 변화 분석).
- Body_Condition_Score: 가축의 영양 상태 점수.
- Milking_Interval_hrs: 젖을 짜는 시간 간격.
- Date: 데이터 기록 날짜.
- 제공된 데이터는 EDA → 통계 검정 → 모델링 → 해석의 분석 흐름에 따라 활용한다.
- 데이터 전처리 계획
- 극단적인 노이즈로 인한 분석 결과의 왜곡 방지 및 모델 안정성 확보.
- 데이터의 전반적인 품질 상태 파악 및 분석 가용성 확인
- 데이터의 연속성을 유지하여 시계열 분석 및 모델 학습의 단절 방지
- 머신러닝 알고리즘에 적합한 데이터 구조 변환 및 모델 평가의 신뢰도 확보
팀 프로젝트 화이팅!!!
'내일배움캠프(QA,QC_5기)' 카테고리의 다른 글
| [내일배움캠프] QA/QC_5기 ( 40일차 ) (0) | 2026.05.01 |
|---|---|
| [내일배움캠프] QA/QC_5기 ( 39일차 ) (0) | 2026.04.30 |
| [내일배움캠프] QA/QC_5기 ( 37일차 ) (0) | 2026.04.28 |
| [내일배움캠프] QA/QC_5기 ( 36일차 ) (0) | 2026.04.27 |
| [내일배움캠프] QA/QC_5기 ( 35일차 ) (0) | 2026.04.24 |