내일배움캠프(QA,QC_5기)

내일배움캠프(QA,QC_5기)[내일배움캠프] QA/QC_5기 ( 60일차 )

lshxkwh 2026. 6. 4. 20:54

전기차 잔여 주행거리(DTE)를 실시간으로 예측

CatBoost + 누적 효율 피처로 RMSE 8.39 → 6.45km 달성한 과정

머신러닝 전기차 시계열


프로젝트 개요

전기차 주행 중 매 시점마다 센서값을 입력받아 "지금 배터리로 앞으로 몇 km 갈 수 있는가(DTE)"를 실시간으로 예측하는 모델을 개발했다. 단순 SOC 기반이 아니라 온도, 공조, 경로, 날씨, 주행 패턴을 모두 반영하는 게 목표였다.

항목내용
데이터 68개 트립, 10만 행 (1초 단위)
피처 수 44개 (환경 요인 포함)
최종 모델 CatBoost

데이터 준비

원본 0.1초 단위 데이터(110만 행)에서 불필요한 컬럼을 제거하고, SoC 결측 비율 20% 이상인 트립 2개는 제거, 나머지는 선형 보간으로 채웠다. 1초 단위 리샘플링 후 10만 행으로 줄였다.

타깃 DTE는 이렇게 계산했다.

 
 
순간 이동거리 = 속도(km/h) × 1초 / 3600
DTE(t) = 트립 전체 거리 - cum_dist(t)

핵심 피처 설계

가장 중요한 두 가지 피처를 직접 설계했다.

cum_efficiency — 트립 시작부터 현재까지 달린 거리 / 소모한 SOC. 트립마다 다른 효율을 실시간으로 반영한다.

rolling_efficiency — 최근 60초 이동거리 / 최근 60초 SOC 소모량. cum_efficiency의 초반 불안정 문제를 보완하기 위해 추가했다. 이 피처 추가 후 RMSE가 7.39 → 6.50으로 개선됐다.


성능 개선 과정

 
 
베이스라인 CatBoost    RMSE 8.39
Optuna 30 trials      RMSE 7.39  ▼ 12%
rolling_efficiency 추가 RMSE 6.50  ▼ 12%
Optuna 100 trials     RMSE 6.45  ▼ 0.7%

K-Fold 교차검증

단일 split의 신뢰성 검증을 위해 트립 단위 5-Fold CV를 진행했다.

FoldRMSE
Fold 1 9.47 km
Fold 2 8.57 km
Fold 3 7.97 km
Fold 4 8.09 km
Fold 5 5.66 km
평균 7.95 km

단일 split 6.45는 낙관적 수치였고 실제 평균 성능은 7.95에 가깝다. 데이터가 68개 트립으로 적어서 fold마다 편차가 크게 나타났다.


다음 단계

  1. K-Fold 기반 Optuna 결과 확인
  2. Fold 5(5.66)와 Fold 1(9.47) 주행 조건 비교 분석
  3. 이동평균 피처 Optuna 재튜닝 결과 확인