연습문제

물류 배송 비용 예측

난이도
Medium
제출
0 회
참가자
0 명
제출 형식
csv

물류 배송에 관한 여러 데이터를 바탕으로, 물류 배송에 소요될 것으로 예상되는 배송비를 예측하는 문제입니다.
연료 소비율, 교통혼잡도 수준, 창고의 현재 재고 수준 등 여러 변수가 포함되어 있습니다.

주어진 Feature들을 이용하여 물류 배송비(shipping_costs)를 예측해보세요!

데이터셋 설명

데이터셋 설명
데이터는 두 그룹으로 분할되었습니다.
training set(train.csv)
test set(test.csv)

Training set
기계 학습 모델을 구축하는 데 사용되어야 합니다.
배송 운영과 관련된 비용에 대한 정보를 제공합니다. 

Test set
각 배송 운영에 따른 비용에 대한 실제 정보를 제공하지 않습니다. 이러한 결과를 예측하는 것이 귀하의 임무입니다.
train set의 각 물건에 대해 훈련한 모델을 사용하여 물류 배송비를 예측합니다.​

[데이터 설명]
train.csv [파일]
fuel_consumption_rate: 차량에 대해 기록된 연료 소비율 (시간당 리터)
traffic_congestion_level: 물류 경로의 교통 혼잡도 수준 (0-10 척도)
warehouse_inventory_level: 창고의 현재 재고 수준 (단위)
loading/unloading_time: 상하차 작업에 소요된 시간
handling_equipment_availability: 지게차 등 취급 장비의 사용 가능 여부 (0 = 사용 불가, 1 = 사용 가능)
order_fulfillment_status: 주문이 제때 이행되었는지 여부 (0 = 이행되지 않음, 1 = 이행됨)
weather_condition_severity: 운영에 영향을 주는 기상 조건의 심각도 (0-1 척도)
port_congestion_level: 항만의 혼잡도 수준 (0-10 척도)
supplier_reliability_score: 공급업체의 신뢰도 수준 (0-1 척도)
lead_time: 공급업체가 자재를 배송하는 데 걸리는 평균 시간 (일)
historical_demand: 물류 서비스의 과거 수요 (단위)
iot_temperature: IoT 센서로 기록된 온도 (섭씨)
cargo_condition_status: IoT 모니터링에 따른 화물 상태 (0 = 불량, 1 = 양호)
route_risk_level: 물류 경로의 위험 수준 (0-10 척도)
customs_clearance_time: 선적물의 통관 소요 시간
driver_behavior_score: 운전자 행동 수준 (0-1 척도)
fatigue_monitoring_score: 운전자 피로도 수준 (0-1 척도)
shipping_costs: 배송 운영과 관련된 비용 (USD)

test.csv [파일]
train 데이터와 구성 동일
shipping_costs 열을 예측해야 함.

sample_submission.csv [파일]
제출을 위한 기본 양식
id : 샘플 별 고유 ID
shipping_costs : 예측한 값을 기입하여 제출

[평가 산식]

RMSE (Root Mean Squared Error): 예측값과 실제값 간의 편차를 측정하는 회귀 성능 평가 지표

Python 코드:

from sklearn.metrics import mean_squared_error
import math
score = math.sqrt(mean_squared_error(truth_df["shipping_costs"],
submission_df["shipping_costs"]))

train.csv

test.csv

sample-submission.csv