연습문제
마케팅 전략 전환율 예측
- 난이도
- Medium
- 제출
- 1 회
- 참가자
- 1 명
- 제출 형식
-
csv
로그인 후 문제풀이가 가능합니다.
가상의 마케팅 캠페인 대행사에게 마케팅을 의뢰하고자 합니다.
축적된 데이터를 기반으로 여러 변수에 따른 마케팅 효과를 가늠하기 위해, 개별 마케팅 전략의 전환율을 예측하는 문제입니다.
캠페인 종류, 마케팅 기간, 마케팅이 시행된 분기 등 여러 변수가 포함되어 있습니다.
주어진 Feature들을 이용하여 마케팅 전략의 전환율(Conversion Rate)을 예측해보세요!
데이터셋 설명
데이터셋 설명
데이터는 두 그룹으로 분할되었습니다.
training set(train.csv)
test set(test.csv)
Training set
기계 학습 모델을 구축하는 데 사용되어야 합니다.
배송 운영과 관련된 비용에 대한 정보를 제공합니다.
Test set
각 배송 운영에 따른 비용에 대한 실제 정보를 제공하지 않습니다. 이러한 결과를 예측하는 것이 귀하의 임무입니다.
train set의 각 물건에 대해 훈련한 모델을 사용하여 물류 배송비를 예측합니다.
[데이터 설명]
train.csv [파일]
Company: 가상의 마케팅 캠페인 대행사명
Campaign_Type: 캠페인 종류
Target_Audience: 마케팅 타겟 고객 특성
Duration: 마케팅 기간 (일 수)
Channel_Used: 마케팅 채널 종류
Location: 마케팅이 시행된 위치
Language: 마케팅에 사용된 언어
Customer_Segment: 타겟 고객 세그먼트
Quarter: 마케팅이 시행된 분기
Conversion_Rate: 마케팅 리드 가운데 마케팅으로 원하는 행동을 달성한 비율 (전환율)
test.csv [파일]
train 데이터와 구성 동일
Conversion_Rate 열을 예측해야 함.
sample-submission.csv [파일]
제출을 위한 기본 양식
id : 샘플 별 고유 ID
shipping_costs : 예측한 값을 기입하여 제출
[평가 산식]
RMSE (Root Mean Squared Error): 예측값과 실제값 간의 편차를 측정하는 회귀 성능 평가 지표
Python 코드
from sklearn.metrics import mean_squared_error
import math
score = math.sqrt(mean_squared_error(truth_df["Conversion_Rate"], submission_df["Conversion_Rate"]))
train.csv
test.csv
sample-submission.csv