연습문제
신용도 분류
- 난이도
- Medium
- 제출
- 4 회
- 참가자
- 2 명
- 제출 형식
-
csv
로그인 후 문제풀이가 가능합니다.
신용 점수는 대출의 금리 및 한도 설정 등 금융활동 전반에 사용될 수 있는 주요 지표입니다.
본 문제에서는 개인의 소득, 대출 정보 등 다양한 데이터로부터신용 점수 수준을 분류하고, 결과를 제출하시오.
데이터셋 설명
train.csv [파일]
*금액의 단위는 USD($)임.
Age: 만 나이
Occupation: 직업
Annual_Income: 연간 총 소득
Monthly_Inhand_Salary: 매월 실수령액
Num_Bank_Accounts: 보유 중인 은행 계좌 수
Num_Credit_Card: 보유 중인 신용카드 수
Interest_Rate: 대출 이자율
Num_of_Loan: 대출 건수
Delay_from_due_date: 연체일수
Num_of_Delayed_Payment: 연체 횟수
Num_Credit_Inquiries: 신용 조회 횟수
Outstanding_Debt: 미상환 부채 금액
Credit_Utilization_Ratio: 신용 사용률 (사용 금액 / 한도)
Payment_of_Min_Amount: 최소 결제 금액 납부 여부 (Yes, No 중 하나)
Total_EMI_per_month: 월별 총 상환금 (원금 및 이자 포함)
Amount_invested_monthly: 월별 투자 금액
Monthly_Balance: 월별 계좌 잔액
Credit_History_Months: 신용 거래 기간 (월)
Credit_Score: 신용 점수 수준 (Poor, Standard, Good 중 하나)
test.csv [파일]
train 데이터와 구성 동일
Credit_Score 열을 예측해야 함.
평가 산식
정확도 (Accuracy): 예측값과 실제값의 일치 비율을 측정한 분류 성능 지표
Python 코드
from sklearn.metrics import accuracy_score
score = accuracy_score(truth_df["Credit_Score"], submission_df["Credit_Score"])
train.csv
test.csv
sample-submission.csv