연습문제

신용도 분류

난이도
Medium
제출
4 회
참가자
2 명
제출 형식
csv

신용 점수는 대출의 금리 한도 설정 금융활동 전반에 사용될 있는 주요 지표입니다.

본 문제에서는 개인의 소득, 대출 정보 다양한 데이터로부터신용 점수 수준을 분류하고, 결과를 제출하시오.

데이터셋 설명

train.csv [파일]

*금액의 단위는 USD($)임.

Age: 만 나이

Occupation: 직업

Annual_Income: 연간 총 소득

Monthly_Inhand_Salary: 매월 실수령액

Num_Bank_Accounts: 보유 중인 은행 계좌 수

Num_Credit_Card: 보유 중인 신용카드 수

Interest_Rate: 대출 이자율

Num_of_Loan: 대출 건수

Delay_from_due_date: 연체일수

Num_of_Delayed_Payment: 연체 횟수

Num_Credit_Inquiries: 신용 조회 횟수

Outstanding_Debt: 미상환 부채 금액

Credit_Utilization_Ratio: 신용 사용률 (사용 금액 / 한도)

Payment_of_Min_Amount: 최소 결제 금액 납부 여부 (Yes, No 중 하나)

Total_EMI_per_month: 월별 총 상환금 (원금 및 이자 포함)

Amount_invested_monthly: 월별 투자 금액

Monthly_Balance: 월별 계좌 잔액

Credit_History_Months: 신용 거래 기간 (월)

Credit_Score: 신용 점수 수준 (Poor, Standard, Good 중 하나)


test.csv [파일]

train 데이터와 구성 동일

Credit_Score 열을 예측해야 함.


평가 산식

정확도 (Accuracy): 예측값과 실제값의 일치 비율을 측정한 분류 성능 지표


Python 코드

from sklearn.metrics import accuracy_score

score = accuracy_score(truth_df["Credit_Score"], submission_df["Credit_Score"])


train.csv

test.csv

sample-submission.csv