제2유형 (작업형2)40

[4번] 제2유형 (40점)

제공 데이터
  • data/bank_train.csv
  • data/bank_test.csv

포르투갈 은행의 마케팅 전화 데이터이다. 고객 정보와 캠페인 이력으로 그 고객이 **정기예금에 가입할지(가입=1, 미가입=0)**를 예측하는 이진 분류 문제이다. 학습용 데이터 bank_train.csv로 모델을 학습하고, 평가용 데이터 bank_test.csv의 각 고객에 대한 가입 확률을 예측하여 result.csv로 저장하는 코드를 작성한 뒤 제출하시오.

  • 평가지표: ROC-AUC (값이 높을수록 좋음, 구간별 5점 단위 배점)
  • 여러 변수가 **범주형(문자열)**이므로 학습 전 인코딩이 필요하다.

[제출 형식]

  1. CSV 파일명: result.csv (별도 디렉토리 지정 금지)
  2. 예측 결과 컬럼명: pred (가입일 확률, 0~1 실수)
  3. 제출 컬럼 개수: pred 1개 (자동 생성되는 index 컬럼 제거)
  4. 평가용 데이터(test) 행 수와 예측 결과 행 수가 일치해야 함

[변수 설명]

컬럼명설명
age나이정수
job직업admin., blue-collar, technician, services, management, ...
marital결혼 상태married, single, divorced
education학력primary, secondary, tertiary, unknown
default신용 불량 여부yes, no
balance연평균 잔고(유로)정수
housing주택 대출 여부yes, no
loan개인 대출 여부yes, no
contact연락 수단cellular, telephone, unknown
day마지막 연락 일1~31
month마지막 연락 월jan, feb, ..., dec
campaign이번 캠페인 연락 횟수정수
pdays지난 캠페인 후 경과일정수 (-1 = 연락한 적 없음)
previous이전 캠페인 연락 횟수정수
poutcome이전 캠페인 결과success, failure, other, unknown
y정기예금 가입 여부 (train에만 존재, 예측 대상)1: 가입, 0: 미가입
실행환경 준비 중…
에디터 로딩 중…
실행 버튼을 눌러 코드를 실행하세요.