제2유형 (작업형2)40

[1번] 제2유형 (40점)

제공 데이터
  • data/car_train.csv
  • data/car_test.csv

자동차 평가(Car Evaluation) 데이터이다. 자동차의 구매가·유지비·안전성 등 6개 특성으로 그 자동차의 **평가 등급(4단계)**을 예측하는 문제이다. 학습용 데이터 car_train.csv로 모델을 학습하고, 평가용 데이터 car_test.csv의 각 자동차에 대한 평가 등급을 예측하여 result.csv로 저장하는 코드를 작성한 뒤 제출하시오.

  • 평가지표: Macro F1 (값이 높을수록 좋음, 구간별 5점 단위 배점)
  • 6개 설명변수는 모두 **범주형(문자열)**이므로, 학습 전 적절한 인코딩이 필요하다.
  • 클래스 불균형과 잡음이 있는 데이터이므로, 전처리·인코딩 방식·모델·하이퍼파라미터를 잘 선택해야 좋은 점수를 얻을 수 있다.

[제출 형식]

  1. CSV 파일명: result.csv (별도 디렉토리 지정 금지)
  2. 예측 결과 컬럼명: pred (예측한 정수 등급 0~3)
  3. 제출 컬럼 개수: pred 1개 (자동 생성되는 index 컬럼 제거)
  4. 평가용 데이터(test) 행 수와 예측 결과 행 수가 일치해야 함

[변수 설명]

컬럼명설명
buying구매 가격vhigh, high, med, low
maint유지 비용vhigh, high, med, low
doors문 개수2, 3, 4, 5more
persons수용 인원2, 4, more
lug_boot트렁크 크기small, med, big
safety안전성low, med, high
target평가 등급 (train에만 존재)0:부적합(unacc), 1:수용가능(acc), 2:좋음(good), 3:매우좋음(vgood)
실행환경 준비 중…
에디터 로딩 중…
실행 버튼을 눌러 코드를 실행하세요.