제2유형 (작업형2)40

[3번] 제2유형 (40점)

제공 데이터
  • data/bike_train.csv
  • data/bike_test.csv

서울 공공자전거(따릉이) 데이터이다. 작업형2 [2번]과 같은 데이터이지만, 이번에는 날짜(date) 컬럼이 추가되어 있다. 시간대·날씨에 더해 날짜(date) 정보까지 활용해 그 시간의 **자전거 대여량(count)**을 예측하는 문제이다. 학습용 데이터 bike_train.csv로 모델을 학습하고, 평가용 데이터 bike_test.csv의 각 행에 대한 대여량을 예측하여 result.csv로 저장하는 코드를 작성한 뒤 제출하시오.

  • 평가지표: RMSE (Root Mean Squared Error, 낮을수록 좋음), 구간별 5점 단위 배점
  • season·holiday는 **범주형(문자열)**이므로 학습 전 인코딩이 필요하다.

[제출 형식]

  1. CSV 파일명: result.csv (별도 디렉토리 지정 금지)
  2. 예측 결과 컬럼명: pred (예측한 대여량)
  3. 제출 컬럼 개수: pred 1개 (자동 생성되는 index 컬럼 제거)
  4. 평가용 데이터(test) 행 수와 예측 결과 행 수가 일치해야 함

[변수 설명]

컬럼명설명
date날짜YYYY-MM-DD (예: 2018-08-21)
hour시간(0~23)정수
temperature기온(°C)실수
humidity습도(%)정수
windspeed풍속(m/s)실수
visibility가시거리(10m)정수
dew_point이슬점 온도(°C)실수
solar_radiation일사량(MJ/m²)실수
rainfall강수량(mm)실수
snowfall적설량(cm)실수
season계절Spring, Summer, Autumn, Winter
holiday휴일 여부Holiday, No Holiday
count대여량 (train에만 존재, 예측 대상)정수
실행환경 준비 중…
에디터 로딩 중…
실행 버튼을 눌러 코드를 실행하세요.