이번 시간 정리
1. 데이터 전처리
- 수치형 피처는 스케일링, 범주형 피처는 인코딩 전처리를 할 수 있습니다.
2. 데이터
- Train 데이터로 학습(훈련)하고, Validation(검증용) 데이터로 예측/평가 후, 최종적으로는 Test(평가) 데이터를 예측합니다.
3. 하이퍼 파라미터 튜닝
- 모델 성능 향상을 위해 하이퍼 파라미터 튜닝할 수 있습니다.
머신러닝 과정이 끝났습니다.
프로젝트는 끝났지만 아쉬움이 남았을 여러분을 위해 부록편을 준비 했습니다.
이번 시간에는 여러분들이 직접 데이터를 만들고! 그 데이터를 가지고 분류해 보는 시간을 가져 보겠습니다.
[Cloud Jupyter 를 이용하여 파일 업로드하고 진행해 보기]
(1) 아래에서 2개 파일을 다운 받는다. (1. 부록 이미지 데이터 만들고 분류하기, 2. data.zip)
(2) LMS 우측 하단에 Cloud Jupyter 버튼을 누른다.

(3) Upload 버튼을 눌러 다운받은 파일을 업로드를 한다.
(4) 업로드된 파일을 클릭 하면 Jupyter 파일이 열린다. 이후 영상을 참고하여 진행한다.

코드의 전체적인 흐름을 보면서 내가 만든 데이터를 이렇게 활용할 수 있구나를 생각해 주세요.
실행 완료
실행 완료
실행 완료
train/
validation/
실행 완료
실행 완료
코드 실행
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
/tmp/ipykernel_13/4127105492.py in <module>
1 # 샘플 이미지 출력
2 class_labels = ['good','bad']
----> 3 batch = next(train_gen)
4 images, labels = batch[0], batch[1]
5
NameError: name 'train_gen' is not defined
실행 완료
실행 완료
코드 실행
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
/tmp/ipykernel_13/534903119.py in <module>
1 # 학습 정확도
----> 2 plt.plot(history.history['accuracy'], label='train')
3 plt.plot(history.history['val_accuracy'], label='val')
4 plt.xlabel('epochs')
5 plt.ylabel('accuracy')
NameError: name 'plt' is not defined
코드 실행
---------------------------------------------------------------------------
NameError Traceback (most recent call last)
/tmp/ipykernel_13/2264552229.py in <module>
1 # loss
----> 2 plt.plot(history.history['loss'], label='train')
3 plt.plot(history.history['val_loss'], label='val')
4 plt.xlabel('epochs')
5 plt.ylabel('accuracy')
NameError: name 'plt' is not defined