언어/파이썬

머신러닝 프로세스, 자주 사용하는 용어

디지털랫드 2024. 2. 15. 12:27

머신러닝 프로세스


1단계 문제 정의
무엇을 예측할지 문제를 정의

2단계 탐색적 데이터 분석(EDA)
탐색적으로 데이터를 보기

3단계 데이터 전처리
데이터를 살펴보고 판단하여 결측치 및 이상치를 처리
수치형(numerical) 데이터와 범주형(categorical) 데이터의 전처리

4단계 모델학습
Train / Validation(검증용) 데이터 분리
머신러닝 모델 선택
Train 데이터로 학습(훈련)
Validation(검증용) 데이터로 예측
평가 후 성능이 좋지 않으면 모델 변경을 하고 2단계부터 다시 진행해 봅니다.

5단계 예측
4단계까지 작업한 알고리즘을 가지고 테스트 데이터를 적용해 예측

이번 시간에는 문제 정의부터 탐색적 데이터 분석, 데이터 전처리, 모델 학습 및 예측까지 살펴보았습니다.
이 큰 그림을 머릿속에 그려주시기 바랍니다.

 

자주 사용하는 용어

 머신러닝을 할때 자주 사용하는 용어를 정리해보겠습니다.