결측치 처리
이번 시간에는 결측치를 처리해 보도록 하겠습니다.
이번 시간 정리
1. 결측치가 있는 행 삭제
data.dropna(axis=0)
2. 결측치가 있는 열(컬럼) 삭제
data.dropna(axis=1)
3. 결측치가 있는 열(컬럼) 확인
df.isnull()
True = 결측치가 맞다.
False=결측치가 아니다.
4. 결측치가 있는 열(컬럼) 합계
df.isnull().sum()
True = 1로 계산
False= 0로 계산
5. 결측값 채우기
df['결측치가 있는 컬럼명'].fillna('결측값에 채울 값')
아래의 코드 실행 버튼을 눌러 실습을 진행해 보세요!
결측치 삭제
실행 완료
[22]:
Unnamed: 0메뉴가격호수칼로리할인율할인가원산지012345678
0 | 황금후라이드 | 12000 | 10호 | 1000.0 | 0.2 | 9600.0 | 국내산 |
1 | 승일양념치킨 | 13000 | 10호 | 1400.0 | 0.2 | 10400.0 | 국내산 |
2 | 간장치킨 | 14000 | 9호 | 1600.0 | 0.2 | 11200.0 | 국내산 |
3 | 마늘치킨 | 14000 | 9호 | 1800.0 | 0.2 | 11200.0 | 국내산 |
4 | 파닭 | 14000 | 11호 | 1300.0 | 0.2 | 11200.0 | 브라질 |
5 | 닭강정 | 15000 | 12호 | 1500.0 | 0.2 | 12000.0 | 브라질 |
6 | 양념반후라이드반 | 13000 | 10호 | 1300.0 | 0.2 | 10400.0 | 국내산 |
new | [인기]아이펠치킨 | 16000 | 11호 | 1200.0 | 0.5 | 8000.0 | 국내산 |
10 | [베스트]풀잎치킨 | 9900 | 10호 | 1000.0 | NaN | NaN | 국내산 |
실행 완료
[21]:
Unnamed: 0메뉴가격호수칼로리할인율할인가원산지0457
0 | 황금후라이드 | 12000 | 10호 | 1000.0 | 0.2 | 9600.0 | 국내산 |
4 | 파닭 | 14000 | 11호 | 1300.0 | 0.2 | 11200.0 | 브라질 |
5 | 닭강정 | 15000 | 12호 | 1500.0 | 0.2 | 12000.0 | 브라질 |
new | [인기]아이펠치킨 | 16000 | 11호 | 1200.0 | 0.5 | 8000.0 | 국내산 |
실행 완료
[20]:
Unnamed: 0메뉴가격호수012345678
0 | 황금후라이드 | 12000 | 10호 |
1 | 승일양념치킨 | 13000 | 10호 |
2 | 간장치킨 | 14000 | 9호 |
3 | 마늘치킨 | 14000 | 9호 |
4 | 파닭 | 14000 | 11호 |
5 | 닭강정 | 15000 | 12호 |
6 | 양념반후라이드반 | 13000 | 10호 |
new | [인기]아이펠치킨 | 16000 | 11호 |
10 | [베스트]풀잎치킨 | 9900 | 10호 |
결측치 채우기
실행 완료
[19]:
Unnamed: 0 0
메뉴 0
가격 0
호수 0
칼로리 0
할인율 1
할인가 1
원산지 0
dtype: int64
실행 완료
[17]:
0 국내산
1 국내산
2 국내산
3 국내산
4 브라질
5 브라질
6 국내산
7 국내산
8 국내산
Name: 원산지, dtype: object
실행 완료
[18]:
0 국내산
1 국내산
2 국내산
3 국내산
4 브라질
5 브라질
6 국내산
7 국내산
8 국내산
Name: 원산지, dtype: object
실행 완료
[16]:
Unnamed: 0메뉴가격호수칼로리할인율할인가원산지012345678
0 | 황금후라이드 | 12000 | 10호 | 1000.0 | 0.2 | 9600.0 | 국내산 |
1 | 승일양념치킨 | 13000 | 10호 | 1400.0 | 0.2 | 10400.0 | 국내산 |
2 | 간장치킨 | 14000 | 9호 | 1600.0 | 0.2 | 11200.0 | 국내산 |
3 | 마늘치킨 | 14000 | 9호 | 1800.0 | 0.2 | 11200.0 | 국내산 |
4 | 파닭 | 14000 | 11호 | 1300.0 | 0.2 | 11200.0 | 브라질 |
5 | 닭강정 | 15000 | 12호 | 1500.0 | 0.2 | 12000.0 | 브라질 |
6 | 양념반후라이드반 | 13000 | 10호 | 1300.0 | 0.2 | 10400.0 | 국내산 |
new | [인기]아이펠치킨 | 16000 | 11호 | 1200.0 | 0.5 | 8000.0 | 국내산 |
10 | [베스트]풀잎치킨 | 9900 | 10호 | 1000.0 | NaN | NaN | 국내산 |
실행 완료
[15]:
0 1000.0
1 1400.0
2 1600.0
3 1800.0
4 1300.0
5 1500.0
6 1300.0
7 1200.0
8 1000.0
Name: 칼로리, dtype: float64
실행 완료
[14]:
0 1000.0
1 1400.0
2 1600.0
3 1800.0
4 1300.0
5 1500.0
6 1300.0
7 1200.0
8 1000.0
Name: 칼로리, dtype: float64
'언어 > 파이썬' 카테고리의 다른 글
머신러닝with파이썬3강(4)_내장함수 (0) | 2024.03.05 |
---|---|
머신러닝with파이썬3강(3)_자료형변환, 데이터탐색 (0) | 2024.03.04 |
머신러닝with파이썬3강(1)_데이터불러오기,만들기,삭제하기 (0) | 2024.03.02 |
머신러닝with파이썬2강(3)_index다루기,행과 열 추가, 값 변경 (0) | 2024.03.01 |
머신러닝 with 파이썬 2강(2)_데이터선택하기,인덱싱, 슬라이딩 (0) | 2024.02.29 |