언어/파이썬

머신러닝with파이썬3강(1)_데이터불러오기,만들기,삭제하기

디지털랫드 2024. 3. 2. 17:20

데이터 불러오기/만들기


지난 시간에 만든 데이터 파일을 가지고 있으면 df = pd.read_csv('new_modudak.csv')
으로 불러와 주세요.

없다면 하단의 코드의 실행 버튼을 눌러 파일을 생성해 주시면 됩니다.

이번 시간 정리


1.기존의 인덱스명을 살릴때
index_col='Unnamed: 0'

데이터 불러오기/만들기 (new_modudak.csv)


  • 데이터 불러오기
  • df = pd.read_csv('new_modudak.csv')
 
 
실행 완료
[1]:
Unnamed: 0메뉴가격호수칼로리할인율할인가원산지012345678
0 황금후라이드 12000 10호 1000.0 0.2 9600.0 국내산
1 승일양념치킨 13000 10호 1400.0 0.2 10400.0 NaN
2 간장치킨 14000 9호 1600.0 0.2 11200.0 NaN
3 마늘치킨 14000 9호 1800.0 0.2 11200.0 NaN
4 파닭 14000 11호 1300.0 0.2 11200.0 브라질
5 닭강정 15000 12호 1500.0 0.2 12000.0 브라질
6 양념반후라이드반 13000 10호 1300.0 0.2 10400.0 NaN
new [인기]아이펠치킨 16000 11호 1200.0 0.5 8000.0 국내산
10 [베스트]풀잎치킨 9900 10호 NaN NaN NaN NaN
 
실행 완료
[2]:
메뉴가격호수칼로리할인율할인가원산지Unnamed: 00123456new10
황금후라이드 12000 10호 1000.0 0.2 9600.0 국내산
승일양념치킨 13000 10호 1400.0 0.2 10400.0 NaN
간장치킨 14000 9호 1600.0 0.2 11200.0 NaN
마늘치킨 14000 9호 1800.0 0.2 11200.0 NaN
파닭 14000 11호 1300.0 0.2 11200.0 브라질
닭강정 15000 12호 1500.0 0.2 12000.0 브라질
양념반후라이드반 13000 10호 1300.0 0.2 10400.0 NaN
[인기]아이펠치킨 16000 11호 1200.0 0.5 8000.0 국내산
[베스트]풀잎치킨 9900 10호 NaN NaN NaN NaN

 

데이터 삭제


이번 시간에는 데이터를 삭제해 보도록 하겠습니다.

이번 시간 정리


1. 데이터 프레임의 사본 만들기
변수 = df.copy()

2. 데이터 삭제 방향
axis=1:열방향(컬럼)
axis=0:행방향

3. 데이터 열 삭제

  • data = data.drop('Unnamed: 0', axis=1)
  • data = data.drop(columns=['Unnamed: 0'])

4. 데이터 행 삭제

  • data = data.drop(인덱스명, axis=0)
  • data.drop(인덱스명, axis=0, inplace=True)

더 알아보기


※in-place(제자리 연산)
Inplace는 아직 가동은 하지 않고 제자리에서 준비만 하는 것을 의미하는데
이것을 가동시키기 위해서는 inplace=True로 바꿔 주면 됩니다.
inplace=False : 저장 안 함.   inplace=True : 저장함.
(Inplace는 열 삭제(axis=1)일 때도 사용 가능합니다.)

※TIP
실수로 drop셀을 2번 실행하면 이미 삭제된것을 다시 삭제할 수 없어 오류가 날 수 있습니다.
LMS가 아닌 Jupyter Notebook으로 학습을 진행하실 경우 위 같은 오류시
Jupyter Notebook의 상단에서 cell 클릭>Run All Above(현재 셀의 위까지 모두 실행)을 클릭하여 실행하면 정상적인 결과를 얻을 수 있습니다.


아래의 코드 실행 버튼을 눌러 실습을 진행해 보세요!

컬럼 삭제

 
코드 실행
 
 
코드 실행
 
 
코드 실행
 
 
코드 실행

행 삭제

 
 
코드 실행
 
 
코드 실행
 
 
코드 실행
 
 
코드 실행
 
 

데이터 삭제


이번 시간에는 데이터를 삭제해 보도록 하겠습니다.

이번 시간 정리


1. 데이터 프레임의 사본 만들기
변수 = df.copy()

2. 데이터 삭제 방향
axis=1:열방향(컬럼)
axis=0:행방향

3. 데이터 열 삭제

  • data = data.drop('Unnamed: 0', axis=1)
  • data = data.drop(columns=['Unnamed: 0'])

4. 데이터 행 삭제

  • data = data.drop(인덱스명, axis=0)
  • data.drop(인덱스명, axis=0, inplace=True)

더 알아보기


※in-place(제자리 연산)
Inplace는 아직 가동은 하지 않고 제자리에서 준비만 하는 것을 의미하는데
이것을 가동시키기 위해서는 inplace=True로 바꿔 주면 됩니다.
inplace=False : 저장 안 함.   inplace=True : 저장함.
(Inplace는 열 삭제(axis=1)일 때도 사용 가능합니다.)

※TIP
실수로 drop셀을 2번 실행하면 이미 삭제된것을 다시 삭제할 수 없어 오류가 날 수 있습니다.
LMS가 아닌 Jupyter Notebook으로 학습을 진행하실 경우 위 같은 오류시
Jupyter Notebook의 상단에서 cell 클릭>Run All Above(현재 셀의 위까지 모두 실행)을 클릭하여 실행하면 정상적인 결과를 얻을 수 있습니다.


아래의 코드 실행 버튼을 눌러 실습을 진행해 보세요!

컬럼 삭제

 
 
코드 실행
 
 
코드 실행
 
 
코드 실행
 
 
코드 실행

행 삭제

 
 
코드 실행
 
 
코드 실행
 
 
코드 실행