언어/파이썬

머신러닝 기초 with 파이썬 2강_라이브러리 불러오기, 데이터프레임과 시리즈, 데이터 불러오기 및 저장

디지털랫드 2024. 2. 28. 17:01

판다스 라이브러리


  • 판다스(pandas)는 파이썬(python)을 기반으로 한 쉽고 강력한 데이터 분석 도구...엑셀과 같은 존재임!
  • 파이썬 코드를 이용해서 엑셀과 같은 기능을 판다스에서 활용해 볼 수 있습니다...판다스는 pd라고 부르며 라이브러리를 불러오는 것을 시작으로 실행한다.

이번 시간 정리


1.판다스 라이브러리 불러오기

import pandas

2.판다스의 별칭
별칭은 pd를 일반적으로 사용합니다.
라이브러리를 불러오는 코드 뒤에 as pd를 붙여주면 됩니다.

아래의 코드 실행 버튼을 눌러 판다스 라이브러리를 불러와 보세요!

라이브러리 불러오기

 

 

데이터프레임과 시리즈


이번 시간에는 데이터 프레임과 시리즈에 대하여 설명하도록 하겠습니다.

이번 시간 정리


1. 데이터프레임
행과 열이 있는 표 형태 구조
시리즈가 2개 이상일 때

2. 시리즈
하나의 열(column)

아래의 코드 실행 버튼을 눌러 실습을 진행해 보세요!

 
 
실행 완료
[2]:
0    후라이드
1    양념치킨
2    양반후반
Name: 메뉴, dtype: object
 
 
실행 완료
[3]:
0    12000
1    13000
2    13000
Name: 가격, dtype: int64
 
실행 완료
[4]:
pandas.core.series.Series
 
 
실행 완료
[5]:
메뉴가격012
후라이드 12000
양념치킨 13000
양반후반 13000
 
실행 완료
[6]:
메뉴가격호수012
후라이드 12000 10호
양념치킨 13000 10호
양반후반 13000 9호
 
 

데이터 불러오기 및 저장


이번 시간에는 데이터를 불러오고 저장을 해보도록 하겠습니다.

이번 시간 정리


1. csv 데이터를 불러오기

pd.read_csv('불러올 파일명.csv')

2. 불러온 데이터를 변수에 담기

df = pd.read_csv('파일명.csv')

3. 데이터 샘플 확인: 앞에서 부터 n개 (기본 5개)

df.head()

4. 데이터 샘플 확인: 뒤에서 부터 n개 (기본 5개)

df.tail()

5. csv 파일로 저장하기

df.to_csv('저장할 파일명.csv', index=False)

6. 저장된 csv 파일 확인

new_df = pd.read_csv('저장할 파일명.csv')

아래의 코드 실행 버튼을 눌러 실습을 진행해 보세요!

 
 
실행 완료
 
 
 
실행 완료
[8]:
메뉴가격호수칼로리0123456
후라이드 12000 10호 1000
양념치킨 13000 10호 1400
간장치킨 14000 9호 1600
마늘치킨 14000 9호 1800
파닭 14000 11호 1300
닭강정 15000 12호 1500
양반후반 13000 10호 1300
 
실행 완료
 
실행 완료
[10]:
메뉴가격호수칼로리01234
후라이드 12000 10호 1000
양념치킨 13000 10호 1400
간장치킨 14000 9호 1600
마늘치킨 14000 9호 1800
파닭 14000 11호 1300
 
 
실행 완료
[11]:
메뉴가격호수칼로리01
후라이드 12000 10호 1000
양념치킨 13000 10호 1400
 
 
실행 완료
[12]:
메뉴가격호수칼로리23456
간장치킨 14000 9호 1600
마늘치킨 14000 9호 1800
파닭 14000 11호 1300
닭강정 15000 12호 1500
양반후반 13000 10호 1300
 
 
실행 완료
[13]:
메뉴가격호수칼로리56
닭강정 15000 12호 1500
양반후반 13000 10호 1300
 
 
실행 완료
 
 
 
실행 완료
[15]:
메뉴가격호수칼로리01234
후라이드 12000 10호 1000
양념치킨 13000 10호 1400
간장치킨 14000 9호 1600
마늘치킨 14000 9호 1800
파닭 14000 11호 1300