Data Science

[Python] Pandas의 기본 사용법

은구잇 2021. 11. 28. 13:59
728x90

0. Pandas 란?

  • 데이터를 효과적으로 처리하고, 보여줄 수 있도록 도와주는 라이브러리
  • Numpy와 함께 사용되어 연계쩍인 기능 제공
  • 인덱스에 따라 데이터를 나열하기때문에 사전 자료형에 가까움
  • Series를 기본적인 자료형으로 사용합니다.

 

1. Series 사용해보기

# 시리즈 사용해보기
import pandas as pd
array = pd.Series(['사과','바나나','당근'], index = ['a','b','c'])
print(array)
print(array['a'])

a     사과
b    바나나
c     당근
dtype: object
사과

 

# dict 자료형을 시리즈로 바꾸기
data = {
    'a':'사과',
    'b':'바나나',
    'c':'당근'
}
array = pd.Series(data)
print(array['a'])

 

사과

 

2. 데이터 프레임이란?

다수의 Series 를 모아 처리하기 위한 목적.

표 형태로 데이터를 손쉽게 출력할때 사용.

 

 


import pandas as pd
word_dict = {
    'Apple':'사과',
    'Banana':'바나나',
    'Carrot':'당근'
}

fre_dic = {
    'Apple':3,
    'Banana':5,
    'Berry':7
}
word = pd.Series(word_dict)
fre = pd.Series(fre_dic)

summary = pd.DataFrame({
    'word':word_dict,
    'fre':fre_dic
})

print(summary)

 

       word  fre
Apple    사과  3.0
Banana  바나나  5.0
Carrot   당근  NaN
Berry   NaN  7.0

2.1 슬라이싱 


#인덱스 기준, 이름 기준 두가지 방식
#loc -> 이름을 기준으로 슬라이싱 loc[행, 열]
print(summary.loc['Banana':,'fre':])

        fre
Banana  5.0
Carrot  NaN
Berry   7.0

#iloc -> 인덱스 기준으로 슬라이싱
print(summary.iloc[1:2,1:])

        fre
Banana  5.0

2.2 엑셀 파일로 내보내기/ 불러오기

# 엑셀로 내보내기/ 불러오기
summary.to_csv("summary.csv", encoding = 'utf-8-sig')
saved = pd.read_csv("summary.csv", index_col = 0)
print(saved)

 

       word  fre
Apple    사과  3.0
Banana  바나나  5.0
Carrot   당근  NaN
Berry   NaN  7.0