Data Science
[Python] Pandas의 기본 사용법
은구잇
2021. 11. 28. 13:59
728x90
0. Pandas 란?
- 데이터를 효과적으로 처리하고, 보여줄 수 있도록 도와주는 라이브러리
- Numpy와 함께 사용되어 연계쩍인 기능 제공
- 인덱스에 따라 데이터를 나열하기때문에 사전 자료형에 가까움
- Series를 기본적인 자료형으로 사용합니다.
1. Series 사용해보기
# 시리즈 사용해보기
import pandas as pd
array = pd.Series(['사과','바나나','당근'], index = ['a','b','c'])
print(array)
print(array['a'])
a 사과
b 바나나
c 당근
dtype: object
사과
# dict 자료형을 시리즈로 바꾸기
data = {
'a':'사과',
'b':'바나나',
'c':'당근'
}
array = pd.Series(data)
print(array['a'])
사과
2. 데이터 프레임이란?
다수의 Series 를 모아 처리하기 위한 목적.
표 형태로 데이터를 손쉽게 출력할때 사용.
import pandas as pd
word_dict = {
'Apple':'사과',
'Banana':'바나나',
'Carrot':'당근'
}
fre_dic = {
'Apple':3,
'Banana':5,
'Berry':7
}
word = pd.Series(word_dict)
fre = pd.Series(fre_dic)
summary = pd.DataFrame({
'word':word_dict,
'fre':fre_dic
})
print(summary)
word fre
Apple 사과 3.0
Banana 바나나 5.0
Carrot 당근 NaN
Berry NaN 7.0
2.1 슬라이싱
#인덱스 기준, 이름 기준 두가지 방식
#loc -> 이름을 기준으로 슬라이싱 loc[행, 열]
print(summary.loc['Banana':,'fre':])
fre
Banana 5.0
Carrot NaN
Berry 7.0
#iloc -> 인덱스 기준으로 슬라이싱
print(summary.iloc[1:2,1:])
fre
Banana 5.0
2.2 엑셀 파일로 내보내기/ 불러오기
# 엑셀로 내보내기/ 불러오기
summary.to_csv("summary.csv", encoding = 'utf-8-sig')
saved = pd.read_csv("summary.csv", index_col = 0)
print(saved)
word fre
Apple 사과 3.0
Banana 바나나 5.0
Carrot 당근 NaN
Berry NaN 7.0