728x90
1. Series 자료형의 연산
1.1 fill_value 사용
# 사용하지 않았을 때
import pandas as pd
array1 = pd.Series([1,2,3], index = ['A','B','C'])
array2 = pd.Series([4,5,6], index = ['B','C','D'])
array3 = array1.add(array2)
print(array3)
A NaN
B 6.0
C 8.0
D NaN
-> 두 시리즈의 인덱스가 맞지 않으면 계산이 제대로 되지 않음 NaN 값들이
해결 방법
# fill_value 를 사용해서 NaN 값을 0으로 바꿔줌
import pandas as pd
array1 = pd.Series([1,2,3], index = ['A','B','C'])
array2 = pd.Series([4,5,6], index = ['B','C','D'])
array3 = array1.add(array2, fill_value = 0)
print(array3)
A 1.0
B 6.0
C 8.0
D 6.0
dtype: float64
1.2 데이터 프레임 개별연산
# 개별연산 replace
df = pd.DataFrame([
['Apple','Apple','Carrot','Banaba'],
['Durian','Banana','Apple','Carrot']],
index = [0,1],
columns = ["A","B","C","D"])
print(df)
df = df.replace({"Apple":"Airport"})
print(df)
A B C D
0 Apple Apple Carrot Banaba
1 Durian Banana Apple Carrot
A B C D
0 Airport Airport Carrot Banaba
1 Durian Banana Airport Carrot
'Data Science' 카테고리의 다른 글
[Python] (Crawling) Selenium 사용해보기 (0) | 2021.11.30 |
---|---|
[Python] MatPlotlib 기본 사용 방법 (0) | 2021.11.28 |
[Python] Pandas의 기본 사용법 (0) | 2021.11.28 |
[Python] Numpy 기본 개념과 사용방법 (0) | 2021.11.28 |
[Python] PIL,Pillow 라이브러리 사용 (0) | 2021.11.22 |