본문 바로가기
Data Science

[Python] Pandas 의 연산과 함수 / 활용

by 은구잇 2021. 11. 28.
728x90

1. Series 자료형의 연산

 

1.1 fill_value 사용

# 사용하지 않았을 때

import pandas as pd
array1 = pd.Series([1,2,3], index = ['A','B','C'])
array2 = pd.Series([4,5,6], index = ['B','C','D'])
array3 = array1.add(array2)
print(array3)

A    NaN
B    6.0
C    8.0
D    NaN

 

-> 두 시리즈의 인덱스가 맞지 않으면 계산이 제대로 되지 않음 NaN 값들이

해결 방법 

# fill_value 를 사용해서 NaN 값을 0으로 바꿔줌

import pandas as pd
array1 = pd.Series([1,2,3], index = ['A','B','C'])
array2 = pd.Series([4,5,6], index = ['B','C','D'])
array3 = array1.add(array2, fill_value = 0)
print(array3)

 

A    1.0
B    6.0
C    8.0
D    6.0
dtype: float64

1.2 데이터 프레임 개별연산 

# 개별연산 replace

df = pd.DataFrame([
    ['Apple','Apple','Carrot','Banaba'],
    ['Durian','Banana','Apple','Carrot']],
    index = [0,1],
    columns = ["A","B","C","D"])
print(df)
df = df.replace({"Apple":"Airport"})
print(df)

 

        A       B       C       D
0   Apple   Apple  Carrot  Banaba
1  Durian  Banana   Apple  Carrot
         A        B        C       D
0  Airport  Airport   Carrot  Banaba
1   Durian   Banana  Airport  Carrot