카테고리 없음

Pandas DataFrame NA Value 결측값 확인하고 변경 대체 하기

세모아이 2022. 3. 4. 20:42

다음 예제를 보도록 하죠.

age 라는 속성의 None 값이 있습니다. 

l1 = [{'title': 'Child', 'age': 14},
      {'title': 'Child', 'age': 23},
      {'title': 'Parents', 'age': 45}, 
      {'title': 'Parents', 'age': 45}, 
      {'title': 'Parents', 'age': None}, 
      {'title': 'Child', 'age': None}]
         
df = pd.DataFrame(l1, columns = ['title', 'age'])

None 값을 확인하기 위해서 isna 함수를 사용할 수 있습니다.

df.isna().sum()

age 속성의 NaN 값이 대체되었습니다.

df.age.fillna(df.groupby('title')['age'].transform('median'), inplace=True)