Series를 생성할 때 매개변수 index에 파이썬 리스트를 지정하면 인덱스를 할당할 수 있다.
시리즈의 keys() 메소드는 index 속성과 같은 역할을 한다.
.corr() # 상관관계 계산
.describe() # 요약 통계량 계산 ex) 최대, 최소, 평균, 표준편차 등등
.mean() # 평균값
인덱스가 같은 벡터 자동 정렬하기
매개변수 ascending에 False를 지정하여 sort_index() 메소드를 호출하면 내림차순 정렬을 하게 된다.
rev_ages = ages.sort_index(ascending = False) # 내림차순, True는 오름차순
날짜 데이터로 변환하기
기존의 born, died의 데이터 타입은 object이다.
datetime 형태로 바꿔주려면 pd.to_datetime()를 이용한다. 위와 같이 직접 포맷 형식을 지정해줘도 되고
born_date = pd.to_datetime(data['born'], infer_datetime_format=True)
위와 같이 어떤 형식으로 이루어져있는지 자동으로 확인하고 알아서 변환해주는 훌륭한 방법도 있다.
필요없는 컬럼 삭제
.drop을 이용해서 필요없는 컬럼을 삭제할 수도 있다.
JSON 형식으로 저장하기
뭐 이러한 방식으로 JSON 형식으로 저장이 가능하다고 한다.
언제 쓰고 어떠한 이유로 쓰는지는 더 공부해 봐야겠다.
'데이터 분석 > Do it! 판다스 입문' 카테고리의 다른 글
[Day1] 판다스 시작하기 (0) | 2023.12.13 |
---|