대략적인 판다스 사용 흐름
1. Pandas 사용 선언하기
2. 데이터 가져오기
3. 데이터 확인 및 표 읽기
4. 결측치 제거하기
데이터를 불러오고 기본적으로 해야할 것
# 데이터 불러오기
data = pd.read_csv('파일 경로', sep = ',')
# 결측값 확인
print(data.isnull().sum())
# 결측값 제거
data = data.dropna()
분석 및 시각화
# 상관계수 구하기
corr = data.corr(method = 'pearson')
# 필요없는 데이터 제거, 상관계수가 1이 아닌 데이터만 불러오기
corr = corr[corr.'행 이름' != 1]
# 필요 없는 데이터 삭제
corr = corr.drop(['Passengerid'], axis = 'rows')
# 그래프 시각화
corr.plot()
corr['Survived'].plot()
corr['Survived'].plot.bar() # 막대 그래프
'데이터 분석 > python' 카테고리의 다른 글
파이썬 Scipy 활용 (1) | 2024.02.27 |
---|---|
[python] 캐글 설문조사 Q1~Q6 (1) | 2023.12.26 |
[5주차] 코호트 분석 / 프로덕트 개선은 정말 도움이 되었을까? (0) | 2023.12.19 |
[3주차 숙제] 가장 많은 수강생들의 수강이 완료되는 시점을 알아내기 (0) | 2023.12.12 |