본문 바로가기
SMALL

🖊️Data Analysis/📌 ML)타이타닉 생존자 데이터 분석2

[Python] 타이타닉 생존자 데이터 분석 Study. 타이타닉 생존자 데이터 분석 [스스로 정리한 데이터 분석 흐름] 3. feature engineering [1] Null data 채우기 Age에 있는 null data를 title+statistics를 사용하기 Fill Null in Age using title 영어에서는 성별도 나누어지지만 기혼, 미혼 등등의 title로 나누어진다. 그리하여 이름 앞에 꼭 이런 title이 들어가는데 이것을 사용해보겠다. pandas series의 str method와 extract method를 이용하여 title을 쉽게 추출했다. 남자와 여자가 사용하는 Initial 이 정해져 있기 때문에 구분해준다. Initial과 생존자의 관계를 구했을 때 여성과 관계있는 게 생존율이 더 높다. 나이의 평균을 구.. 2021. 7. 12.
[Python] 타이타닉 생존자 데이터 분석 Study. 타이타닉 생존자 데이터 분석 [스스로 정리한 데이터 분석 흐름] 본 게시물은 이미 짜여진 코드를 필사하면서 코드의 흐름을 익히기 위해 학습한 내용이 담겨있음을 미리 알려드린다. 1. 필요한 라이브러리 import import numpy as np #행렬이나 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원하는 라이브러리 import pandas as pd import matplotlib.pyplot as plt #pyplot 모듈의 함수를 이용하여 그래프를 그릴 수 있도록 지원하는 라이브러리 import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) # 이 두줄은 본 필자가 항상 쓰는 방법입니다. matplotlib의 기본 .. 2021. 7. 12.