본문 바로가기
SMALL

🖊️Data Analysis/📌 ML)런던 자전거 수요 데이터 분석3

[Python] 런던 자전거 수요 데이터 분석 Study. 런던 자전거 수요 데이터(w. kaggle, Python) [분석에 앞서, 데이터 전처리하기] 📌 캐글을 이용하여 '런던 자전거 수요 데이터'분석 📎사용한 데이터셋: https://www.kaggle.com/hmavrodiev/london-bike-sharing-dataset 아웃라이어를 제거하고 카테고리형 변수로 바꿔주고 훈련용이랑 테스트 데이터를 분리하는 마지막 전처리 작업 📌[1]아웃라이어 이상치 제거 1) 함수 생성(시그마 이상치 제거 방법 사용) #아웃라이어 제거 def is_outliers(s): lower_limit = s.mean() - (s.std()*3) upper_limit = s.mean() + (s.std()*3) return ~s.between(lower_limit,.. 2021. 6. 26.
[Python] 런던 자전거 수요 데이터 분석 Study. 런던 자전거 수요 데이터 분석(w. kaggle, Python) [분석에 앞서, 데이터 전처리하기] 📌 캐글을 이용하여 '런던 자전거 수요 데이터'분석 📎사용한 데이터셋: https://www.kaggle.com/hmavrodiev/london-bike-sharing-dataset 📌[1]seaborn 라이브러리를 이용하여 그래프 그리기 1) 연도별 자전거 이용객 수 그래프 a, b = plt.subplots(1,1, figsize=(10, 5)) sns.boxplot(df['year'], df['cnt']) 2) 월별 자전거 이용객 수 그래프 a, b = plt.subplots(1,1, figsize=(10, 5)) sns.boxplot(df['month'], df['cnt']) 3) 요일.. 2021. 5. 29.
[Python] 런던 자전거 수요 데이터 분석 Study. 런던 자전거 수요 데이터 분석(w. kaggle, Python) [분석에 앞서, 데이터 전처리하기] - 데이터 불러오기 📌 캐글을 이용하여 '런던 자전거 수요 데이터'분석 📎사용한 데이터셋: https://www.kaggle.com/hmavrodiev/london-bike-sharing-dataset 📌[1] matplotlib.pyplot / seaborn / missingno 3개의 모듈 import 📌[2] 시간 데이터의 열(timestamp) 옵션을 넣어서 df에 할당하고 df 데이터 중 상위 5개를 불러옴 df = pd.read_csv('/kaggle/input/london-bike-sharing-dataset/london_merged.csv', parse_dates = ['time.. 2021. 5. 23.