[5주차 총정리] 불균형(Imbalanced) 데이터 처리 (SMOTE, oversampling)
(출처: https://www.kaggle.com/dogdriip/iqr-outlier-smote-oversampling/notebook) 0. 라이브러리 설치 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline 1. 데이터 불러오기 card_df = pd.read_csv('creditcard.csv') card_df = card_df.drop('Time', axis=1) card_df.shape # >(284807, 30) 2. EDA sns.distplot(card_df['Amount']) - 로그 변환 : 데이터 분포도가 심하게 왜곡되어 있을 경우 적용..