[5주차 총정리] Ensemble 기법 종류 (Boosting 알고리즘 중심으로)
오늘 배운 내용은 ADsP 자격증 딸 때 공부했던 내용과 함께 보면 더 이해가 잘되어서 데이터에듀의 '데이터분석준전문가' 책의 글을 빌려 정리해보았다. Ensemble - 주어진 자료로부터 여러 개의 Tree 기반의 예측 모형들을 만든 후 예측모형들을 조합하여 하나의 최종 예측모형을 만드는 방법 - 방법: 다중 모델 조합(combining multiple models) / 분류기 조합(classifier combination) - 성능을 분산시켜 오버피팅 감소의 효과가 있다. 아래에서 대표적인 앙상블 기법을 하나하나 소개해보겠다. 1. 배깅, Bagging (Bootstrap AGGregatING) - 여러 개의 bootstrap 자료를 생성하고 각 bootstrap 자료에 예측모형을 만든 후 결합하여 ..