랜덤 포레스트: Bagging방식을 활용한 Decision Tree-Based 앙상블 모델
(Bagging과 Decision Tree를 결합한 방식으로 볼 수 있음)
- 방법
- Bootstrap을 바탕으로 다양한 데이터셋 을 만들고, 이를 Decision Tree에 넣어서 나온 결과를 집계함
- 이때, 각 Decision Tree를 구성하는 Feature는 무작위로 일부만 고려
- 장점
- 오버피팅이 잘 되지 않음
- 다수의 의사결정 트리로부터 분류하기 떄문에 오버피팅이 나타나는 나무의 영향력을 줄일 수 있음
- 과정에 대한 설명이 가능(결정트리의 특징)
- 전처리를 하지 않아도 됨(결정트리의 특징)
- 단점
- 많은 트리를 구성해야 하기 떄문에 메모리 사용량이 높음