나이브 베이즈(naive bayes): 데이터에서 모든 feature가 서로 조건부 독립일 때, 데이터의 특징을 가지고 각 클래스(레이블)에 속할 확률을 계산하는 조건부 확률 기반의 분류 알고리즘
클래스 전체의 확률 분포 대비 특정 클래스에 속할 확률(베이즈 정리)
데이터에서 모든 변수가 서로 조건부 독립이라는 가정 하에 확률 계산을 단순화 함 → 나이브(naive) 함
나이브 베이즈 특징
장점
단점
단순하고 빠르며 효과적임(Cost가 적음)
모든 속성은 동등하게 중요하고, 독립적이라는 가정에 의존
노이즈와 결측 데이터가 있어도 잘 수행
수치 속성으로 구성된 많은 데이터셋에 대해 이상적이지 않음
훈련에 상대적으로 적은 데이터가 필요(많은 데이터에도 잘 수행 함)
추정된 확률은 예측된 범주보다 덜 신뢰적임
예측에 대한 추정된 확률을 얻기 쉬움