선형성: 입력변수(X)와 출력변수(Y)의 관계가 선형이어야 한다.
정규성: ‘잔차의 분포’가 정규분포를 따른다.
등분산성: ‘잔차의 분산’이 일정해야 함.
잔차의 분산이 일정하지 않다면, 모든 관측치들을 동등한 정도로 신뢰할 수 없기 때문에(이분산성)
독립성: 잔차들은 서로 상관성이 없어야 함. 또한 독립변수들도 서로 상관이 없어야 함(다중공산성 문제)
잔차 = 독립변수로 설명하지 못하는 잡음.
다중 공산성 = 독립변수들간에 높은 선형관계가 존재하는 것
다중 공산성이 회귀 모델에 미치는 효과
→ 독립변수의 회귀계수 추정에 영향을 주지만, 종속변수 에측에는 아무런 영향을 주지 않음
다중 공산성은 ‘두’ 변수 간 상관계수만 측정해서는 정확히 알 수 없음
다중 공산성이 있다고 하더라도 해당 변수를 제거해야 할 지는 VIF 값만 보고 판단할 것이 아니라 도메인 지식을 활용하여 변수 간 관계를 확인해야 함