BPR이란
- BPR은 관측된 데이터를 positive로, 비관측된 데이터를 negative로 설정하고, pairwise approach로 해당 유저는 Positive아이템을 Negative아이템보다 더 선호한다는 가정으로 모델을 학습시키는 방법
- pairwise approach : Score(User, Pos, Neg). nput에 pos item과 neg item이 동시에 들어가면서, 자연스레 이들 간 Rank를 고려할 수 있게 됨.
- 즉, 모든 학습의 input을 positive와 negative로 구성하여 아이템 선호도의 순위를 매기는 것에 집중한 알고리즘임
특징
- implicit feedback data가 의미있게 쓰임
- 최적화 과정에서 Bayesian에 기반한 사후 확률 최대화 알고리즘를 사용함.
- 사후확률 : 관측된 것을 보고, 이것이 어떤 원인으로부터 나왔을지에 대한 확률