29
Gaussian Ranking by Matrix Factoriza5on Harald Steck [email protected] RecSys 2015

Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Embed Size (px)

Citation preview

Page 1: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Gaussian  Ranking    by    

Matrix  Factoriza5on  

Harald    Steck  [email protected] RecSys    2015  

Page 2: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Overview  •  Matrix  Factoriza<on  Model  •  asymmetric  MF  

   •  Objec<ve:  op<mize  various  Ranking  Metrics  •   exploit  proper<es  of  MF  model  &  implicit  data  

•  Training:  pointwise  &  listwise  •  Related  Work  •  Experiments  

Page 3: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

           Basic  Idea:            

                                                         data                                                      .                                                                                                                                                                                                                                                                                                  

items  i  

users    u  

≈  users    u  

Low-­‐rank  Matrix  Factoriza<on  Model  

Page 4: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Basic  Idea:        

-­‐    latent  user  vector:                                                                                                                                                                                                                                                  -­‐  by  [Paterek  07],  extended  to  SVD++  [Koren  08]  

Asymmetric  Matrix  Factoriza<on  

Page 5: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Overview  •  Matrix  Factoriza<on  Model  •  asymmetric  MF  

   •  Objec5ve:  op5mize  various  Ranking  Metrics  •   exploit  proper5es  of  MF  model  &  implicit  data  

•  Training:  pointwise  &  listwise  •  Related  Work  •  Experiments  

Page 6: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

AMF  as  Neural  Network                

 

             rank  loss    =  f  (ranks)  

items    i  …  click  history  

…  user  vec.  

…  scores  …  ranks  

Page 7: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

AMF  as  Neural  Network                

 

             rank  loss    =  f  (ranks)  

items    i  …  click  history  

…  user  vec.  

…  scores  …  ranks  

Page 8: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

1st    term:  Rank  Loss    example  1:      AUC          •  pairwise  comparisons  !  (linear)  sum  of  ranks    

Page 9: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

example  2:    nDCG  (for  binary  relevance)          •  emphasizes  top  of  ranked  list  •  also  a  func<on  of  the  ranks  of  the  posi<ves  

1st    term:  Rank  Loss    

Page 10: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

2nd  term:  Ac<va<on  Func<on  

T  

Scores  !  Ranks:                                                                                                                                +  +  +                                            -­‐  binary  data:    nega<ves  and  posi<ves                    -­‐  sparse  data:          many                                  few                    !      MF  scores:    Gaussian  distrib.  assumed  

scores  i  

Page 11: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

     

score  

rank  

1  

N  

Scores  !  Ranks:  

2nd  term:  Ac<va<on  Func<on  

score  

Page 12: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

     

score  

…  piecewise          quadra<c  

2nd  term:  Ac<va<on  Func<on  

Page 13: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

3rd  term      •  score:  

•  deriva<ve:  

Page 14: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Pueng  it  All  Together  

training  objec<ve  func<on:                                      rank            prior  on  param’s            scores  of                                  loss                      "    lambda                        nega<ves                                                                                                                                      "gamma  -­‐  minimized  by  stochas<c  gradient  descent                  

Page 15: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Overview  •  Matrix  Factoriza<on  Model  •  asymmetric  MF  

 •  Objec<ve:  op<mize  various  Ranking  Metrics  •   exploit  proper<es  of  MF  model  &  data  

•  Training:  pointwise  &  listwise  •  Related  Work  •  Experiments  

Page 16: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Listwise  Approach  

•  consider  ALL  items  for  each  user:  

-­‐  es<mate  standard  devia<on  of  scores  for    each  user  !  width  of  ac<va<on  func<on  

Page 17: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Listwise  Approach  

•  consider  ALL  items  for  each  user:            -­‐  sort  by  scores  !  exact  ranks        -­‐  using  logis<c  ac<va<on  func<on:                  2nd  term  in  chain  rule  

Page 18: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

AUC  

nDCG  

Listwise  Approach  

   deriva5ves  L’:                                                      1st    &  2nd    terms                                                                                                                                                    top  of                                                                                                                                            ranked  list    

Page 19: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

 !  between  nDCG  and  AUC:                            L’  =  constant      !    use  very  large  std.                for  ac<va<on  func<on                in  pointwise  approach  

AUC  

nDCG  

Pointwise  Approach  

   deriva5ves  L’:                                                                                                                                                              top  of                                                                                                                                            ranked  list      

Page 20: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Overview  •  Matrix  Factoriza<on  Model  •  asymmetric  MF    

   •  Objec<ve:  op<mize  various  Ranking  Metrics  •   exploit  proper<es  of  MF  model  &  data  

•  Training  •  Related  Work  •  Experiments  

Page 21: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Related  Work  

•  various  learning-­‐to-­‐rank  approaches  exist  •  ogen  tailored  to  specific  ranking  losses  •  mostly  pairwise  approaches,  eg:  •  AUC:    BPR  [Rendle  et  al.  ’09]  •  MRR:    CLiMF  [Shi  et  al.  ’12]                                  used  as  •  MAP:  TFMAP  [Shi  et  al.  ‘12]                                baselines    

•  listwise  approaches,  eg:  •         top-­‐1  [Shi  et  al.  ’10]  ...  like  neural  network  

•  …  addi<onal  references  in  the  paper    

Page 22: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Overview  •  Matrix  Factoriza<on  Model  •  basic  MF  !  asymmetric  MF  !  Neural  Network  

   •  Objec<ve:  op<mize  various  Ranking  Metrics  •   exploit  proper<es  of  MF  model  &  data  

•  Training  •  Related  Work  •  Experiments  

Page 23: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

10  m  MovieLens    Data  

•  10k  movies    &    70k  users  •  1%  dense  data  •  binarized:          3+  star  ra<ng  !  1,  otherwise  0  •  5-­‐fold  cross-­‐valida<on  

Page 24: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

10  m  MovieLens    Data  

                       5-­‐fold  cross-­‐valida<on          std    :      0.001    

Page 25: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

10  m  MovieLens    Data  

       std=0.002  

Page 26: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Nellix  Play  Data  •  Test  day:            4/9/2014    •  rela(ve          improvement          to  RMSE  training  

                                                                                                                                                                 std=1%  

Page 27: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Nellix  Play  Data                

                                       std=2%  

Page 28: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Conclusions  •  learning-­‐to-­‐rank  approach:  –  implicit  feedback  data  – proper<es  of  MF  model  ! Gaussian  distribu<on  of  scores  ! non-­‐linear  ac<va<on  func<ons  derived  for  ranking  

•  pointwise  and  listwise  training  •  various  ranking  metrics  can  be  used:  – compe<<ve  for  op<mizing  AUC  – par<cularly  effec<ve  at  head  of  ranked  list  

Page 29: Gaussian Ranking by Matrix Factorization, ACM RecSys Conference 2015

Thank  You  !  Ques5ons  ?