RecSysCode — Recommender Systems Archive

Code

Microsoft Recommenders

Best practices for building production-ready recommender systems. Includes notebooks, benchmarks, and utilities for ALS, SAR, NCF, and more.

#azure#production#benchmark#sar

intermediate2023github.com/microsoft/recommendersOpen ↗

Code

Surprise: A Python scikit for Recommender Systems

Clean, scikit-learn-compatible library implementing SVD, SVD++, NMF, KNN, and slope-one algorithms with built-in cross-validation.

#python#svd#knn#scikit

beginner2022github.com/NicolasHug/SurpriseOpen ↗

Paper

Matrix Factorization Techniques for Recommender Systems

The seminal paper from the Netflix Prize era. Covers SVD, regularization, temporal dynamics, and implicit feedback integration.

#svd#netflix-prize#mf#implicit

beginner2009IEEE Computer 2009Open ↗

Paper

BPR: Bayesian Personalized Ranking from Implicit Feedback

Foundational paper introducing BPR — the dominant pairwise ranking optimization criterion for implicit feedback data in collaborative filtering.

#bpr#ranking#implicit#collaborative

intermediate2012UAI 2009Open ↗

Code

LightFM: Hybrid Recommendation Algorithm

Python implementation of LightFM — combines collaborative and content-based signals. Supports WARP, BPR, logistic, and regression losses.

#hybrid#warp#bpr#content-based

intermediate2021github.com/lyst/lightfmOpen ↗

Paper

Deep Neural Networks for YouTube Recommendations

Google's two-stage architecture for YouTube. Covers candidate generation with wide networks and ranking with deep networks.

#youtube#google#candidate-generation#ranking

intermediate2016RecSys 2016Open ↗

Paper

Neural Collaborative Filtering (NCF)

Replaces the inner product of MF with a neural architecture to learn user-item interaction functions from implicit feedback.

#ncf#neural#deep-learning#implicit

intermediate2017WWW 2017Open ↗

Paper

LightGCN: Simplifying Graph Convolution for Recommendation

Removes feature transformation and nonlinear activation from GCN, achieving state-of-the-art with a simpler propagation rule.

#lightgcn#gcn#graph#simplification

advanced2020SIGIR 2020Open ↗

Code

RecBole: Unified Recommender System Library

Comprehensive library implementing 73 recommendation algorithms including CF, deep learning, GNN, and sequential models.

#recbole#73-algos#unified#benchmark

intermediate2022github.com/RUCAIBox/RecBoleOpen ↗

Paper

Wide & Deep Learning for Recommender Systems

Google's dual architecture combining memorization (wide) and generalization (deep) for app recommendations in Google Play.

#wide-deep#google#memorization#generalization

intermediate2016DLRS Workshop 2016Open ↗

Paper

PinSage: Graph Convolutional Neural Networks for Web-Scale Recommender Systems

Pinterest's production GNN for recommendation. Handles 3B nodes and 18B edges using importance-based sampling.

#pinsage#pinterest#gnn#production

advanced2018KDD 2018Open ↗

Paper

Self-Attentive Sequential Recommendation (SASRec)

Applies self-attention to sequential recommendation. Adapts the Transformer architecture to model user behavior sequences.

#sasrec#self-attention#transformer#sequential

advanced2018ICDM 2018Open ↗

Code

TensorFlow Recommenders (TFRS)

Google's official library for building retrieval and ranking models. Covers two-tower architectures, multi-task learning, and serving.

#tensorflow#google#two-tower#multi-task

intermediate2023github.com/tensorflow/recommendersOpen ↗

Paper

BERT4Rec: Sequential Recommendation with Bidirectional Encoder

Applies BERT's masked language modeling to sequential recommendation. Uses bidirectional self-attention for item sequences.

#bert#bidirectional#sequential#cloze

advanced2019CIKM 2019Open ↗

Paper

Variational Autoencoders for Collaborative Filtering

Applies VAEs to collaborative filtering, introducing a principled Bayesian approach that outperforms linear models.

#vae#bayesian#generative#collaborative

advanced2018WWW 2018Open ↗

Paper

Graph Neural Networks for Social Recommendation

Fan et al. Leverages social network information through GNNs for improved recommendations using trust-based social connections.

#social#gnn#trust#user-graph

advanced2019WWW 2019Open ↗

Paper

LLM-based Recommendation: A Survey

Comprehensive survey on using large language models for recommendation, covering prompting, fine-tuning, and agent-based approaches.

#llm#survey#gpt#prompting

advanced2024arXiv 2024Open ↗

Paper

AutoRec: Autoencoders Meet Collaborative Filtering

Applies autoencoders to collaborative filtering, showing competitive performance vs SVD with a simpler end-to-end architecture.

#autoencoder#autoRec#collaborative#neural

intermediate2015WWW 2015Open ↗

Dataset

MovieLens 25M Dataset

The industry-standard benchmark. 25 million ratings from 162K users on 62K movies. Multiple sizes available from 100K to 25M.

#benchmark#movies#ratings#grouplens

beginner2019grouplens.orgOpen ↗

Blog

How Netflix's Recommendation Engine Works

In-depth technical blog covering Netflix's two-stage system: candidate generation, ranking, and contextual bandits.

#netflix#production#two-stage#ranking

beginner2022netflixtechblog.comOpen ↗

Blog

Embedding-Based Retrieval in Facebook Search

Facebook's two-tower dense retrieval system for search. Covers training strategy, negative sampling, and serving at scale.

#facebook#retrieval#two-tower#embedding

intermediate2020research.fb.comOpen ↗

Dataset

Amazon Product Reviews (2023)

Updated Amazon review dataset covering 34 product categories with 571M ratings. Includes rich metadata, images, and product graphs.

#amazon#reviews#products#metadata

intermediate2023amazon-reviews-2023.github.ioOpen ↗

Blog

Practical Recommendations for Gradient-Based Training

Bengio's practical guide to training deep networks, covering regularization, weight init, and optimization — all highly relevant to RecSys.

#training#regularization#practical#hyperparameters

beginner2012arxiv.orgOpen ↗

Blog

Evaluation Metrics for Recommender Systems Explained

Clear tutorial covering Precision@K, Recall@K, NDCG, MAP, MRR, Hit Rate, and Coverage with Python implementations.

#ndcg#precision#recall#metrics

beginner2023recleague.substack.comOpen ↗

Blog

Building a Two-Tower Model from Scratch

Step-by-step tutorial on implementing a two-tower retrieval model using TensorFlow, complete with negative sampling strategies.

#tutorial#two-tower#tensorflow#retrieval

intermediate2024medium.comOpen ↗

Blog

Multi-Armed Bandits for RecSys

Practical guide to using exploration-exploitation strategies (UCB, Thompson Sampling, LinUCB) in production recommendation systems.

#bandits#exploration#contextual#ucb

intermediate2023medium.comOpen ↗

Dataset

Yelp Open Dataset

Large-scale dataset of Yelp reviews, businesses, and user data for multi-domain recommendation research. 6.9M reviews, 150K businesses.

#reviews#local#multi-domain#businesses

beginner2022yelp.com/datasetOpen ↗