推荐系统序列建模中的 NDCG 优化:2024–2026 高影响力论文盘点
从 2024 年下半年到 2026 年上半年,推荐系统领域出现了一批直接面向 list 排序质量、尤其是显式优化 NDCG@K 的研究工作。这些工作横跨代理损失设计、可微分 Top-K 算子、Listwise 偏好优化、LLM 排序、Diffusion 建模等多个方向,形成了一张相当完整的技术图谱。本文按方法论分类,逐篇梳理其动机、核心方法和关键结论。 1. 为什么要直接优化 NDCG...
从 2024 年下半年到 2026 年上半年,推荐系统领域出现了一批直接面向 list 排序质量、尤其是显式优化 NDCG@K 的研究工作。这些工作横跨代理损失设计、可微分 Top-K 算子、Listwise 偏好优化、LLM 排序、Diffusion 建模等多个方向,形成了一张相当完整的技术图谱。本文按方法论分类,逐篇梳理其动机、核心方法和关键结论。 1. 为什么要直接优化 NDCG...
论文: CapsID: Soft-Routed Variable-Length Semantic IDs for Generative Recommendation 链接: https://arxiv.org/abs/2605.05096 机构: 未明确标注(推测为工业界团队,拥有 3500 万级 item 的工业数据集) 作者: Wenzhuo Cheng, Menghang Gong, ...
论文: Generating Long Semantic IDs in Parallel for Recommendation 链接: https://arxiv.org/abs/2506.05781 机构: University of California, San Diego (UCSD) / Meta AI 作者: Yupeng Hou, Jiacheng Li, Ashley Shi...
论文: Recommender Systems with Generative Retrieval 链接: https://arxiv.org/abs/2305.05065 机构: Google DeepMind / Google / University of Wisconsin-Madison 作者: Shashank Rajput*, Nikhil Mehta*, Anima Sing...
论文: Embedding in Recommender Systems: A Survey 链接: https://doi.org/10.1145/3812652 机构: 香港城市大学(CityU)、百度、香港理工大学 作者: Maolin Wang、Xinjian Zhao、Wanyu Wang(共同一作);Sheng Zhang、Jiansheng Li、Bowen Yu、Binhao...
论文: LASAR: Latent Adaptive Semantic Aligned Reasoning for Generative Recommendation 链接: https://arxiv.org/abs/2605.10207 机构: 北京航空航天大学人工智能学院、百度 作者: Yiwen Chen, Fuwei Zhang, Zehao Chen, Deqing Wang 等...
论文: Asymmetric Generative Recommendation via Multi-Expert Projection and Multi-Faceted Hierarchical Quantization 链接: https://arxiv.org/abs/2605.14512 机构: 清华大学计算机系(DCST / BNRist)、腾讯 作者: Bin Huang, X...
2026年5月,推荐系统领域的研究热度持续高涨。如果说4月是生成式推荐”从能用到好用”的转折期,那么5月的论文则清晰地勾勒出两条新的技术主线:推理增强(Reasoning-Enhanced)推荐和自适应计算分配(Adaptive Compute Allocation)。前者将 LLM 的 Chain-of-Thought / 隐空间推理能力引入 SID 解码过程,后者则在训练与推理阶段实现”...
论文: How Learning Rate Decay Wastes Your Best Data in Curriculum-Based LLM Pretraining 链接: https://arxiv.org/abs/2511.18903 机构: 清华大学、鹏城实验室 时间: 2025 年 11 月(arXiv v3 更新于 2026 年 5 月) 1. 问题背景 大语言模型预训练...
论文: Data Efficacy for Language Model Training 链接: https://arxiv.org/abs/2506.21545 机构: Microsoft Research 时间: 2025 年 6 月(ICLR 2026 投稿) 1. 问题背景 在大语言模型的训练流水线里,”数据”始终是最具决定性的变量之一。围绕”如何更好地使用数据”,研究社区在过...