机器学习 49
- CapsID:用胶囊路由软量化替换硬残差量化,让 Semantic ID 自适应变长(arXiv 2026.05)
- RPG:用并行生成 + 长 Semantic ID 打破生成式推荐的推理瓶颈(KDD 2025)
- TIGER:用 Semantic ID + 生成式检索重写推荐系统的奠基之作(NeurIPS 2023)
- TOIS 综述:推荐系统嵌入技术全景图谱——从矩阵分解、序列建模、图神经网络到 LLM 增强
- LASAR:在生成式推荐中实现完整隐空间推理与自适应步数控制
- AsymRec:用非对称连续-离散框架打破生成式推荐的双阶段信息瓶颈
- 2026年5月推荐系统论文盘点:推理增强与自适应计算成为新主线
- 学习率衰减如何浪费课程学习中的优质数据
- DELT: 数据效力——被忽视的语言模型训练优化维度
- IAT: 实例即 Token 重塑工业推荐系统的序列特征工程
- UniMixer: 统一推荐系统三大 Scaling 架构的理论框架与实践
- SSR: 显式稀疏性突破推荐系统 Scaling 瓶颈
- DeepSeek-V4: 突破百万 token 上下文效率瓶颈的开源大模型
- UniRec: 用贝叶斯定理弥合生成式与判别式推荐的表达力鸿沟
- 2026年4-5月推荐系统论文盘点:生成式推荐走向成熟
- OneRec: 快手端到端生成式推荐系统——用一个模型替代整条推荐链路
- GLASS: 生成式推荐系统中的长序列建模——基于SID-Tier与语义搜索
- GEM-Rec: 一个模型同时搞定推荐和广告——竞价感知的生成式推荐框架
- 2026年以来字节、美团、阿里推荐系统论文盘点
- ReSID: 推荐原生的语义ID框架——从信息论视角重新思考生成式推荐的Token化
- 推荐系统中item的token化方案演进
- BCEWithLogloss公式推导
- 旋转位置编码
- 相对位置编码
- torch中的梯度计算
- RQ-VAE方法详解
- Flash Attention推导
- 对比attention实现
- Gpt2代码阅读
- 重新总结激活函数和损失函数
- 对数据进行预处理
- 温度系数
- 强化学习与一般机器学习损失函数的对比
- Torch中的register_bufffer
- Ppo vs dpo
- 极大似然函数
- 交叉熵为什么可以被用作损失函数
- Kl散度和交叉熵
- Fm模型总结
- 神经网络优化算法总结
- 神经网络中的反向传播算法
- 神经网络调优
- Lr和svm分类器
- 损失函数和激活函数总结
- 生成树算法总结
- 文本分类器
- 概率图模型——隐马尔科夫
- 通过用户安装app列表判定性别
- 开始机器学习之旅