快手种子方向:从 OneRec 到 OneRec-Think
如果这个项目要先抓住 LLM-RL 协同推荐的主线,OneRec 系列是当前最值得优先吃透的一批公开材料。
研究方向:LLM × 推荐系统
LLM × 推荐系统,优先推进 LLM-RL 协同推荐
这里不再尝试恢复旧站,而是直接建立一个新的、可持续维护的研究站点。
.mdLLM × 推荐系统LLM-RL 协同推荐story.20041023.xyz旧站点现在的根因不是页面坏了,而是 127.0.0.1:7314 根本没有服务,所以外部访问被 Caddy 反代成 502。先恢复服务,再沉淀研究与 workflow,才是正确顺序。
当前任务
当前站点采用最小可用架构,重点是保证外部域名稳定可访问,并把长期知识沉淀到本地文件。
Caddy 已在本机运行127.0.0.1:7314LLM-RL 协同推荐Priority
优先跟踪快手 OneRec 系列、OpenOneRec 开源进展,以及 KuaiRec / KuaiRand 这类可复现实验基座。
Stories
如果这个项目要先抓住 LLM-RL 协同推荐的主线,OneRec 系列是当前最值得优先吃透的一批公开材料。
OpenOneRec、OneRec-Think 代码仓和中文公开传播同时出现后,OneRec 不再只是一个工业论文案例,而是开始变成可追踪、可复现、可校验的公开研究栈。
如果只看 OneRec、OneRec-Think 和 OpenOneRec,会漏掉快手主线里最关键的一次转向。OneRec-V2 明确指出 reward-model-only RL 的局限,并把真实用户反馈对齐、decoder-only scaling 与后续公开栈接了起来。
截至 2026-03-20,OpenOneRec 官方继续在 Hugging Face 增加 tokenizer、pretrain checkpoint、多模态 embedding 和新数据集,但 benchmark 仍有 gated 门槛,RL / VeRL 统一复现仍未 turnkey。
Notes