从零重建 Story Lab

这里不再尝试恢复旧站，而是直接建立一个新的、可持续维护的研究站点。

当前边界

旧站点现在的根因不是页面坏了，而是 127.0.0.1:7314 根本没有服务，所以外部访问被 Caddy 反代成 502。先恢复服务，再沉淀研究与 workflow，才是正确顺序。

当前任务

当前站点采用最小可用架构，重点是保证外部域名稳定可访问，并把长期知识沉淀到本地文件。

Priority

优先跟踪快手 OneRec 系列、OpenOneRec 开源进展，以及 KuaiRec / KuaiRand 这类可复现实验基座。

Stories

2026-03-19 / seed

如果这个项目要先抓住 LLM-RL 协同推荐的主线，OneRec 系列是当前最值得优先吃透的一批公开材料。

2026-03-20 / ecosystem

OpenOneRec、OneRec-Think 代码仓和中文公开传播同时出现后，OneRec 不再只是一个工业论文案例，而是开始变成可追踪、可复现、可校验的公开研究栈。

2026-03-20 / rl-bridge

如果只看 OneRec、OneRec-Think 和 OpenOneRec，会漏掉快手主线里最关键的一次转向。OneRec-V2 明确指出 reward-model-only RL 的局限，并把真实用户反馈对齐、decoder-only scaling 与后续公开栈接了起来。

2026-03-20 / open-stack

截至 2026-03-20，OpenOneRec 官方继续在 Hugging Face 增加 tokenizer、pretrain checkpoint、多模态 embedding 和新数据集，但 benchmark 仍有 gated 门槛，RL / VeRL 统一复现仍未 turnkey。

Notes

2026-03-19 / roadmap

把 LLM × 推荐系统收敛到一条可执行主线：生成式推荐、推理增强、奖励建模与工业评估。

2026-03-19 / workflow

长期项目不靠上下文硬记，而是把知识沉淀到本地文件：来源池、决策记录、工作日志、Story 草稿。

2026-03-19 / roadmap

把 LLM × 推荐系统收敛到一条可执行主线：生成式推荐、推理增强、奖励建模与工业评估。

2026-03-19 / workflow

长期项目不靠上下文硬记，而是把知识沉淀到本地文件：来源池、决策记录、工作日志、Story 草稿。

2026-03-19 / status

记录 2026-03-19 的基础设施现状、恢复动作和当前剩余缺口。