DALI:群组推荐开始先判谁主导,再决定怎么聚合
背景
补完 ISRF、PolicySim 和 BiasRecBench 之后,站里已经能把:
group interestplatform interventionselection robustness
这些相邻系统位拆得比较开。
但我回头看现有图谱,仍然觉得 group recommendation 还缺一个更前置的问题:
群体偏好到底应不应该先被判定成不同决策模式,再决定后续聚合方式?
过去很多群组推荐方法虽然已经会:
- 用 attention、hypercube、hypergraph 或 social relation 去学 member contribution。
- 用
LLM或语义特征去补个体兴趣和群体兴趣。 - 在 group-level embedding 上做更强的聚合。
但它们大多还是默认:
group output = member inputs 的某种统一函数
这一轮我先用 arXiv export API 做近期候选差集,再回到 arXiv 摘要页、HTML、PDF、GitHub API 与中文检索核验;对比 DALI / TagLLM 等新候选后,最终锁定:
DALI: LLM-Agent Enhanced Dual-Stream Adaptive Leadership Identification for Group RecommendationsDALIarXiv HTMLDALIPDF
核完之后,我更愿意把它记成:
群组推荐开始先判谁主导,再决定怎么聚合
核心判断
这条线真正新增的,不是“更会聚合的 group recommendation”,而是 group-mode discriminator
DALI 最值得单独记一篇 story 的地方,不是它也用了 LLM agent,而是它明确反对把所有群体都当成同一种决策体。
论文引言把问题写得很清楚:
- 手工 aggregation rule 例如
mean / least misery / weighted sum过于刚性。 - attention-based neural aggregation 虽然能学 member weight,但仍默认群体偏好来自统一的聚合逻辑。
- 真正的问题在于,现实群体里有些是
leader-dominated,有些则更像collaborative决策。
所以 DALI 补出的新系统位不是又一个更强 attention,而是:
系统要先判断 group mode,再决定 recommendation aggregation regime。
这和刚补过的 ISRF 差别很大。ISRF 关心的是 explicit individual interest -> implicit group interest 的语义桥;DALI 关心的则是:
群体决策权到底先落在谁身上。
LLM 在这里不是最终 recommender,而是 rule governance expert + rule evolution engine
这篇 paper 里 LLM 的 owner 也很值得单独记下来。
它没有让 LLM 直接生成最终推荐 item,也没有把 LLM 写成纯解释器或 user simulator,而是拆成了两种 agent role:
Rule Governance ExpertRule Evolution Engine
HTML Section 3.1 把 agent 结构写得非常细:
Role Module负责双角色分工。Memory Module里显式保存Versioned Rule Repository / Case Feature Bank / Performance Evolution Log。Planning Module通过Performance-Rule Feedback Loop (PRFL)监控性能漂移并触发规则更新。Action Module负责把 rule base 和当前 group weight tensor 结合起来做实时判断。
换句话说,这里的 LLM 不是群体偏好的直接生成器,而更像:
power-structure rule engine
更关键的是,这套 agent 不是一次性写死的规则库。论文反复把它写成一个 practice-reflection-evolution 的闭环:
- 先执行当前规则。
- 再监控推荐结果。
- 如果指标漂移,就触发规则生成与验证。
- 通过版本控制决定回滚或升级。
因此这条线补出的不只是 agent role,还包括一个此前站里没单独记开的观察位:
rule-evolution loop
NSHA 把群体聚合正式拆成两档:leadership 一档,collaborative 一档
DALI 真正把系统分叉写出来的地方,在 Section 3.3 的 Neuro-Symbolic Hybrid Aggregation (NSHA)。
它不是单纯把 symbolic rule 和 neural attention 拼在一起,而是先做 dual-channel discrimination:
symbolic reasoning channel用动态 rule agent 做 leadership/collaborative 判别。neural channel负责学隐式 interaction pattern。- 再用 triple-threshold logic 把两路判断融合成最终 group type。
一旦 group type 确认,后续 recommendation aggregation 就正式分流:
- 如果是
leadership group,最高权重成员的偏好直接代表 group preference。 - 如果是
collaborative group,就保留 base GR model 的 attention aggregation 机制。
这点非常关键。
过去很多 group recommendation 工作虽然也会学 member weight,但最后仍默认:
所有群体都在同一条 aggregation path 上,只是权重不同。
DALI 则把问题改写成:
不是权重怎么分,而是先判这群人应不应该继续走同一条聚合路径。
所以这条线最适合补进 Story Lab 的,不是“LLM 帮 attention 更聪明了”,而是:
leadership owneraggregation regime splitpower-structure observability
结果说明它补出的不是 sociological 描述,而是可稳定增强 base GR model 的判别层
DALI 的实验结果不是只在单个 toy baseline 上有效。
Table 2/3 说明它能稳定增强多类 base group recommendation 模型:
- 在
Mafengwo上,GroupIM + DALI的Avg.Improv.达到+13.0%,AGREE + DALI达到+19.9%。 - 在
CAMRa2011上,GroupIM + DALI仍有+2.2%,AGREE + DALI仍有+19.9%。 - 对更强的
DisRec,DALI也还有+4.3% (Mafengwo) / +2.4% (CAMRa2011)的增益。
更有意思的是,它和前一代 leadership-aware framework LARGE 形成了很清楚的对照:
LARGE在Mafengwo上还能给GroupIM / AGREE带来+5.9% / +5.0%。- 但在
CAMRa2011上,LARGE反而会让GroupIM / AGREE退化到-0.9% / -0.5%。 DALI则还能保持+2.2% / +19.9%。
这说明它不是简单继承“领导者存在”的假设,而是把 leadership identification 从静态规则推到了动态判别层。
ablation 也把这件事写得更清楚。Table 4 中完整 GroupIM-DALI 在 Mafengwo 上的 NDCG@10 为 0.545,而:
- 去掉 neural discriminator 后只剩
0.526 - 去掉 rule-based agent 后降到
0.504 - 使用 frozen rules 的变体只到
0.510 - 原始
GroupIM仅为0.475
所以 DALI 最重要的贡献并不是“LLM 让规则更像人类常识”,而是:
dynamic rule evolution + neural discriminator 这两个通道必须同时存在。
它还有明显适用边界:更适合 leadership signal 清晰的 ad-hoc groups
我觉得这篇 paper 最值得额外写清的一点,是作者自己也承认它不是 universal enhancer。
Section 4.3 直接解释了为什么 Mafengwo 比 CAMRa2011 更适合 DALI:
CAMRa2011有145,068条Group-Item交互,但只有290个 groups,更像小规模、稳定、紧密的家庭或熟人团体。Mafengwo则只有3,595条Group-Item交互,却有995个 groups,更像在线平台上的 ad-hoc 兴趣群体。
作者的判断是:
- 小而稳的群体更容易走 collaborative decision。
- 大而松散的群体更容易出现 active / authoritative members 主导决策。
这意味着 DALI 真正适合的不是所有群体,而是:
leadership pattern 足够可观测的 group scenario
对 Story Lab 来说,这一点很重要。否则后面继续写 group modeling 时,很容易把:
ISRF这种group interest reasoningDALI这种leadership discrimination- 普通
attention aggregation
都压回同一种“群体推荐增强”。
公开边界当前仍偏 paper-first,而且缩写噪声很重
这条线的公开边界也要写准。
第一,论文当前仍标 under review,不像 WWW 2026 已接收的 ISRF / From Token to Item 那样有稳定接收页可回指。
第二,我按:
- 论文全标题
- arXiv id
2603.19909 group recommendation leadership llm agent
三组关键词去查 GitHub API,截至 2026-03-24 仍未看到稳定官方 repo。更宽松的仓库搜索里虽然会回出别的 group recommendation 项目,但都不能独立回指到这篇论文。
第三,中文传播层当前也明显偏弱。
继续补做:
2603.19909 推荐DALI group recommendation 中文site:xiaohongshu.com 2603.19909 推荐- 相关
xhslink
之后,稳定结果仍以 arXiv 原文页、缩写噪声和无关页面为主,没有拿到高价值中文机制稿或可复用小红书线索。
所以这条线当前更适合记成:
paper-first group-mode discriminator route
对 Story Lab 的意义
DALI 让我更确定,Story Lab 的群体建模图还缺一层独立观察位:
interest scope还不够,因为它只回答兴趣来自个人还是群体。- 真正决定 group recommendation 聚合路径的,可能是
leadership owner。 - 因此后续至少还要单独记录
group-mode discriminator / aggregation regime split / rule-evolution loop / power-structure observability。
否则后面再把:
ISRFDALI- 传统
attention-based group aggregation
放在一起时,还是会把“群体兴趣是什么”和“群体里谁说了算”混成一个问题。
证据与来源
- 一手论文入口:DALI: LLM-Agent Enhanced Dual-Stream Adaptive Leadership Identification for Group Recommendations
- HTML 版正文:DALI arXiv HTML
- PDF 版正文:DALI PDF
- 公开仓检索入口:GitHub 仓库搜索:
"DALI: LLM-Agent Enhanced Dual-Stream Adaptive Leadership Identification for Group Recommendations"
下一步
- 把
ISRF / DALI压到同一张collective preference owner观察表里,新增interest scope / leadership owner / group-mode discriminator / aggregation regime split / rule-evolution loop / power-structure observability六列。 - 继续补做
DALI 推荐 中文、site:xiaohongshu.com DALI 推荐与相关xhslink检索,看看中文传播层后续会不会出现可长期复用的高价值机制稿。