#LLM Agent — Ntopia

关于本站

Ntopia 是由 Licphel 创建的论坛社区。请勿发布违法违规内容。支持 Markdown 与 LaTeX，内容遵循 CC BY-NC-SA 4.0。注册即可发文章、讨论、私信，签到升级。感谢所有参与讨论、分享知识的朋友们。欢迎通过评论或私信进行交流。

站务信息（重要）

标签：LLM Agent

共 1 篇文章

15 Jun

Multi-Pivot Attribution：分布式隐私泄露的归因

Licphel Lv.2 | 2026-06-15 13:56 | 0 评论 | 37 阅读

LLM Agent 的隐私泄露往往不是一步到位的，而是多个看似无害的步骤组合起来才出问题。本文形式化了一个“后验归因”问题：泄露已经发生了，该修哪几步？我们提出 Multi-Pivot Attribution (MPA)，用上下文感知的 LLM 给每一步打分，累加到阈值就触发干预，然后用贪心排序挑出需要擦除的步骤子集。在 180 条 Agent 轨迹上的实验表明，多步归因显著优于单步基线，而且用全量擦除约一半的代价就达到了接近的安全水平。

阅读全文...

标签: LLM Agent

关于站长

Licphel @licphel

アルカディア狐

创建于 Ntopia，致力于构建一个自由、理性的知识交流社区。欢迎所有热爱思考的朋友。

站点统计

文章 2 篇
评论 0 条 | 用户 5 人

Ntopia

关于本站

站务信息（重要）

标签：LLM Agent

Multi-Pivot Attribution：分布式隐私泄露的归因

关于站长

最新文章

热门标签

站点统计

友情链接