Agent-E 认知框架:DOM 蒸馏与层次化编排实现可靠网页导航
Agent-E 不直接操作浏览器——它通过 DOM 蒸馏(按任务类型过滤内容)、mmid 注入(自定义属性定位)、层次化组聊(执行规划器批量操作)来让 AI 更可靠地理解网页。
Blog
当前标签共有 4 篇文章。
Agent-E 不直接操作浏览器——它通过 DOM 蒸馏(按任务类型过滤内容)、mmid 注入(自定义属性定位)、层次化组聊(执行规划器批量操作)来让 AI 更可靠地理解网页。
智能体 A 记录了操作状态,智能体 B 不知道。智能体 A 的 session 需要迁移到另一个节点,但 Cookie 和 localStorage 还在原来的浏览器里。多智能体的状态管理比单智能体复杂得多。
Profile 隔离够用但麻烦,容器化彻底但贵,CDP Target 轻量但脆弱。三种隔离方案的实际成本和适合场景。
两个智能体同时跑,一个在填表单,另一个突然接管了前者的标签页。这不是假设——agent-browser 的 Issue #326 描述了完全相同的场景。