Browy 实战:用 GitHub Copilot 订阅实现零成本 AI 浏览器代理
Chrome 扩展 + 本地 Node 原生宿主 + GitHub Copilot SDK,零边际推理成本的浏览器 AI 代理方案。
引言:推理成本——AI 浏览器代理的核心瓶颈
AI 浏览器代理面临一个被低估的工程问题:Token 消耗。
每次 AI 智能体与网页交互,都需要将 DOM 结构(通常 3000-5000 token)发送给大语言模型做决策,然后执行下一步。一个普通的多步骤任务——填表、导航、提取数据——轻松消耗数万甚至数十万 Token。如果使用付费 API,单次复杂任务的成本可以轻松突破 1 美元。
Anthropic CEO Dario Amodei 在 2025 年曾指出,代理模型打破了传统的算力经济平衡,平台每 1 美元的订阅收入,可能要消耗 8 美元的推理算力。
Browy 用一种巧妙的方式绕过了这个问题:它绕开传统计费模式,通过 GitHub Copilot SDK 路由所有模型调用。如果你已经拥有 GitHub Copilot 订阅(个人版 $10/月,企业版 $19/月),那么每次浏览器自动化的边际推理成本就是零。
本文从架构设计到实战操作,深入解析 Browy 的工作原理和使用方法。
架构概览:扩展 + 原生宿主 + Copilot
Browy 的架构由三层组成:
┌─────────────────────────────────────┐
│ Chrome 扩展层 │
│ ┌─────────────┐ ┌──────────────┐ │
│ │ 侧边栏 UI │ │ DevTools CLI │ │
│ └──────┬──────┘ └──────┬───────┘ │
│ │ │ │
│ └──────┬─────────┘ │
│ ▼ │
│ chrome.debugger API │
│ (Chrome DevTools Protocol) │
└──────────────────┬──────────────────┘
│
▼
┌─────────────────────────────────────┐
│ Native Messaging Host │
│ (Node.js 后台进程, 本地运行) │
│ │
│ ┌──────────────────────────┐ │
│ │ GitHub Copilot SDK 封装 │ │
│ └──────────┬───────────────┘ │
│ │ │
│ ┌──────────▼───────────────┐ │
│ │ 41 种内置工具注册表 │ │
│ └──────────────────────────┘ │
└──────────────────┬──────────────────┘
│
▼
┌─────────────────────────────────────┐
│ GitHub Copilot API │
│ (Claude, GPT-4o, Gemini 等模型) │
└─────────────────────────────────────┘扩展层:标准的 Chrome 扩展,通过 chrome.debugger API 附加到当前活动标签页,拦截和操作页面的 CDP 流量。
原生宿主层:本地运行的 Node.js 进程,通过 Chrome 原生消息传递协议(Native Messaging)与扩展通信。宿主管道封装了 GitHub Copilot SDK,将所有模型请求路由到 Copilot API。
模型层:Copilot 订阅提供对 Claude Sonnet、GPT-4o、Gemini 等模型的固定费率访问。Browy 不需要单独的 API Key。
关键设计决策
| 决策 | 效果 |
|---|---|
| 用 Accessibility Tree 替代 DOM | 每个交互步骤的 Token 消耗从数千降到数百 |
| 索引化元素定位(点击编号) | 不需要脆弱的 CSS 选择器或 XPath |
| 默认禁用宿主 OS 工具 | 防止提示注入攻击访问用户文件系统 |
| DevTools + 侧边栏双界面 | 新手和高级用户各得其所 |
安装步骤
Browy 的安装分为三步:扩展安装、原生宿主安装、Copilot 登录。
第 1 步:安装扩展
从 Chrome Web Store 搜索 "Browy" 并添加到 Chrome(也兼容 Edge 和 Brave)。
验证:固定工具栏图标,点击打开侧边栏。此时应显示"host disconnected"提示——这是正常的,下一步会解决。
第 2 步:安装原生宿主
macOS / Linux:
从项目网站获取安装脚本并执行:
# 从 Browy 项目获取安装脚本并执行
curl -fsSL https://example.16yun.cn/browy-install.sh | bashWindows(PowerShell):
# 从 Browy 项目获取安装脚本并执行
irm https://example.16yun.cn/browy-install.ps1 | iex安装过程会:
- 在
~/.browy/app/(macOS/Linux)或%LOCALAPPDATA%\Browy\app\(Windows)放置宿主程序 - 注册原生消息传递清单(Native Messaging Manifest),使 Chrome 能启动宿主进程
- 创建
~/.browy/data/files/沙盒目录供文件操作工具使用
验证:重新打开侧边栏,host 提示消失即表示成功。
第 3 步:登录 GitHub Copilot
在 Browy 侧边栏点击「Sign in to GitHub Copilot」。终端窗口弹出设备流链接,输入显示的代码完成授权,终端自动关闭。
验证:发送"what is the headline of this page",应看到 snapshot 工具调用后跟模型回复。
双界面操作:侧边栏 vs DevTools CLI
Browy 提供了两个交互界面,针对不同使用场景优化:
| 界面 | 打开方式 | 适用场景 |
|---|---|---|
| 侧边栏(Side Panel) | 工具栏图标 / 快捷键 | 日常自动化、表单填写、数据提取 |
| DevTools CLI 面板 | F12 → Browy 标签 | 高级用户 REPL、调试排查 |
侧边栏日常操作
侧边栏适合大多数日常任务。打开任意页面后,直接在聊天栏输入指令:
提取这个页面上所有的链接,整理成表格找到搜索框,搜索 "best AI agents 2026",然后提取前 5 个结果DevTools CLI 高级功能
DevTools CLI 面板是给深度用户准备的终端风格操作界面。支持斜杠命令:
| 命令 | 功能 |
|---|---|
/help | 查看所有可用命令和快捷键 |
/model | 在 19 种模型间热切换 |
/js | 在当前页面上下文中执行 JavaScript |
/clear | 清除聊天历史和状态 |
/login | 重新登录 Copilot |
# 在 DevTools CLI 中切换模型
/model claude-sonnet-4
# 执行 JavaScript 调试
/js document.querySelectorAll('.price').map(e => e.textContent)核心工具集
Browy 内置 41 种工具,覆盖浏览器操作的各个方面。
浏览器工具
| 工具 | 功能 |
|---|---|
snapshot | 获取当前页面的可访问性索引(Accessibility Tree)快照 |
click | 按索引点击元素 |
type | 在元素中输入文本 |
evaluate_js | 在页面上下文执行 JavaScript |
get_network_requests | 查看网络请求 |
get_console_logs | 查看控制台日志 |
get_cookies | 读取页面 Cookie |
set_cookies | 写入 Cookie |
screenshot | 截取页面截图 |
get_storage | 读取 localStorage |
宿主 OS 工具(默认关闭)
以下工具触及用户操作系统,出于安全考虑默认禁用,需在设置中逐一手动开启:
| 工具 | 功能 | 安全风险 |
|---|---|---|
save_file | 将文件写入 ~/.browy/data/files/ | 沙盒限制 |
read_file | 读取沙盒目录中的文件 | 仅沙盒内 |
run_terminal | 执行本地终端命令 | 高,建议保持关闭 |
notes_memory | 跨会话持久化键值记忆 | 低 |
实战示例
示例 1:采集 YC 初创公司目录
列出 YC 2026 秋季批次所有公司,包括地点和一句话简介Browy 的执行流程:
1. 加载 YC 初创公司页面
2. 执行 snapshot 获取页面结构
3. 识别列表容器中的每个公司卡片
4. 从每个卡片提取:公司名、地点、简介
5. 格式化为表格输出示例 2:审查 GitHub PR
Summarise the changes in this PR and flag anything riskyBrowy 可以:
- 读取 PR 的 diff 视图
- 分析变更文件列表
- 提取关键代码变更
- 用 Copilot 的代码审查能力分析风险
示例 3:设置 Gmail 过滤器
Auto-archive everything from no-reply@*.atlassian.netBrowy 导航到 Gmail 设置 → 过滤器 → 创建新过滤器,自动完成填写。
安全模型:默认禁用
Browy 的安全模型值得关注。它采用了默认禁用策略:
- 41 种工具中,所有涉及宿主操作系统的工具(文件读写、命令执行)默认关闭
- 用户在设置面板中逐一手动授权
- 这种设计防止了来自恶意网站的提示注入攻击(Prompt Injection)窃取本地数据
用户使用浏览器 → 访问恶意网站 → 网站向 Browy 注入指令 →
┌─────────────────────────────────────┐
│ Browy 的安全屏障: │
│ - 宿主工具默认关闭 │
│ - 工具需逐一手动授权 │
│ - 文件读写被沙盒限制 │
└─────────────────────────────────────┘
↓ 攻击失败使用代理
Browy 运行在用户的真实浏览器中,继承了浏览器所有的身份认证和 Cookie。但如果你需要在采集场景中使用代理,可以通过浏览器级别的代理配置实现。
方式一:Chrome 启动参数
google-chrome --proxy-server=http://user:pass@proxy.16yun.cn:8888方式二:系统环境变量
export HTTP_PROXY=http://user:pass@proxy.16yun.cn:8888
export HTTPS_PROXY=http://user:pass@proxy.16yun.cn:8888
google-chrome| 场景 | 推荐方案 |
|---|---|
| 临时更换出口 IP | Chrome 启动参数 |
| 日常采集任务 | 爬虫代理(隧道代理)配合 |
| 需固定出口的长任务 | 独享代理 |
Browy 与其他方案的对比
| 维度 | Browy | Nanobrowser | operator(商业产品) |
|---|---|---|---|
| 成本 | Copilot 订阅($10/月起),边际成本零 | 自有 API Key 按量计费 | $200/月固定订阅 |
| 模型选择 | 19 种模型自由切换 | 多种模型可配置 | 仅 OpenAI 模型 |
| 隐私 | 扩展 + 本地进程,无中间服务器 | 数据直达 API 提供商 | 数据发送到 OpenAI |
| 宿主系统访问 | 有(工具默认关闭) | 无 | 无 |
| 适合场景 | 个人开发者日常自动化 | 对模型有自主选择需求的用户 | 不愿自己配置的用户 |
局限性
- 无头不支持:必须运行在图形化桌面浏览器中,不能用于服务器端自动化
- 无并发放大:单用户单标签页工具,不适合大规模数据采集
- Copilot 依赖性:Copilot 的模型可用性和速率限制会直接影响 Browy
- 国内访问:大陆用户访问
api.githubcopilot.com速度较慢,可使用镜像加速方案
总结
Browy 的模式创新在于:它不试图解决浏览器自动化的所有问题,而是找到了一个特定的裂缝——既有开发者已有的 GitHub Copilot 订阅——并将其利用到极致。
通过将模型调用路由到固定费率订阅,Browy 让 AI 浏览器代理的边际推理成本降到了零。同时,它的双界面设计(侧边栏 + DevTools CLI)、默认禁用的安全模型、以及 41 种内置工具,使其成为一个对开发者友好且安全的日常自动化工具。
下一篇文章将介绍 Steel Browser——一个完全不同的架构方向:基于 Docker 的云端浏览器 API,专为大规模并发 AI 智能体设计。
需要企业代理方案?
我们可根据目标站点、并发规模与稳定性目标提供定制方案。