Browy 实战:用 GitHub Copilot 订阅实现零成本 AI 浏览器代理

Chrome 扩展 + 本地 Node 原生宿主 + GitHub Copilot SDK,零边际推理成本的浏览器 AI 代理方案。

亿牛云技术团队2026年5月17日8 分钟阅读

引言:推理成本——AI 浏览器代理的核心瓶颈

AI 浏览器代理面临一个被低估的工程问题:Token 消耗。

每次 AI 智能体与网页交互,都需要将 DOM 结构(通常 3000-5000 token)发送给大语言模型做决策,然后执行下一步。一个普通的多步骤任务——填表、导航、提取数据——轻松消耗数万甚至数十万 Token。如果使用付费 API,单次复杂任务的成本可以轻松突破 1 美元。

Anthropic CEO Dario Amodei 在 2025 年曾指出,代理模型打破了传统的算力经济平衡,平台每 1 美元的订阅收入,可能要消耗 8 美元的推理算力。

Browy 用一种巧妙的方式绕过了这个问题:它绕开传统计费模式,通过 GitHub Copilot SDK 路由所有模型调用。如果你已经拥有 GitHub Copilot 订阅(个人版 $10/月,企业版 $19/月),那么每次浏览器自动化的边际推理成本就是零。

本文从架构设计到实战操作,深入解析 Browy 的工作原理和使用方法。

架构概览:扩展 + 原生宿主 + Copilot

Browy 的架构由三层组成:

┌─────────────────────────────────────┐
│         Chrome 扩展层               │
│  ┌─────────────┐  ┌──────────────┐ │
│  │  侧边栏 UI  │  │ DevTools CLI │ │
│  └──────┬──────┘  └──────┬───────┘ │
│         │                │          │
│         └──────┬─────────┘          │
│                ▼                    │
│         chrome.debugger API         │
│         (Chrome DevTools Protocol)  │
└──────────────────┬──────────────────┘


┌─────────────────────────────────────┐
│      Native Messaging Host          │
│   (Node.js 后台进程, 本地运行)       │
│                                     │
│   ┌──────────────────────────┐      │
│   │  GitHub Copilot SDK 封装 │      │
│   └──────────┬───────────────┘      │
│              │                      │
│   ┌──────────▼───────────────┐      │
│   │  41 种内置工具注册表      │      │
│   └──────────────────────────┘      │
└──────────────────┬──────────────────┘


┌─────────────────────────────────────┐
│     GitHub Copilot API              │
│  (Claude, GPT-4o, Gemini 等模型)    │
└─────────────────────────────────────┘

扩展层:标准的 Chrome 扩展,通过 chrome.debugger API 附加到当前活动标签页,拦截和操作页面的 CDP 流量。

原生宿主层:本地运行的 Node.js 进程,通过 Chrome 原生消息传递协议(Native Messaging)与扩展通信。宿主管道封装了 GitHub Copilot SDK,将所有模型请求路由到 Copilot API。

模型层:Copilot 订阅提供对 Claude Sonnet、GPT-4o、Gemini 等模型的固定费率访问。Browy 不需要单独的 API Key。

关键设计决策

决策效果
用 Accessibility Tree 替代 DOM每个交互步骤的 Token 消耗从数千降到数百
索引化元素定位(点击编号)不需要脆弱的 CSS 选择器或 XPath
默认禁用宿主 OS 工具防止提示注入攻击访问用户文件系统
DevTools + 侧边栏双界面新手和高级用户各得其所

安装步骤

Browy 的安装分为三步:扩展安装、原生宿主安装、Copilot 登录。

第 1 步:安装扩展

从 Chrome Web Store 搜索 "Browy" 并添加到 Chrome(也兼容 Edge 和 Brave)。

验证:固定工具栏图标,点击打开侧边栏。此时应显示"host disconnected"提示——这是正常的,下一步会解决。

第 2 步:安装原生宿主

macOS / Linux

从项目网站获取安装脚本并执行:

# 从 Browy 项目获取安装脚本并执行
curl -fsSL https://example.16yun.cn/browy-install.sh | bash

Windows(PowerShell):

# 从 Browy 项目获取安装脚本并执行
irm https://example.16yun.cn/browy-install.ps1 | iex

安装过程会:

  • ~/.browy/app/(macOS/Linux)或 %LOCALAPPDATA%\Browy\app\(Windows)放置宿主程序
  • 注册原生消息传递清单(Native Messaging Manifest),使 Chrome 能启动宿主进程
  • 创建 ~/.browy/data/files/ 沙盒目录供文件操作工具使用

验证:重新打开侧边栏,host 提示消失即表示成功。

第 3 步:登录 GitHub Copilot

在 Browy 侧边栏点击「Sign in to GitHub Copilot」。终端窗口弹出设备流链接,输入显示的代码完成授权,终端自动关闭。

验证:发送"what is the headline of this page",应看到 snapshot 工具调用后跟模型回复。

双界面操作:侧边栏 vs DevTools CLI

Browy 提供了两个交互界面,针对不同使用场景优化:

界面打开方式适用场景
侧边栏(Side Panel)工具栏图标 / 快捷键日常自动化、表单填写、数据提取
DevTools CLI 面板F12 → Browy 标签高级用户 REPL、调试排查

侧边栏日常操作

侧边栏适合大多数日常任务。打开任意页面后,直接在聊天栏输入指令:

提取这个页面上所有的链接,整理成表格
找到搜索框,搜索 "best AI agents 2026",然后提取前 5 个结果

DevTools CLI 高级功能

DevTools CLI 面板是给深度用户准备的终端风格操作界面。支持斜杠命令:

命令功能
/help查看所有可用命令和快捷键
/model在 19 种模型间热切换
/js在当前页面上下文中执行 JavaScript
/clear清除聊天历史和状态
/login重新登录 Copilot
# 在 DevTools CLI 中切换模型
/model claude-sonnet-4
 
# 执行 JavaScript 调试
/js document.querySelectorAll('.price').map(e => e.textContent)

核心工具集

Browy 内置 41 种工具,覆盖浏览器操作的各个方面。

浏览器工具

工具功能
snapshot获取当前页面的可访问性索引(Accessibility Tree)快照
click按索引点击元素
type在元素中输入文本
evaluate_js在页面上下文执行 JavaScript
get_network_requests查看网络请求
get_console_logs查看控制台日志
get_cookies读取页面 Cookie
set_cookies写入 Cookie
screenshot截取页面截图
get_storage读取 localStorage

宿主 OS 工具(默认关闭)

以下工具触及用户操作系统,出于安全考虑默认禁用,需在设置中逐一手动开启:

工具功能安全风险
save_file将文件写入 ~/.browy/data/files/沙盒限制
read_file读取沙盒目录中的文件仅沙盒内
run_terminal执行本地终端命令高,建议保持关闭
notes_memory跨会话持久化键值记忆

实战示例

示例 1:采集 YC 初创公司目录

列出 YC 2026 秋季批次所有公司,包括地点和一句话简介

Browy 的执行流程:

1. 加载 YC 初创公司页面
2. 执行 snapshot 获取页面结构
3. 识别列表容器中的每个公司卡片
4. 从每个卡片提取:公司名、地点、简介
5. 格式化为表格输出

示例 2:审查 GitHub PR

Summarise the changes in this PR and flag anything risky

Browy 可以:

  1. 读取 PR 的 diff 视图
  2. 分析变更文件列表
  3. 提取关键代码变更
  4. 用 Copilot 的代码审查能力分析风险

示例 3:设置 Gmail 过滤器

Auto-archive everything from no-reply@*.atlassian.net

Browy 导航到 Gmail 设置 → 过滤器 → 创建新过滤器,自动完成填写。

安全模型:默认禁用

Browy 的安全模型值得关注。它采用了默认禁用策略:

  • 41 种工具中,所有涉及宿主操作系统的工具(文件读写、命令执行)默认关闭
  • 用户在设置面板中逐一手动授权
  • 这种设计防止了来自恶意网站的提示注入攻击(Prompt Injection)窃取本地数据
用户使用浏览器 → 访问恶意网站 → 网站向 Browy 注入指令 →
┌─────────────────────────────────────┐
│  Browy 的安全屏障:                  │
│  - 宿主工具默认关闭                  │
│  - 工具需逐一手动授权                │
│  - 文件读写被沙盒限制                │
└─────────────────────────────────────┘
         ↓ 攻击失败

使用代理

Browy 运行在用户的真实浏览器中,继承了浏览器所有的身份认证和 Cookie。但如果你需要在采集场景中使用代理,可以通过浏览器级别的代理配置实现。

方式一:Chrome 启动参数

google-chrome --proxy-server=http://user:pass@proxy.16yun.cn:8888

方式二:系统环境变量

export HTTP_PROXY=http://user:pass@proxy.16yun.cn:8888
export HTTPS_PROXY=http://user:pass@proxy.16yun.cn:8888
google-chrome
场景推荐方案
临时更换出口 IPChrome 启动参数
日常采集任务爬虫代理(隧道代理)配合
需固定出口的长任务独享代理

Browy 与其他方案的对比

维度BrowyNanobrowseroperator(商业产品)
成本Copilot 订阅($10/月起),边际成本零自有 API Key 按量计费$200/月固定订阅
模型选择19 种模型自由切换多种模型可配置仅 OpenAI 模型
隐私扩展 + 本地进程,无中间服务器数据直达 API 提供商数据发送到 OpenAI
宿主系统访问有(工具默认关闭)
适合场景个人开发者日常自动化对模型有自主选择需求的用户不愿自己配置的用户

局限性

  • 无头不支持:必须运行在图形化桌面浏览器中,不能用于服务器端自动化
  • 无并发放大:单用户单标签页工具,不适合大规模数据采集
  • Copilot 依赖性:Copilot 的模型可用性和速率限制会直接影响 Browy
  • 国内访问:大陆用户访问 api.githubcopilot.com 速度较慢,可使用镜像加速方案

总结

Browy 的模式创新在于:它不试图解决浏览器自动化的所有问题,而是找到了一个特定的裂缝——既有开发者已有的 GitHub Copilot 订阅——并将其利用到极致。

通过将模型调用路由到固定费率订阅,Browy 让 AI 浏览器代理的边际推理成本降到了零。同时,它的双界面设计(侧边栏 + DevTools CLI)、默认禁用的安全模型、以及 41 种内置工具,使其成为一个对开发者友好且安全的日常自动化工具。

下一篇文章将介绍 Steel Browser——一个完全不同的架构方向:基于 Docker 的云端浏览器 API,专为大规模并发 AI 智能体设计。

需要企业代理方案?

我们可根据目标站点、并发规模与稳定性目标提供定制方案。