AI 浏览器自动化成本分析(一):Token、代理、服务器各花了多少钱

一篇实操向的成本分析。不同场景下 LLM Token 花多少、代理流量花多少、云服务器花多少。哪些优化有效、哪些省下来的钱不够折腾的。

亿牛云技术团队2026年4月30日4 分钟阅读

一个典型采集任务的成本拆解

以一个中等规模的采集任务为例:每天 10,000 个页面,每个页面需要提取 3-5 个字段。使用 AI 浏览器智能体的成本分布在三个维度:

维度一:LLM 推理成本

模型输入 Token 单价输出 Token 单价平均每步10 步任务
Claude Haiku 3.5$1.00/M$5.00/M5,000 in + 200 out ≈ $0.006$0.06
Gemini 2.5 Flash$0.15/M$0.60/M同上 ≈ $0.0009$0.009
GPT-4o$2.50/M$10.00/M同上 ≈ $0.0145$0.145
Claude Sonnet 4$3.00/M$15.00/M同上 ≈ $0.018$0.18

10,000 个任务每天的成本区间:$90(Gemini Flash)到 $1,800(Claude Sonnet)

代理经过 A11y 树优化(agent-browser、Camoufox 的做法),Token 消耗可以再降 90%,把成本控制在 $9 到 $180 之间。

维度二:代理流量成本

代理类型单价每日 10,000 请求月成本
数据中心代理$0.04/GB约 $0.10~$3
爬虫代理(隧道)包月计费$50-$200
API 代理$0.50/GB 或按量约 $1.50~$45
独享代理固定 IP 计费$10-$50/月

代理成本通常在总成本的 5-15% 之间。大多数情况下不需要针对代理成本做优化——省下来没多少钱。

维度三:计算资源成本

部署方式规格月成本可承载任务量
单机 Docker4C/16G~$50数千/天
K8s 小集群8C/32G × 3~$300数万/天
AWS r6i.large × 102C/16G × 10~$800数十万/天
云 API(Steel/Browserless)按量$0.001-0.01/会话弹性

计算成本占总成本的 10-20%

总成本结构

LLM 推理:70-85%  → 优化重点在这里
代理流量:5-15%   → 不值得花太多时间优化
计算资源:10-20%  → 用容器化可以优化但也不如优化 LLM 效果好

五个有效的成本优化方法

1. 缓存 DOM 快照

同一个页面在短时间内的 DOM 结构没变化。缓存 DOM 可以减少 Token 消耗:

class DOMCache:
    def __init__(self, ttl_seconds=300):
        self.cache = {}
        self.ttl = ttl_seconds
 
    async def get_dom(self, url, page):
        if url in self.cache:
            entry = self.cache[url]
            if time.time() - entry["time"] < self.ttl:
                return entry["dom"]
        dom = await extract_dom(page)
        self.cache[url] = {"dom": dom, "time": time.time()}
        return dom

适用场景:同一页面的多次访问、循环采集。

2. 减少截图频率

截图是 Token 消耗的大户。一张截图编码为 base64 后约 500KB,传给视觉模型时会被切分为大量 Token。只在调试和关键操作时截图。

3. 复用会话

已经登录的会话不要每次都重新登录。使用持久化配置文件(agent-browser 的 auth save/load)跨任务复用:

# 第一次登录后保存
agent-browser auth save ./session.json
 
# 后续任务直接加载,跳过登录
agent-browser auth login ./session.json
agent-browser open https://example.16yun.cn

4. 选择正确的模型

不需要什么事情都用最强模型。简单任务用 Gemini Flash 或 Haiku,复杂任务用 Sonnet 或 GPT-4o。

5. 回收不必要的代理

如果你在采集不反爬的网站,不需要住宅代理。数据中心代理就够了。代理只有在被检测到时才需要升级——不要默认用最贵的。

不值得做(或效果有限)的优化

优化手段收益原因
压缩网络请求极低代理流量的成本占比本来就低
降低截图分辨率有限截图成本在视觉模型中占比不固定
自建服务器替代云服务器初期节省但运维成本转移了带宽、维护、稳定性都是隐性成本
过度定制模型不明确微调一个浏览器操作模型的成本远高于直接用现成模型

总结

LLM 推理成本是 AI 浏览器自动化的绝对大头(70-85%)。代理和计算资源加起来不到 30%。优化策略的优先级:

  1. 先优化 Token 消耗(A11y 树、DOM 缓存、减少截图)
  2. 选对模型(简单任务不要用最强模型)
  3. 复用会话(减少重复登录的 Token 消耗)
  4. 最后优化代理和计算资源

需要企业代理方案?

我们可根据目标站点、并发规模与稳定性目标提供定制方案。