Blog

分类：技术指南

当前分类共有 99 篇文章。

技术指南2026年7月8日3 分钟阅读亿牛云技术团队

Obscura Rust 库集成——Browser/Page/Element 完整 API

嵌入式 Rust 库 API：Browser/Page/Element/CookieStore，拦截通道、事件回调、编译注意。Git 依赖直接集成。

#Obscura #Rust #嵌入式开发 #Crate #API

阅读全文

技术指南2026年7月8日10 分钟阅读亿牛云技术团队

2026 年代理IP质量评测：亿牛云五款产品与行业参照实测对比

亿牛云隧道代理、API代理、独享代理、定时转发代理、海外住宅代理 vs 三家行业参照——72 小时实测数据对比。

#代理IP #亿牛云 #质量评测 #连通率 #Obscura

阅读全文

技术指南2026年7月7日3 分钟阅读亿牛云技术团队

Obscura 请求拦截——阻断 API、Mock 响应、注入脚本

三种拦截方式覆盖 CDP 层、Rust 层和网络层。屏蔽广告、Mock API、注入脚本——控制页面的每一个请求。

#Obscura #请求拦截 #Fetch API #Puppeteer #Mock

阅读全文

技术指南2026年7月6日3 分钟阅读亿牛云技术团队

Obscura 生产部署——Docker、Systemd、多 Worker 与资源调优

Docker distroless 镜像、Systemd 服务单元、多进程 Worker 扩展、V8 堆调优、反向代理 WebSocket——Obscura 生产部署全攻略。

#Obscura #生产部署 #Docker #Systemd #运维

阅读全文

技术指南2026年7月4日6 分钟阅读亿牛云技术团队

Obscura MCP 服务器——给 AI Agent 装上浏览器

30+ 个 MCP 工具，从导航到填表到提取。Claude Desktop 配置完成即可让 AI 驱动浏览器执行任意网页操作。

#Obscura #MCP #AI Agent #Claude #浏览器自动化

阅读全文

技术指南2026年7月2日4 分钟阅读亿牛云技术团队

Obscura CDP 兼容——Puppeteer/Playwright 零改动迁移

核心 CDP Domain、Puppeteer 和 Playwright 直接连接、生命周期完全映射——从 Headless Chrome 切换到 Obscura 只需改一行连接地址。

#Obscura #CDP #Puppeteer #Playwright #协议兼容

阅读全文

技术指南2026年7月1日5 分钟阅读亿牛云技术团队

Obscura CLI 指南——七种输出格式与并发抓取

七种输出格式、并发 Worker、JS 注入执行、SPA 等待策略——Obscura CLI 一条命令就是一个完整的无头浏览器。

#Obscura #CLI #数据提取 #爬虫 #命令行

阅读全文

技术指南2026年6月30日5 分钟阅读亿牛云技术团队

Obscura 是什么——开源无头浏览器引擎

30 MB 内存、85 ms 页面加载、内置反检测——Obscura 是 Headless Chrome 的 Rust 替代品，专为 AI Agent 和爬虫而生。

#Obscura #无头浏览器 #Rust #CDP #AI Agent

阅读全文

技术指南2026年6月5日7 分钟阅读亿牛云技术团队

AI 智能体反封锁实战：代理配置与引擎级伪装最佳实践

当 AI 智能体从实验室走向生产，反封锁不再是可选项而是生存必需品。本文从代理选型、GeoIP 对齐、IP 轮换策略、指纹一致性、错误码排错到生产 Checklist，系统化梳理可落地的反封锁方案。

#反封锁 #代理配置 #GeoIP #指纹管理 #AI Agent #16YUN 代理

阅读全文

技术指南2026年6月4日7 分钟阅读亿牛云技术团队

AI 浏览器智能体横向对比：六大框架词元效率、反检测与架构选型

2026 年中，AI 浏览器智能体生态已经分化为四个截然不同的架构范式。本文从词元效率、反检测策略、部署模型、成本结构和适用场景五个维度，对六大主流框架进行全面横向对比。

#横向对比 #AI 浏览器智能体 #Nanobrowser #Steel #agent-browser #Camoufox #Agent-E #Browy

阅读全文

技术指南2026年6月3日11 分钟阅读亿牛云技术团队

Lightpanda 快照崩溃、Nanobrowser 幻觉发邮件、Steel 指纹重试全失败——七个让我在生产环境翻车的 Bug

这些 AI 浏览器工具 demo 阶段都很美，真正跑到生产环境才知道营销承诺和工程成熟度之间的差距。七个我实际遇到的 Bug，附带每个问题的根因和绕过方案。

#AI 浏览器 #踩坑记录 #生产环境 #Bug 排查 #工程实战 #经验之谈

阅读全文

技术指南2026年6月2日6 分钟阅读亿牛云技术团队

AWS Agentic Form Filling：Bedrock 情景记忆与语义元素发现的实践

AWS 的航空值机 AI Agent 展示了企业级认知编排的标准架构：Bedrock AgentCore 管理情景记忆（Episodic Memory），Playwright 处理浏览器交互，Sentence Transformers 做语义元素发现。

#AWS #Bedrock #AgentCore #情景记忆 #Playwright #表单填充

阅读全文

技术指南2026年6月1日1 分钟阅读亿牛云技术团队

Node.js HTTP 客户端隧道代理：axios / got / http 三种实现对比

axios、got、原生 http 三种 Node.js HTTP 客户端的隧道代理实现对比。

#Node.js #axios #got #HTTP 客户端 #隧道代理

阅读全文

技术指南2026年5月31日2 分钟阅读亿牛云技术团队

Python mitmproxy 隧道代理：中间人代理转发爬虫代理

mitmproxy upstream 模式 + addon 脚本对接爬虫代理。

#Python mitmproxy #中间人代理 #隧道代理 #upstream 模式

阅读全文

技术指南2026年5月30日5 分钟阅读亿牛云技术团队

Agent-E 认知框架：DOM 蒸馏与层次化编排实现可靠网页导航

Agent-E 不直接操作浏览器——它通过 DOM 蒸馏（按任务类型过滤内容）、mmid 注入（自定义属性定位）、层次化组聊（执行规划器批量操作）来让 AI 更可靠地理解网页。

#Agent-E #AG2 #DOM 蒸馏 #多智能体 #AI Agent #认知框架

阅读全文

技术指南2026年5月29日1 分钟阅读亿牛云技术团队

Golang 隧道代理：net/http 与 resty 四种 IP 控制场景

Go net/http 和 resty 的四种隧道代理场景，原生支持 HTTPS Proxy-Tunnel。

#Golang #net/http #resty #隧道代理

阅读全文

技术指南2026年5月28日7 分钟阅读亿牛云技术团队

Camoufox 反检测浏览器：C++ 引擎级指纹欺骗，超越传统 JS 垫片

当 JS 垫片越来越容易被 WAF 识破时，Camoufox 选择了一条更彻底的路——直接在 C++ 引擎层修改 Firefox 源码，在 JavaScript 执行之前完成指纹欺骗。

#Camoufox #反检测浏览器 #指纹欺骗 #Firefox #AI Agent #C++

阅读全文

技术指南2026年5月27日2 分钟阅读亿牛云技术团队

Python Selenium Chrome 隧道代理：浏览器自动化集成爬虫代理

Selenium Chrome + 爬虫代理：Chrome 扩展注入代理认证的完整方案。

#Python Selenium #Chrome 扩展 #隧道代理 #浏览器自动化

阅读全文

技术指南2026年5月25日2 分钟阅读亿牛云技术团队

Node.js Puppeteer 隧道代理：Chrome 浏览器自动化集成爬虫代理

Puppeteer + 爬虫代理：Chrome 浏览器自动化的代理集成方案。

#Node.js #Puppeteer #隧道代理 #Chrome 自动化

阅读全文

技术指南2026年5月24日5 分钟阅读亿牛云技术团队

Lightpanda 引擎剖析：用 Zig 从头构建的无头浏览器，10× 快 10× 省

Lightpanda 不是 Chrome 的补丁或分支——它是用 Zig 从头编写的纯无头浏览器。去掉 GUI 渲染管线、JS 引擎深度优化、CDP 协议兼容。启动快 10 倍，内存少 10 倍。

#Lightpanda #Zig #无头浏览器 #浏览器引擎 #CDP

阅读全文

技术指南2026年5月23日2 分钟阅读亿牛云技术团队

Node.js Playwright 隧道代理：浏览器自动化集成爬虫代理

Playwright + 爬虫代理：浏览器自动化的代理集成方案。

#Node.js #Playwright #隧道代理 #浏览器自动化

阅读全文

技术指南2026年5月22日7 分钟阅读亿牛云技术团队

Agent-Browser 架构剖析：Rust 守护进程、A11y 引用与 Token 优化

agent-browser 用原生 Rust 守护进程替代 Node.js 冷启动，用 A11y 快照 + 稳定的元素引用 ID 替代脆弱的 CSS 选择器，将 DOM 从 5000 Token 压缩到 200-400 Token。

#agent-browser #Rust #Accessibility Tree #Token 优化 #Vercel #CLI 工具

阅读全文

技术指南2026年5月21日2 分钟阅读亿牛云技术团队

Python Scrapy 隧道代理：爬虫框架四种 IP 控制场景

Scrapy 中间件配置四种代理场景，含 HTTP Proxy-Tunnel 和 HTTPS 限制说明。

#Python Scrapy #隧道代理 #爬虫框架 #Proxy-Tunnel

阅读全文

技术指南2026年5月19日1 分钟阅读亿牛云技术团队

Python aiohttp 隧道代理：异步并发四种 IP 控制场景

aiohttp 的异步四种场景，proxy_headers 实现 HTTPS Proxy-Tunnel。

#Python aiohttp #隧道代理 #异步并发 #proxy_headers

阅读全文

技术指南2026年5月18日6 分钟阅读亿牛云技术团队

Steel Browser 深度解析：为 AI 智能体构建的企业级云端浏览器 API

Steel Browser 是开源的云端浏览器 API，内置会话管理、代理轮询、隐身配置和 CAPTCHA 求解。支持 Puppeteer、Playwright、Selenium 三协议兼容。

#Steel Browser #云端浏览器 #AI Agent #浏览器自动化 #Docker

阅读全文

技术指南2026年5月17日2 分钟阅读亿牛云技术团队

Python httpx 隧道代理：异步 HTTP 四种 IP 控制场景

Python httpx 的四种隧道代理场景，含 httpx.Proxy 实现 HTTPS Proxy-Tunnel。

#Python httpx #隧道代理 #Proxy-Tunnel #异步 HTTP

阅读全文

技术指南2026年5月17日8 分钟阅读亿牛云技术团队

Browy 实战：用 GitHub Copilot 订阅实现零成本 AI 浏览器代理

如果你已有 GitHub Copilot 订阅，Browy 让你的 AI 浏览器代理边际成本降到零。侧边栏日常操作，DevTools CLI 高级控制，41 种内置工具。

#Browy #GitHub Copilot #浏览器自动化 #AI Agent #Chrome 扩展

阅读全文

技术指南2026年5月15日3 分钟阅读亿牛云技术团队

Python requests 隧道代理：爬虫代理四种 IP 控制场景

requests 完整实现四种场景，含 HTTPS 下 Proxy-Tunnel 的自定义 HTTPAdapter 方案。

#Python requests #隧道代理 #Proxy-Tunnel #IP 控制

阅读全文

技术指南2026年5月14日8 分钟阅读亿牛云技术团队

Nanobrowser 入门：免费替代 OpenAI Operator 的多智能体网页自动化

免费的 OpenAI Operator 替代品。安装 Chrome 扩展，配置你的 API Key，用自然语言控制浏览器。内置 Planner/Navigator/Validator 多智能体系统。

#Nanobrowser #AI Agent #浏览器自动化 #多智能体系统 #开源

阅读全文

技术指南2026年5月13日1 分钟阅读亿牛云技术团队

Python urllib 隧道代理：标准库四种 IP 控制场景

urllib 四种场景，含自定义 HTTPSConnection 实现 HTTPS Proxy-Tunnel。

#Python urllib #标准库 #隧道代理 #HTTPSConnection

阅读全文

技术指南2026年5月13日3 分钟阅读亿牛云技术团队

agent-browser + 16YUN 代理：企业级 AI 采集部署

多 session 隔离、域白名单、操作审批、代理选型、生产部署 checklist——agent-browser 的企业级采集方案。

#agent-browser #16YUN 代理 #企业级部署 #AI 采集

阅读全文

技术指南2026年5月11日2 分钟阅读亿牛云技术团队

agent-browser 网络控制：请求拦截与页面诊断

network route 拦截请求、network har 录制性能数据、react tree 组件树、vitals 性能指标。

#agent-browser #网络拦截 #HAR #React DevTools #Web Vitals

阅读全文

技术指南2026年5月11日1 分钟阅读亿牛云技术团队

Python feapder 与 ScrapySplash 隧道代理：爬虫框架扩展方案

feapder 中间件 + ScrapySplash 对接爬虫代理。

#feapder #ScrapySplash #爬虫框架 #隧道代理

阅读全文

技术指南2026年5月9日2 分钟阅读亿牛云技术团队

agent-browser 批量自动化：Batch 与 AI Chat

batch 避免进程启动开销、chat 自然语言控制浏览器、多 session 并发采集编排。

#agent-browser #Batch #AI Chat #自动化管线

阅读全文

技术指南2026年5月9日1 分钟阅读亿牛云技术团队

Python pyppeteer 与 Selenium Firefox 隧道代理：浏览器自动化方案

pyppeteer + Selenium Firefox 对接爬虫代理。

#pyppeteer #Selenium Firefox #浏览器自动化 #隧道代理

阅读全文

技术指南2026年5月8日1 分钟阅读亿牛云技术团队

Playwright 到 AI 智能体迁移（二）：双模式 API 设计与灰度切换

不需要停机切换。同一套接口，后台可以走 AI 也可以走脚本。配置开关控制、对比验证、灰度递增——迁移的风险可以控制在很低水平。

#双模式 #灰度切换 #API 设计 #渐进式迁移 #A/B 对比

阅读全文

技术指南2026年5月7日1 分钟阅读亿牛云技术团队

PHP 隧道代理：curl / Guzzle / Stream 三种实现

PHP curl、Guzzle、Stream 三种方式对接爬虫代理。

#PHP #cURL #Guzzle #Stream Context #隧道代理

阅读全文

技术指南2026年5月7日3 分钟阅读亿牛云技术团队

agent-browser Session 管理：认证持久化与状态复用

用 --profile 复用已有登录态、--session-name 自动保存恢复、state 导入导出加密存储。

#agent-browser #Session 管理 #认证持久化 #Chrome Profile

阅读全文

技术指南2026年5月6日3 分钟阅读亿牛云技术团队

Playwright 到 AI 智能体迁移（一）：哪些模块该先动——评估矩阵

稳定路径用脚本、不稳定路径用 AI。但怎么定义'稳定'？用三个维度打分：操作稳定性、结构变化频率、异常处理成本。

#迁移 #Playwright #AI 智能体 #评估矩阵 #渐进式

阅读全文

技术指南2026年5月5日1 分钟阅读亿牛云技术团队

C++ 隧道代理：libcurl 与 CPR 两种实现

C++ libcurl + CPR 对接爬虫代理。

#C++#libcurl #CPR #隧道代理

阅读全文

技术指南2026年5月5日2 分钟阅读亿牛云技术团队

agent-browser Snapshot 与截图：让爬虫「看懂」页面

snapshot -i 只看交互元素、screenshot --annotate 带编号标注的截图、diff 检测页面变化。

#agent-browser #Snapshot #截图 #Diff

阅读全文

技术指南2026年5月4日2 分钟阅读亿牛云技术团队

agent-browser CI/CD 测试：版本锁定、无头差异与 Flaky Test 处理

Chrome 一次自动更新，CI 全线崩溃。无头模式下 A11y 树的元素顺序和完整渲染不一样。两个测试用例同时跑互相 hijack session。

#CI/CD #浏览器测试 #版本锁定 #Flaky Test #无头模式

阅读全文

技术指南2026年5月3日1 分钟阅读亿牛云技术团队

C# 隧道代理：HttpClient 与 HttpWebRequest 两种实现

C# HttpClient + HttpWebRequest 对接爬虫代理。

#C##HttpClient #HttpWebRequest #隧道代理

阅读全文

技术指南2026年5月3日2 分钟阅读亿牛云技术团队

agent-browser 入门：AI 时代的浏览器自动化 CLI

npm install -g agent-browser，一个命令打开浏览器，snapshot 获取页面结构，click/fill 操作元素。

#agent-browser #浏览器自动化 #AI Agent #CLI 工具

阅读全文

技术指南2026年5月2日3 分钟阅读亿牛云技术团队

AI 浏览器自动化成本分析（二）：代理和计算资源的优化清单

Token 第一，代理第二，计算第三。代理优化不省钱但能降低延迟，计算优化在规模化后有意义。

#代理优化 #计算资源 #并发策略 #成本 #规模化

阅读全文

技术指南2026年5月1日2 分钟阅读亿牛云技术团队

Trafilatura + CloakBrowser：全文采集的完整流水线

CloakBrowser 渲染 SPA/JS 页面 → Trafilatura 提取正文。解决「要 JS 渲染的站没法提取正文」的问题。

#Trafilatura #CloakBrowser #全文采集 #JS 渲染

阅读全文

技术指南2026年5月1日1 分钟阅读亿牛云技术团队

Rust 隧道代理：reqwest 与 isahc 两种实现

Rust reqwest + isahc 对接爬虫代理，含 HTTPS Tunnel 限制说明。

#Rust #reqwest #isahc #隧道代理

阅读全文

技术指南2026年4月30日4 分钟阅读亿牛云技术团队

AI 浏览器自动化成本分析（一）：Token、代理、服务器各花了多少钱

一个采集任务：Token 花了 $0.05，代理流量花了 $0.001，服务器摊了 $0.002。Token 才是成本大头。代理和服务器大部分时候便宜得不需要优化。

#成本分析 #Token 成本 #代理流量 #云计算 #优化

阅读全文

技术指南2026年4月29日1 分钟阅读亿牛云技术团队

Ruby 隧道代理：Faraday 与 HTTParty 两种实现

Ruby Faraday + HTTParty 对接爬虫代理。

#Ruby #Faraday #HTTParty #隧道代理

阅读全文

技术指南2026年4月29日2 分钟阅读亿牛云技术团队

Trafilatura 高级技巧：自定义提取、语言检测与性能优化

自定义提取策略、语言检测、离线批量处理和增量更新策略。

#Trafilatura #自定义提取 #语言检测 #性能优化

阅读全文

技术指南2026年4月28日3 分钟阅读亿牛云技术团队

Chrome 集群 K8s 部署：内存配置、/dev/shm 与优雅关闭

浏览器不是无状态微服务。200-500MB 每个实例、/dev/shm 配置、WebSocket 长连接、HPA 需要业务指标——K8s 上的浏览器集群需要完全不同的设计思路。

#Kubernetes #浏览器集群 #资源管理 #容器编排 #生产部署

阅读全文

技术指南2026年4月27日1 分钟阅读亿牛云技术团队

Swift 隧道代理：Alamofire 与 URLSession 两种实现

Swift Alamofire + URLSession 对接爬虫代理。

#Swift #Alamofire #URLSession #隧道代理

阅读全文

技术指南2026年4月27日1 分钟阅读亿牛云技术团队

批量采集：Trafilatura + 亿牛云代理的生产级方案

从单页提取到百万级批量采集的架构演进：并发控制、代理轮换、错误处理、存储管道。

#Trafilatura #批量采集 #并发爬虫 #代理轮换

阅读全文

技术指南2026年4月26日2 分钟阅读亿牛云技术团队

Nanobrowser 安全防御（二）：行为约束沙盒与权限控制

输入过滤不是万能的。当攻击者绕过过滤后，行为沙盒是最后一道防线——限制智能体在被操控时能做什么。

#行为沙盒 #权限控制 #操作降权 #AI 安全 #Prompt Injection

阅读全文

技术指南2026年4月25日1 分钟阅读亿牛云技术团队

Perl LWP 隧道代理：经典 Perl HTTP 客户端对接爬虫代理

Perl LWP 对接爬虫代理。

#Perl #LWP #UserAgent #隧道代理

阅读全文

技术指南2026年4月25日3 分钟阅读亿牛云技术团队

精准提取：正文、元数据与表格——Trafilatura 提取能力详解

深入 Trafilatura 提取引擎，对比 readability/newspaper3k/boilerpy3，看 benchmark 数据。

#Trafilatura #正文提取 #内容提取对比 #Benchmark

阅读全文

技术指南2026年4月24日2 分钟阅读亿牛云技术团队

Nanobrowser 安全防御（一）：Prompt Injection 上下文隔离与输入过滤

一行隐藏的白色文字就能让智能体执行攻击者的指令。Prompt Injection 不是 XSS 也不是 SQL 注入——它发生在 AI 推理层，传统安全工具防不了。

#Prompt Injection #安全 #上下文隔离 #AI 安全 #防护

阅读全文

技术指南2026年4月23日2 分钟阅读亿牛云技术团队

智能爬取：用 Trafilatura 发现和抓取整站内容

Sitemap 发现 → Feed 更新追踪 → URL 管理 → 批量提取，一站式整站采集方案。

#Trafilatura #Sitemap #RSS #整站爬取

阅读全文

技术指南2026年4月23日1 分钟阅读亿牛云技术团队

Node.js 高级隧道代理：undici / superagent / https 客户端

undici、superagent、https 原生模块对接爬虫代理。

#Node.js #undici #superagent #https-agent #隧道代理

阅读全文

技术指南2026年4月22日21 分钟阅读亿牛云技术团队

2026 年，企业级代理服务的稳定性保障体系

企业级代理稳定性保障的完整体系：SLA 指标、故障分级、响应机制、持续优化。

#企业代理 #SLA #服务保障 #代理稳定性 #企业服务

阅读全文

技术指南2026年4月22日4 分钟阅读亿牛云技术团队

AI 浏览器智能体可观测性（二）：监控与告警——HTTP 200 不代表任务成功

仪表盘上所有指标都是绿色——HTTP 200 率 99.9%、P95 延迟 200ms、无 5xx 错误。但智能体实际上在同一个页面循环了 10 次，什么都没提取到。传统监控看不到这个问题。

#监控 #告警 #成功率 #AI Agent #可观测性

阅读全文

技术指南2026年4月21日1 分钟阅读亿牛云技术团队

Node.js 经典隧道代理：phantomjs / casperjs / request（历史参考）

phantomjs、casperjs、request 三个历史工具对接爬虫代理。

#phantomjs #casperjs #request #历史工具 #隧道代理

阅读全文

技术指南2026年4月21日2 分钟阅读亿牛云技术团队

Trafilatura 入门：从 HTML 到结构化文本的最短路径

pip install 开始，三行代码提取网页正文、标题、作者和发布日期。

#Trafilatura #正文提取 #网页抓取 #Python 爬虫

阅读全文

技术指南2026年4月20日3 分钟阅读亿牛云技术团队

AI 浏览器智能体可观测性（一）：操作流水——智能体每一步都干了什么

Agent 在浏览器里跑了 50 步，中间出错了，你只看到最后一步的报错。没有操作流水、没有 DOM 快照回放、没有决策链路由。

#可观测性 #操作追踪 #DOM 快照 #调试 #AI Agent

阅读全文

技术指南2026年4月19日4 分钟阅读亿牛云技术团队

代理 IP + 指纹浏览器：爬虫防封禁的终极组合

指纹解决你是谁，代理解决你在哪里。两者协同是绕过现代反爬系统的必要条件。

#代理IP #指纹浏览器 #GEOIP #WebRTC 防泄漏 #CloakBrowser

阅读全文

技术指南2026年4月18日3 分钟阅读亿牛云技术团队

Playwright + AI 智能体混合架构（三）：AI 也失败时——降级、灰度与回滚

LLM 在 15 分钟内无法完成表单填写。选择器连续失败超过门限。Token 消耗超过预期 3 倍。AI 失败不是会不会发生的问题，是何时发生的问题。

#降级策略 #灰度切换 #回滚 #AI 失败 #韧性设计

阅读全文

技术指南2026年4月17日4 分钟阅读亿牛云技术团队

自建指纹浏览器集群：企业级 Multilogin 替代方案

Docker 一键部署 Browser Profile Manager，创建和管理指纹浏览器集群，绑定独立代理。

#指纹浏览器集群 #Multilogin 替代 #Browser Profile Manager #CloakBrowser

阅读全文

技术指南2026年4月16日3 分钟阅读亿牛云技术团队

Playwright + AI 智能体混合架构（二）：桥接层设计——让脚本和 AI 自由切换

不是"A 任务用脚本，B 任务用 AI"——而是同一个任务的前三步用脚本，第四步出错了自动切换到 AI，处理完再交回脚本。

#桥接层 #混合架构 #脚本与 AI #异常切换 #接口设计

阅读全文

技术指南2026年4月15日4 分钟阅读亿牛云技术团队

人机行为模拟：用 humanize=True 骗过行为检测

一个参数开启鼠标轨迹、键盘节奏和滚动模式的人性化模拟，绕过行为检测。

#人机行为模拟 #humanize #行为检测 #CloakBrowser

阅读全文

技术指南2026年4月14日4 分钟阅读亿牛云技术团队

Playwright + AI 智能体混合架构（一）：AI 和确定性脚本的分界线在哪里

Page.goto 用 AI 去调用的成本是用脚本的 20 倍以上。Login 流程交给 AI 往往比脚本慢 3-5 倍。不是所有操作都适合大模型。

#混合架构 #AI 决策 #确定性脚本 #成本优化 #架构设计

阅读全文

技术指南2026年4月13日3 分钟阅读亿牛云技术团队

指纹管理与 Session 持久化：让爬虫看起来像"回头客"

固定指纹种子、持久化 Cookie/Session、绕过 incognito 检测，让反爬系统认为你是回访用户。

#指纹管理 #session 持久化 #reCAPTCHA Enterprise #CloakBrowser

阅读全文

技术指南2026年4月12日4 分钟阅读亿牛云技术团队

Chrome 浏览器多实例隔离（三）：会话状态同步、锁机制与迁移

智能体 A 记录了操作状态，智能体 B 不知道。智能体 A 的 session 需要迁移到另一个节点，但 Cookie 和 localStorage 还在原来的浏览器里。多智能体的状态管理比单智能体复杂得多。

#多智能体 #状态同步 #锁机制 #会话迁移 #分布式

阅读全文

技术指南2026年4月11日5 分钟阅读亿牛云技术团队

Nanobrowser 源代码解析：多智能体采集循环——Executor 如何驱动 Planner + Navigator 爬取多页

Executor 的核心是一个 for 循环：Planner 每 N 步规划一次方向，Navigator 每次执行一个操作。Planner 说完成了就停，Navigator 说完成了让 Planner 验证。连续失败超过上限就放弃。

#Nanobrowser #源代码 #Executor #Planner #Navigator #多智能体循环 #爬虫

阅读全文

技术指南2026年4月11日3 分钟阅读亿牛云技术团队

CloakBrowser 实战：30 秒绕过 Cloudflare Turnstile

pip install 开始，3 行代码跑通 CloakBrowser，绕过 Cloudflare Turnstile。

#CloakBrowser #Cloudflare Turnstile #Playwright #爬虫实战

阅读全文

技术指南2026年4月10日4 分钟阅读亿牛云技术团队

Chrome 浏览器多实例隔离（二）：Profile、容器化与 CDP Target 三种方案对比

Profile 隔离够用但麻烦，容器化彻底但贵，CDP Target 轻量但脆弱。三种隔离方案的实际成本和适合场景。

#多智能体 #隔离方案 #Chrome Profile #容器化 #CDP Target

阅读全文

技术指南2026年4月10日5 分钟阅读亿牛云技术团队

Nanobrowser 源代码解析：可点击元素检测与哈希去重——智能体怎么「看」页面

getClickableElements 遍历 DOM 找出可交互元素。hashDomElement 用三层哈希（分支路径 + 属性 + XPath）给每个元素一个唯一指纹。一个 30 行的迭代栈替代了递归的 DOM 遍历。

#Nanobrowser #源代码 #可点击元素 #DOM 遍历 #哈希去重 #爬虫

阅读全文

技术指南2026年4月9日5 分钟阅读亿牛云技术团队

Nanobrowser 源代码解析：Markdown 提取与 Readability——采集页面的两种管线

getMarkdownContent 用 turndown 把 DOM 转成 Markdown。getReadabilityContent 用 Mozilla Readability 提取文章正文。两条管线在 service.ts 里只有 40 行，但背后的设计取舍值得爬虫开发者了解。

#Nanobrowser #源代码 #Markdown #Readability #DOM 提取 #爬虫

阅读全文

技术指南2026年4月9日5 分钟阅读亿牛云技术团队

指纹浏览器入门：爬虫为什么总被人机检测拦住？

理解浏览器指纹与反爬检测的原理，看清不同伪装方案的本质区别。

#指纹浏览器 #反爬虫 #浏览器指纹 #CloakBrowser

阅读全文

技术指南2026年4月8日4 分钟阅读亿牛云技术团队

Chrome 浏览器多实例隔离（一）：Session 劫持、配置冲突与内存污染

两个智能体同时跑，一个在填表单，另一个突然接管了前者的标签页。这不是假设——agent-browser 的 Issue #326 描述了完全相同的场景。

#多智能体 #Session 劫持 #CDP #浏览器隔离 #并发冲突

阅读全文

技术指南2026年4月7日5 分钟阅读亿牛云技术团队

浏览器反检测技术（三）：一致性胜过一切——为什么稳定环境比频繁轮换更有效

一个 IP 看起来合理，一个浏览器配置文件看起来正常，代码运行也没有报错——但三个信号放在一起对不上。检测系统的核心工作就是发现这种不一致。

#一致性 #指纹管理 #IP 稳定 #长期会话 #反检测策略

阅读全文

技术指南2026年4月6日5 分钟阅读亿牛云技术团队

浏览器反检测技术（二）：GPU 管线、按键熵与 Client Hints

navigator.webdriver 检测在 2018 年就已经被攻破了。2026 年的反检测系统看你的是鼠标移动熵、键盘停留时间方差、Canvas 渲染的亚像素偏移。

#输入熵 #GPU 渲染 #Client Hints #CDP 检测 #应用层反检测

阅读全文

技术指南2026年4月5日6 分钟阅读亿牛云技术团队

浏览器反检测技术（一）：TLS 握手与 HTTP/2 帧——在 JS 执行之前你已被识别

CamoFox 的 C++ 引擎级伪装解决了 JS 层的检测，但它管不了传输层。TLS 握手在浏览器发出第一个请求之前就已经暴露了你是脚本还是人类。

#反检测 #TLS 指纹 #JA3 #HTTP/2 #传输层检测

阅读全文

技术指南2026年4月4日5 分钟阅读亿牛云技术团队

Chrome 无头浏览器规模化（三）：Kubernetes HPA 为什么管不了浏览器

基于 CPU 的 HPA 在浏览器实例面前基本失效。启动过程中 CPU 打满但不代表它能服务。关掉后内存不会立刻释放。浏览器不是无状态服务。

#Kubernetes #HPA #浏览器集群 #扩缩容 #规模化

阅读全文

技术指南2026年4月3日5 分钟阅读亿牛云技术团队

Chrome 无头浏览器规模化（二）：CDP 连接池耗尽与 Tab 累积

第 1 个标签页加载成功，第 2 和第 3 个全部超时。120 秒不够，1600 秒也不够。问题不在页面加载速度，而在连接池被占满。

#规模化 #连接池 #WebSocket #TCP 连接 #并发瓶颈

阅读全文

技术指南2026年4月2日5 分钟阅读亿牛云技术团队

Chrome 无头浏览器规模化（一）：孤儿进程与 24GB 内存泄漏的生产排查

杀不死的 Chrome 进程、堆积的僵尸进程、21 小时内涨到 24GB 虚拟内存的泄漏——规模化不是简单地把一个实例复制 1000 份。

#规模化 #Chrome 进程管理 #内存泄漏 #浏览器自动化 #生产环境

阅读全文

技术指南2026年3月9日4 分钟阅读亿牛云技术团队

Issue实战：Crawler logs are cut by day 的代理路由与健康评分修复

单问题聚焦的 Scrapy 工程实战教程。

#代理健康评分 #错误路由 #稳定通道

阅读全文

技术指南2026年3月9日4 分钟阅读亿牛云技术团队

Issue实战：Missing the Scrapy entry in Wikipedia in m 的代理路由与健康评分修复

单问题聚焦的 Scrapy 工程实战教程。

#代理健康评分 #错误路由 #稳定通道

阅读全文

技术指南2026年3月9日4 分钟阅读亿牛云技术团队

Issue实战：S3FilesStore can use a lot of memory 的代理路由与健康评分修复

单问题聚焦的 Scrapy 工程实战教程。

#代理健康评分 #错误路由 #稳定通道

阅读全文

技术指南2026年3月9日4 分钟阅读亿牛云技术团队

Issue实战：Scrapy needs to have sane defaults that do 的代理路由与健康评分修复

单问题聚焦的 Scrapy 工程实战教程。

#代理健康评分 #错误路由 #稳定通道

阅读全文

技术指南2026年3月9日4 分钟阅读亿牛云技术团队

Issue实战：Translating the docs 的代理路由与健康评分修复

单问题聚焦的 Scrapy 工程实战教程。

#代理健康评分 #错误路由 #稳定通道

阅读全文

技术指南2025年12月11日27 分钟阅读亿牛云技术团队

2025 年，AI 时代对代理稳定性的新要求

AI 数据采集对代理稳定性提出了远超传统场景的要求：高并发、高成功率、低延迟。2025 年我们全面拥抱这个变化。

#AI 代理 #高并发代理 #数据采集 #代理稳定性 #企业代理

阅读全文

技术指南2024年7月30日21 分钟阅读亿牛云技术团队

2024 年，主动质量监控如何驱动稳定性

主动监控 vs 被动报障：2024 年我们建立的可观测性体系如何让代理稳定性迈上新台阶。

#代理监控 #可观测性 #质量监控 #代理稳定性 #企业代理

阅读全文

技术指南2023年2月18日25 分钟阅读亿牛云技术团队

2023 年，API 调度效率如何影响代理稳定性

API 调度对稳定性有什么影响？2023 年新版本上线后，响应时间成为衡量代理质量的关键指标。

#API 调度 #代理响应时间 #接入效率 #代理稳定性 #企业代理

阅读全文

技术指南2022年9月4日23 分钟阅读亿牛云技术团队

2022 年，不同类型代理的稳定性分层标准

住宅代理、数据中心代理、静态代理——不同类型代理的稳定性标准不同，选对类型比选对服务商更重要。

#住宅代理 #数据中心代理 #代理类型 #代理稳定性 #企业代理

阅读全文

技术指南2021年6月29日24 分钟阅读亿牛云技术团队

2021 年，跨境代理的延迟与稳定性平衡

2021 年全球节点部署：跨境场景下如何在延迟和稳定性之间取得平衡。

#跨境代理 #全球节点 #延迟优化 #海外代理 #企业代理

阅读全文

技术指南2020年11月15日19 分钟阅读亿牛云技术团队

2020 年，单点故障是稳定性的最大敌人

2020 年引入智能负载均衡和故障自动切换：为什么单点故障是稳定性的最大敌人，高可用架构怎么设计。

#HTTP 代理 #高可用 #负载均衡 #故障切换 #企业代理

阅读全文

技术指南2019年3月7日23 分钟阅读亿牛云技术团队

2019 年，从可用率 95% 到 99% 的跨越

可用率从 95% 到 99% 不只是数字变化，而是架构、流程和团队协作的系统性升级。

#HTTP 代理 #可用率 #SLA #代理产品 #企业代理

阅读全文

技术指南2018年8月23日16 分钟阅读亿牛云技术团队

2018 年，HTTP 与 SOCKS5 协议如何影响代理稳定性

HTTP 代理和 SOCKS5 代理在稳定性上有什么区别？2018 年我们深入研究了两种协议在代理场景下的真实表现。

#HTTP 代理 #SOCKS5 #协议对比 #代理稳定性 #企业代理

阅读全文

技术指南2017年5月12日19 分钟阅读亿牛云技术团队

2017 年，做稳定 HTTP 代理这件事

2017 年代理市场初探：什么是连通率、为什么代理会不稳定、以及我们在这一年选择了更难走的路。

#HTTP 代理 #代理稳定性 #连通率 #代理服务 #企业代理

阅读全文