Browser Use 是一个革命性的 AI 驱动浏览器自动化平台,其使命是"让 AI Agent 能够访问网站,轻松在线自动化任务"。该项目在 GitHub 上已获得 84,000+ 星标,是目前最热门的 AI 自动化项目之一。
平台的核心价值在于将大语言模型(LLM)与浏览器自动化无缝结合,用户只需用自然语言描述任务目标,AI 即可自动分析网页、执行操作、提取数据。Browser Use 支持多种 LLM 提供商(OpenAI、Google、Anthropic 等),并提供专为其优化的 Browser Use 2.0 模型,比通用模型快 6 倍、成本低 15 倍。

AI 驱动浏览器控制:使用大语言模型让 AI Agent 自动理解网页、点击元素、填写表单、导航页面。
多模型支持:支持 OpenAI、Google Gemini、Anthropic Claude 等主流 LLM,以及 Browser Use 自研的优化模型。
自然语言任务描述:用户用日常语言描述目标,如"在 Amazon 上找最便宜的 USB 数据线并加入购物车",AI 自动执行。
云端浏览器服务:Browser Use Cloud 提供隐身浏览器、代理轮换、验证码处理等企业级功能。
会话与状态管理:支持持久化登录状态、Cookie 管理,便于执行多步骤工作流程。
技能扩展系统:支持创建和安装自定义技能,增强 Agent 在特定场景下的能力。
MCP 与集成支持:支持 Model Context Protocol 服务器,提供 OpenClaw、n8n、Playwright 等官方集成。
网页数据采集:自动化抓取电商价格、新闻资讯、竞品信息等结构化数据。
表单自动填写:批量填写注册表单、订单信息、问卷调查等重复性工作。
业务流程自动化:自动化执行跨系统的业务流程,如订单处理、数据同步。
测试与监控:自动化 Web 应用测试、网站可用性监控、页面变化检测。
个人助理任务:如自动订票、比价购物、信息订阅等日常任务自动化。
uv init && uv add browser-use && uv sync
playwright installfrom browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser()
agent = Agent(
task="查找 browser-use 仓库的星标数量",
llm=ChatBrowserUse(),
browser=browser,
)
await agent.run()
asyncio.run(main())browser-use open https://example.com # 导航到 URL
browser-use state # 查看可点击元素
browser-use click 5 # 按索引点击元素
browser-use screenshot page.png # 截图访问官网:前往 https://browser-use.com/ 注册账号。
获取 API Key:在控制台创建 API 密钥用于调用云端服务。
配置模型:选择 Browser Use 2.0 或其他支持的模型。
发送任务:通过 API 或 SDK 发送自然语言任务描述,获取结构化结果。
核心库:完全免费,MIT 开源许可。
自行部署:需自行准备服务器、代理等基础设施。
社区支持:通过 GitHub Issues 和 Discord 社区获取帮助。
AI 智能体任务:
浏览器会话:
技能费用:
代理服务:
开源版需自行部署和维护基础设施,适合深度定制场景;云端版提供托管服务,开箱即用,具备隐身、代理等企业级功能。
基础使用需要 Python 编程知识,但 CLI 工具支持简单的命令行操作。云端版提供更友好的无代码体验。
基于 Playwright 框架,支持 Chromium、Firefox、WebKit 等主流浏览器引擎。
云端版提供自动验证码处理、浏览器指纹伪装、住宅代理等反检测能力。
开源版数据完全自主可控;云端版提供企业级安全方案,支持零数据保留和 HIPAA 合规。













