Browser

域名：browser

浏览器控制与 DOM 交互主域，也是大多数工作流的入口。

Profile

workflow
full

典型场景

页面导航
DOM 操作与截图
多标签页与本地存储读取

常见组合

browser + network
browser + hooks
browser + workflow

工具清单（63）

工具	说明
`get_detailed_data`	获取之前因数据量过大而被截断的完整内容。
`browser_attach`	通过 CDP 连接到一个正在运行的浏览器。
`browser_list_tabs`	列出浏览器中所有打开的标签页。
`browser_list_cdp_targets`	列出当前已连接浏览器目标可见的所有 CDP 目标。
`browser_select_tab`	切换到指定的标签页，可按索引、URL 或标题模式匹配。
`browser_attach_cdp_target`	连接到浏览器中的特定目标，如某个 iframe 或 Worker。
`browser_detach_cdp_target`	断开当前已附加的底层 CDP 目标会话，并将 network/hooks 恢复为常规页面绑定。
`browser_evaluate_cdp_target`	在当前已附加的 CDP 目标会话中执行 JavaScript。
`browser_launch`	启动浏览器。
`browser_close`	关闭浏览器。
`browser_status`	查看浏览器状态：是否运行中、打开了几个标签页、版本号。
`page_navigate`	跳转到指定 URL。
`page_reload`	重新加载当前页面。
`page_back`	后退到上一个页面。
`page_forward`	前进到下一个页面。
`page_list_frames`	列出页面中所有框架（iframe），返回 frameId、父框架、跨域标记等元数据。
`page_click`	点击页面上的元素。
`page_type`	在输入框中输入文字。
`page_upload_files`	向 <input type="file"> 元素上传一个或多个本地文件。
`page_select`	在 <select> 下拉菜单中选择选项。
`page_hover`	将鼠标移到元素上方。
`page_scroll`	滚动页面。
`page_wait_for_selector`	等待某个元素出现。
`page_evaluate`	在页面上下文中执行 JavaScript 代码并返回结果。
`page_screenshot`	截取页面或指定 DOM 元素的截图。
`get_all_scripts`	列出页面中加载的所有脚本。
`get_script_source`	查看某个脚本的源代码。
`console_monitor`	启用或禁用控制台监控，捕获 console.log、console.error 等输出。
`console_get_logs`	获取当前页面已捕获的控制台日志输出。
`console_execute`	在控制台中执行 JavaScript 表达式。
`page_inject_script`	向页面注入 JavaScript 代码。
`page_cookies`	管理页面 Cookie。操作：get（获取全部）、set（需提供 cookies 数组）、clear（清除全部）。
`page_set_viewport`	设置当前页面视口尺寸。
`page_emulate_device`	模拟移动设备环境，例如 iPhone、iPad 或 Android 机型。
`page_local_storage`	管理 localStorage。操作：get（获取全部项）、set（需提供 key 和 value）。
`page_press_key`	模拟按下键盘按键，如 Enter、Escape 或 ArrowDown。
`captcha_detect`	使用 AI 视觉分析检测页面上是否有 CAPTCHA 验证码。
`captcha_wait`	等待用户手动完成 CAPTCHA 验证码。
`captcha_config`	配置 CAPTCHA 验证码的检测和自动处理行为。
`stealth_inject`	注入反检测脚本，降低被网站识别为自动化的概率。
`stealth_set_user_agent`	设置更真实的 User-Agent 与浏览器指纹信息。
`stealth_configure_jitter`	配置 CDP 命令时序抖动，在每个 CDP send() 调用间注入随机延迟以防止基于时序的自动化检测。
`stealth_generate_fingerprint`	生成逼真的浏览器指纹，包括屏幕、WebGL、navigator、字体等。
`stealth_verify`	运行反检测审计，检查多项隐身指标并返回 0-100 分及修复建议。
`camoufox_geolocation`	根据 locale 获取地理定位数据（经纬度、精度），可选通过代理查询公网 IP。需要 camoufox-js。
`camoufox_server`	管理 Camoufox WebSocket 服务器。先启动服务器，再通过 browser_launch 连接。
`framework_state_extract`	提取页面中 React/Vue/Svelte/Solid/Preact 组件状态，并检测 Next.js/Nuxt 等元框架的路由和构建信息，用于调试或逆向分析 SPA 应用。
`indexeddb_dump`	导出所有 IndexedDB 数据库及其内容，便于分析 PWA 数据、令牌或离线状态。
`js_heap_search`	在浏览器 JavaScript 堆中检索匹配模式的字符串值，用于定位 token、密钥、签名等敏感数据。
`tab_workflow`	多标签页协同操作，支持跨标签页传递数据。
`browser_codegen_start`	开始录制浏览器操作，将页面交互转化为可回放的步骤序列。
`browser_codegen_stop`	停止录制浏览器操作，返回经过清洗和合并的可回放步骤列表。
`human_mouse`	模拟真人移动鼠标，带随机轨迹和抖动。
`human_scroll`	模拟真人滚动页面，带变速和停顿。
`human_typing`	模拟真人打字，带变速和偶尔打错再修正。
`captcha_solver_capabilities`	查看当前 CAPTCHA 求解方式是否可用。
`captcha_vision_solve`	用手动流程或已配置的外部服务处理验证码。
`widget_challenge_solve`	用 hook、手动或已配置的外部服务处理部件验证。
`browser_jsdom_parse`	在内存中解析 HTML（无需启动浏览器），供其他 JSDOM 工具使用。
`browser_jsdom_query`	在 JSDOM 会话中执行 CSS 选择器查询，返回匹配元素的属性、文本及可选的 HTML 或源码位置信息。
`browser_jsdom_execute`	在 JSDOM 会话中执行 JavaScript，控制台输出会被捕获并返回。
`browser_jsdom_serialize`	将 JSDOM 会话序列化为 HTML。支持完整文档输出或 CSS 选择器片段输出，可选美化格式。
`browser_jsdom_cookies`	管理 JSDOM 会话的 Cookie。操作：get（列出）、set（添加）、clear（全部清除）。

Browser ​

Profile ​

典型场景 ​

常见组合 ​

工具清单（63） ​

Browser

Profile

典型场景

常见组合

工具清单（63）