Browser
域名:browser
浏览器控制与 DOM 交互主域,也是大多数工作流的入口。
Profile
- workflow
- full
典型场景
- 页面导航
- DOM 操作与截图
- 多标签页与本地存储读取
常见组合
- browser + network
- browser + hooks
- browser + workflow
代表工具
get_detailed_data— 根据 detailId 获取完整详细数据。browser_attach— 通过 Chrome DevTools Protocol(CDP)附加到现有浏览器实例。browser_list_tabs— 列出当前已连接浏览器中的所有标签页或页面。browser_select_tab— 按索引或 URL/标题模式切换当前活动标签页。browser_launch— 启动浏览器实例。browser_close— 关闭当前浏览器实例。browser_status— 获取浏览器当前状态,包括运行情况、页面数量与版本信息。page_navigate— 导航到指定 URL。page_reload— 重新加载当前页面。page_back— 在浏览历史中后退。
工具清单(63)
| 工具 | 说明 |
|---|---|
get_detailed_data | 根据 detailId 获取完整详细数据。 |
browser_attach | 通过 Chrome DevTools Protocol(CDP)附加到现有浏览器实例。 |
browser_list_tabs | 列出当前已连接浏览器中的所有标签页或页面。 |
browser_select_tab | 按索引或 URL/标题模式切换当前活动标签页。 |
browser_launch | 启动浏览器实例。 |
browser_close | 关闭当前浏览器实例。 |
browser_status | 获取浏览器当前状态,包括运行情况、页面数量与版本信息。 |
page_navigate | 导航到指定 URL。 |
page_reload | 重新加载当前页面。 |
page_back | 在浏览历史中后退。 |
page_forward | 在浏览历史中前进。 |
dom_query_selector | 查询单个 DOM 元素,适合在点击前确认元素是否存在。 |
dom_query_all | 查询所有匹配选择器的 DOM 元素。 |
dom_get_structure | 获取页面 DOM 结构,便于理解页面布局与层级。 |
dom_find_clickable | 查找页面中所有可点击元素,如按钮与链接。 |
page_click | 点击指定元素,建议先用 dom_query_selector 确认元素存在。 |
page_type | 在输入元素中输入文本。 |
page_select | 在 <select> 元素中选择一个或多个选项。 |
page_hover | 将鼠标悬停到指定元素上。 |
page_scroll | 滚动当前页面。 |
page_wait_for_selector | 等待指定元素出现。 |
page_evaluate | 在页面上下文中执行 JavaScript 代码并返回结果。 |
page_screenshot | 截取页面或指定 DOM 元素的截图。 |
get_all_scripts | 获取页面中所有已加载脚本的列表。 |
get_script_source | 获取指定脚本的源代码。 |
console_enable | 启用控制台监控,以捕获 console.log、console.error 等输出。 |
console_get_logs | 获取已捕获的控制台日志。 |
console_execute | 在控制台上下文中执行 JavaScript 表达式。 |
dom_get_computed_style | 获取指定元素的计算后 CSS 样式。 |
dom_find_by_text | 按文本内容查找元素,适合定位动态内容。 |
dom_get_xpath | 获取指定元素的 XPath。 |
dom_is_in_viewport | 检查元素当前是否位于可视区域内。 |
page_get_performance | 获取页面性能指标,如加载与网络耗时。 |
page_inject_script | 向当前页面注入 JavaScript 代码。 |
page_set_cookies | 为当前页面设置 Cookie。 |
page_get_cookies | 获取当前页面的全部 Cookie。 |
page_clear_cookies | 清除当前页面的全部 Cookie。 |
page_set_viewport | 设置浏览器视口尺寸。 |
page_emulate_device | 模拟移动设备环境,如 iPhone、iPad 或 Android。 |
page_get_local_storage | 获取当前页面的全部 localStorage 项。 |
page_set_local_storage | 设置指定 localStorage 项。 |
page_press_key | 触发一次键盘按键操作,如 Enter、Escape 或 ArrowDown。 |
page_get_all_links | 获取当前页面中的全部链接。 |
captcha_detect | 使用 AI 视觉分析检测当前页面上的 CAPTCHA。 |
captcha_wait | 等待用户手动完成 CAPTCHA 验证。 |
captcha_config | 配置 CAPTCHA 检测相关行为。 |
stealth_inject | 注入现代化 stealth 脚本,以降低被反爬或反自动化检测的概率。 |
stealth_set_user_agent | 为目标平台设置更真实的 User-Agent 与浏览器指纹。 |
stealth_configure_jitter | 配置 CDP 命令时序抖动,在每个 CDP send() 调用间注入随机延迟以防止基于时序的自动化检测。 |
stealth_generate_fingerprint | 生成真实的浏览器指纹配置文件,使用 fingerprint-generator 创建一致的浏览器特征集,自动缓存到当前会话。 |
stealth_verify | 运行离线反检测审计,检查 10 项隐身指标并返回 0-100 分的评分与修复建议。 |
camoufox_server_launch | 启动 Camoufox WebSocket 服务器,用于多进程或远程连接。 |
camoufox_server_close | 关闭 Camoufox WebSocket 服务器,并断开所有已连接客户端。 |
camoufox_server_status | 获取 Camoufox WebSocket 服务器的当前状态。 |
framework_state_extract | 提取当前页面中 React/Vue/Svelte/Solid/Preact 组件状态,同时检测 Next.js/Nuxt 元框架元数据(路由、构建信息),便于调试和逆向分析 SPA 应用。 |
indexeddb_dump | 导出所有 IndexedDB 数据库及其内容,便于分析 PWA 数据、令牌或离线状态。 |
js_heap_search | 在浏览器 JavaScript 堆中检索匹配模式的字符串值,用于定位令牌、密钥、签名等内存数据。 |
tab_workflow | 为多页面自动化流程提供跨标签页协调与共享上下文能力。 |
human_mouse | 以拟人化方式移动鼠标,模拟自然轨迹与随机抖动。 |
human_scroll | 以拟人化方式滚动页面,模拟变速、微停顿与减速效果。 |
human_typing | 以拟人化方式输入文本,模拟变速、偶发输入错误与自动修正。 |
captcha_vision_solve | 使用外部打码服务或 AI 视觉能力尝试自动完成 CAPTCHA。 |
widget_challenge_solve | 处理并尝试完成嵌入式组件类验证挑战。 |