Skip to content

Browser

域名:browser

浏览器控制与 DOM 交互主域,也是大多数工作流的入口。

Profile

  • workflow
  • full

典型场景

  • 页面导航
  • DOM 操作与截图
  • 多标签页与本地存储读取

常见组合

  • browser + network
  • browser + hooks
  • browser + workflow

代表工具

  • get_detailed_data — 根据 detailId 获取完整详细数据。
  • browser_attach — 通过 Chrome DevTools Protocol(CDP)附加到现有浏览器实例。
  • browser_list_tabs — 列出当前已连接浏览器中的所有标签页或页面。
  • browser_select_tab — 按索引或 URL/标题模式切换当前活动标签页。
  • browser_launch — 启动浏览器实例。
  • browser_close — 关闭当前浏览器实例。
  • browser_status — 获取浏览器当前状态,包括运行情况、页面数量与版本信息。
  • page_navigate — 导航到指定 URL。
  • page_reload — 重新加载当前页面。
  • page_back — 在浏览历史中后退。

工具清单(63)

工具说明
get_detailed_data根据 detailId 获取完整详细数据。
browser_attach通过 Chrome DevTools Protocol(CDP)附加到现有浏览器实例。
browser_list_tabs列出当前已连接浏览器中的所有标签页或页面。
browser_select_tab按索引或 URL/标题模式切换当前活动标签页。
browser_launch启动浏览器实例。
browser_close关闭当前浏览器实例。
browser_status获取浏览器当前状态,包括运行情况、页面数量与版本信息。
page_navigate导航到指定 URL。
page_reload重新加载当前页面。
page_back在浏览历史中后退。
page_forward在浏览历史中前进。
dom_query_selector查询单个 DOM 元素,适合在点击前确认元素是否存在。
dom_query_all查询所有匹配选择器的 DOM 元素。
dom_get_structure获取页面 DOM 结构,便于理解页面布局与层级。
dom_find_clickable查找页面中所有可点击元素,如按钮与链接。
page_click点击指定元素,建议先用 dom_query_selector 确认元素存在。
page_type在输入元素中输入文本。
page_select在 <select> 元素中选择一个或多个选项。
page_hover将鼠标悬停到指定元素上。
page_scroll滚动当前页面。
page_wait_for_selector等待指定元素出现。
page_evaluate在页面上下文中执行 JavaScript 代码并返回结果。
page_screenshot截取页面或指定 DOM 元素的截图。
get_all_scripts获取页面中所有已加载脚本的列表。
get_script_source获取指定脚本的源代码。
console_enable启用控制台监控,以捕获 console.log、console.error 等输出。
console_get_logs获取已捕获的控制台日志。
console_execute在控制台上下文中执行 JavaScript 表达式。
dom_get_computed_style获取指定元素的计算后 CSS 样式。
dom_find_by_text按文本内容查找元素,适合定位动态内容。
dom_get_xpath获取指定元素的 XPath。
dom_is_in_viewport检查元素当前是否位于可视区域内。
page_get_performance获取页面性能指标,如加载与网络耗时。
page_inject_script向当前页面注入 JavaScript 代码。
page_set_cookies为当前页面设置 Cookie。
page_get_cookies获取当前页面的全部 Cookie。
page_clear_cookies清除当前页面的全部 Cookie。
page_set_viewport设置浏览器视口尺寸。
page_emulate_device模拟移动设备环境,如 iPhone、iPad 或 Android。
page_get_local_storage获取当前页面的全部 localStorage 项。
page_set_local_storage设置指定 localStorage 项。
page_press_key触发一次键盘按键操作,如 Enter、Escape 或 ArrowDown。
page_get_all_links获取当前页面中的全部链接。
captcha_detect使用 AI 视觉分析检测当前页面上的 CAPTCHA。
captcha_wait等待用户手动完成 CAPTCHA 验证。
captcha_config配置 CAPTCHA 检测相关行为。
stealth_inject注入现代化 stealth 脚本,以降低被反爬或反自动化检测的概率。
stealth_set_user_agent为目标平台设置更真实的 User-Agent 与浏览器指纹。
stealth_configure_jitter配置 CDP 命令时序抖动,在每个 CDP send() 调用间注入随机延迟以防止基于时序的自动化检测。
stealth_generate_fingerprint生成真实的浏览器指纹配置文件,使用 fingerprint-generator 创建一致的浏览器特征集,自动缓存到当前会话。
stealth_verify运行离线反检测审计,检查 10 项隐身指标并返回 0-100 分的评分与修复建议。
camoufox_server_launch启动 Camoufox WebSocket 服务器,用于多进程或远程连接。
camoufox_server_close关闭 Camoufox WebSocket 服务器,并断开所有已连接客户端。
camoufox_server_status获取 Camoufox WebSocket 服务器的当前状态。
framework_state_extract提取当前页面中 React/Vue/Svelte/Solid/Preact 组件状态,同时检测 Next.js/Nuxt 元框架元数据(路由、构建信息),便于调试和逆向分析 SPA 应用。
indexeddb_dump导出所有 IndexedDB 数据库及其内容,便于分析 PWA 数据、令牌或离线状态。
js_heap_search在浏览器 JavaScript 堆中检索匹配模式的字符串值,用于定位令牌、密钥、签名等内存数据。
tab_workflow为多页面自动化流程提供跨标签页协调与共享上下文能力。
human_mouse以拟人化方式移动鼠标,模拟自然轨迹与随机抖动。
human_scroll以拟人化方式滚动页面,模拟变速、微停顿与减速效果。
human_typing以拟人化方式输入文本,模拟变速、偶发输入错误与自动修正。
captcha_vision_solve使用外部打码服务或 AI 视觉能力尝试自动完成 CAPTCHA。
widget_challenge_solve处理并尝试完成嵌入式组件类验证挑战。

Released under AGPL-3.0-only