LogoLexBench
  • 排行榜
  • Data
  • Agent
  • 功能
  • 联系我们
Agent 介绍

Agent 介绍

了解 LexBench 平台支持的浏览器智能体,查看配置说明和接入指南

Agent-TARS

v1.0
ByteDance·AvailableMultimodal

字节跳动开源的多模态浏览器智能体,支持复杂的网页交互任务

核心能力

Multimodal understanding
Complex web interactions
Visual element recognition
Auto screenshot analysis

支持的 Data

LexBench-BrowserOnline-Mind2WebBrowseComp

browser-use

v0.1
Community·AvailableAutomation

轻量级浏览器自动化 Agent,易于集成和扩展

核心能力

Lightweight design
Fast response
Easy to extend
Low resource usage

支持的 Data

LexBench-BrowserOnline-Mind2Web

Skyvern

v1.0
Skyvern AI·AvailableAutomation

基于计算机视觉的浏览器自动化 Agent,对 UI 变化具有强鲁棒性

核心能力

Computer vision-based
Robust to UI changes
Multi-step workflows
Enterprise-ready

支持的 Data

LexBench-Browser

SeeClick

v1.0
Community·AvailableMultimodal

视觉-语言多模态 GUI 模型,支持屏幕理解和点击预测

核心能力

Vision-language model
GUI grounding
Click prediction
Screen understanding

支持的 Data

LexBench-Browser

如何接入新 Agent

按照以下步骤将您的 Agent 接入 LexBench 平台

1
实现接口

实现 LexBench 定义的 Agent 接口规范

2
添加配置

在 agents 目录下添加 Agent 配置文件

3
提交评测

运行评测脚本,提交评测结果

Quick Start
# Run Agent-TARS evaluation
python scripts/run.py \
  --agent Agent-TARS \
  --data LexBench-Browser \
  --split no_login \
  --mode first_n \
  --count 10

# Run browser-use evaluation
python scripts/run.py \
  --agent browser-use \
  --data LexBench-Browser \
  --split no_login \
  --mode first_n \
  --count 10
LogoLexBench

专业的 AI Agent 评测平台

GitHubGitHubTwitterX (Twitter)BlueskyBlueskyMastodonDiscordYouTubeYouTubeLinkedInEmail
评测
  • 排行榜
  • Data
  • Agent
资源
  • 博客
  • 文档
  • 更新日志
  • 路线图
公司
  • 关于我们
  • 联系我们
  • 邮件列表
法律
  • Cookie政策
  • 隐私政策
  • 服务条款
© 2026 LexBench All Rights Reserved.