如果你最近在看 AI Agent,应该会发现一个很现实的问题:
现在“自称是 Agent”的产品太多了,但真正值得持续关注的,其实没那么多。
有些只是把聊天界面换了个名字。
有些能回答问题,但不太能真的把任务接过去。
也有些虽然很强,但离普通用户还很远。
所以这篇文章,我不想做那种“把所有热门词都堆进去”的榜单,而是想给你一个更实际的版本:
截至 2026 年 5 月 5 日,现在最值得关注的 AI Agent,到底是哪些?
先说明一下这份榜单的标准。
我这次主要看 5 件事:
- 产品完成度
- 任务执行能力
- 当前可用性
- 生态和工作流扩展能力
- 2026 年 4 月到 5 月之间的公开更新热度
也就是说,这不是“模型智商排行榜”,而是更偏现在谁更像一个真正能用的 Agent 产品。
第 1 名:OpenAI Codex
如果只看 2026 年 5 月 这个时间点,我会把第一名给 Codex。
原因很简单:它现在已经不只是“写代码工具”,而是一个越来越完整的 任务执行平台。
OpenAI 在 2026 年 4 月 16 日发布的 Codex for (almost) everything 里,已经把 Codex 的定位拉得非常明确:
- 可以操作电脑
- 可以并行运行多个 agent
- 可以使用浏览器
- 可以生成图片
- 可以记忆偏好
- 可以承担持续性和重复性工作
再往前看,OpenAI 在 2026 年 2 月 2 日发布 Introducing the Codex app 时,就已经把它定义成一个 command center for agents。
为什么它排第一?
- 产品方向最完整
- 多 agent 和长任务能力已经成形
- 工具链整合速度非常快
- 2026 年春季的更新节奏明显领先
如果今天你想看“AI Agent 下一阶段长什么样”,Codex 基本是绕不过去的。
第 2 名:Anthropic Claude Code
如果说 Codex 是“Agent 平台化”最明显的代表,那 Claude Code 依然是目前最强势的 终端原生 Agent 之一。
Anthropic 官方文档把它定义得很直接:
Claude Code overview
Claude Code 能做的事包括:
- 从描述直接构建功能
- 分析 bug 并修复
- 理解整个代码库
- 直接编辑文件、运行命令、创建提交
- 通过 MCP 接更多外部数据源和工具
它的优势不一定在“界面最完整”,而在于:
- 很贴近开发者原本的工作方式
- 在终端里就能完成大量动作
- 组合性强
- 和 MCP 生态天然贴合
为什么不是第一?
因为站在 2026 年 5 月这个时间点,Codex 在“多 agent、桌面能力、浏览器能力、持续任务和产品扩展性”上已经拉得更开。
但如果你问“现在最能打的 coding agent 之一是谁”,Claude Code 仍然一定在前排。
第 3 名:ChatGPT Workspace Agents
这个产品很新,但我还是把它排进前三。
OpenAI 在 2026 年 4 月 22 日发布 Introducing workspace agents in ChatGPT 时,给出的信号非常强:
- 这是 GPTs 的进化版
- 由 Codex 驱动
- 面向团队
- 可在云端持续运行
- 可接 Slack 和更多工具
- 可共享、可治理、可设置权限边界
为什么它排名这么高?
因为它代表的是另一条非常重要的趋势:
AI Agent 正在从个人工具,走向团队执行层。
这和传统“我自己开一个助手”完全不一样。
它更像是:
- 团队共同使用的 Agent
- 能处理长流程工作
- 能跨工具协同
- 能被组织内复用
如果 2025 年大家还在谈“个人 AI 助手”,那 2026 年的一个明显变化,就是“组织级 Agent”开始成型了。
第 4 名:Devin
Devin 现在已经不只是一个“概念证明产品”了,而是持续在往产品化和企业化推进。
Cognition 官方站点和最近公开动态能看到几条很清晰的线:
- Devin 2.2
- Schedule Devins
- Manage Devins
- Devin for Terminal
- 新 self-serve plans
参考:
Devin 的核心吸引力还是很鲜明:
- 云端异步执行
- 更像“AI 软件工程师”而不是普通代码助手
- 任务可以持续推进
- 正在往多 agent 和更强管理能力演进
为什么我把它放在第 4,而不是更高?
不是因为它不强,而是因为 2026 年春天这一波,OpenAI 和 Anthropic 的产品扩张速度更快、覆盖面更广。
但 Devin 依然是整个 Agent 赛道里最值得持续盯着的核心选手之一。
第 5 名:Google Jules
Jules 是我觉得很多人低估了,但其实非常值得关注的一个产品。
Google 在 2025 年 5 月 20 日就已经把 Jules public beta 推出来了,而最近的官方更新更关键:
- Jules 结束公测,开始全面可用
- 现在由 Gemini 2.5 驱动
- 支持复用之前的 setup
- 支持 GitHub issues integration
- 面向异步 coding workflows
它的特点很明确:
- 异步
- 云端安全 VM
- 直接围绕代码仓库工作
- 做完后给计划、推理和 diff
Jules 之所以排到第 5,不是因为它弱,而是因为它更聚焦在 异步 coding agent 这个子赛道。
如果你本身就在 Google / Gemini 生态里,Jules 反而可能是非常值得试的一条线。
第 6 名:Manus
如果你希望找的是“不是只给开发者用”的通用型 AI Agent,那 Manus 仍然值得上榜。
Manus 官方自己的定位很直白:
它强调的是:
- general AI agent
- complete tasks and deliver results
- secure sandbox
- browser + file system + shell
- 长任务上下文持续
而且 Manus 这段时间也在持续补能力:
- Slack integration
- Agent Skills
- My Computer / Desktop
- 浏览器和工作流能力扩展
参考:
为什么只排第 6?
因为它的覆盖面很广,但从当前公开产品成熟度和生态稳定性来看,前面几个在“开发工作流落地”上更清晰。
不过如果你想看“通用型 Agent 怎么走向大众使用”,Manus 仍然非常值得关注。
第 7 名:Project Mariner
严格说,Project Mariner 还带着明显的“研究原型”气质。
但我还是把它放进榜单,因为它在 浏览器任务 Agent 这个方向上的代表性太强了。
Google 官方帮助文档里对它的描述已经很具体:
截至目前,公开能确认的点包括:
- 最多可同时自动化 10 个任务
- 在虚拟机里跑浏览器任务
- 可以暂停、恢复、取消
- 可以通过录屏“教”它做任务
- 当前仍是 research prototype
它为什么能进榜?
因为它代表的是另一条极有潜力的方向:
真正面向网页任务执行的浏览器 Agent。
如果 Google 把这条线继续做深,未来影响力不会小。
第 8 名:OpenHands
如果你更关心开源世界,那 OpenHands 仍然是必须提到的名字。
它不是这份榜单里最商业化的产品,但它在“开源 Agent 实用化”上很有代表性。
官方文档里能看到几个关键点:
它的价值主要在:
- 开源
- 可自托管
- 有 Docker / Local / Remote Runtime
- 更适合自己搭实验和定制
为什么它排第 8?
因为从“普通用户可直接上手”到“产品完成度”来看,它确实不如前面那几家完整。
但如果你在意开放性、可控性和自定义空间,OpenHands 依然是很重要的一条线。
这份榜单里,我最看好的三条主线
如果把整个榜单再往上收一层,我觉得 2026 年 5 月最值得持续关注的,其实是三条大趋势。
1. Agent 平台化
代表产品:
- Codex
- ChatGPT Workspace Agents
这条线的重点已经不是“单次对话”,而是:
- 长任务
- 多 agent
- 权限控制
- 企业工作流接入
2. Coding Agent 深化
代表产品:
- Claude Code
- Devin
- Jules
这条线比拼的已经不是“会不会写代码”,而是:
- 谁更能理解代码库
- 谁更能持续执行
- 谁更适合真实开发环境
3. 通用执行 Agent 扩展
代表产品:
- Manus
- Project Mariner
这条线更像是在探索:
- AI 能不能不仅帮开发者
- 还能帮更广泛的人做网页、办公、研究和流程任务
如果你现在才开始接触 AI Agent,我建议这样看
很多人一上来就想问:
- 哪个最强?
- 哪个最好?
- 哪个能完全替我工作?
但更实际的问法可能是:
如果你是开发者
优先看:
- Codex
- Claude Code
- Devin
- Jules
如果你是团队负责人 / 企业工作流方向
优先看:
- ChatGPT Workspace Agents
- Codex
- Devin
如果你更想要通用型任务执行
优先看:
- Manus
- Project Mariner
如果你更在意开源和可控性
优先看:
- OpenHands
也就是说,AI Agent 现在已经不太适合只用“一个总冠军”去理解了。
更重要的是看:你到底想把什么任务交给它。
结语
如果一定要用一句话总结 2026 年 5 月 的 AI Agent 格局,我会这么说:
这个赛道已经过了“只会聊天就能惊艳所有人”的阶段,真正开始进入“谁更能把任务做完”的比拼。
所以这份榜单里,排在前面的产品都有一个共同点:
- 不只是会回答
- 不只是会生成
- 而是越来越像真正的执行系统
这也是为什么我会把今天这份榜单的第一名给 Codex。
但从更长的时间看,Claude Code、Workspace Agents、Devin、Jules、Manus 这些产品,接下来几个月都还会持续很有看头。
如果你现在正准备认真跟一条 AI Agent 主线,这 8 个,基本都值得你至少看一遍。
参考资料
- OpenAI: Codex for (almost) everything
- OpenAI: Introducing the Codex app
- OpenAI: Introducing workspace agents in ChatGPT
- Anthropic: Claude Code overview
- Google: Jules public beta
- Google: Jules now available
- Google: How to use Project Mariner
- Google Workspace Admin: Project Mariner
- Cognition
- Devin Knowledge Base
- Manus Docs
- Manus About
- Manus Blog
- OpenHands Docs