2026 年 5 月 AI Agent 排行榜：这 8 个产品，最值得关注

如果你最近在看 AI Agent，应该会发现一个很现实的问题：

现在“自称是 Agent”的产品太多了，但真正值得持续关注的，其实没那么多。

有些只是把聊天界面换了个名字。
有些能回答问题，但不太能真的把任务接过去。
也有些虽然很强，但离普通用户还很远。

所以这篇文章，我不想做那种“把所有热门词都堆进去”的榜单，而是想给你一个更实际的版本：

截至 2026 年 5 月 5 日，现在最值得关注的 AI Agent，到底是哪些？

先说明一下这份榜单的标准。

我这次主要看 5 件事：

产品完成度
任务执行能力
当前可用性
生态和工作流扩展能力
2026 年 4 月到 5 月之间的公开更新热度

也就是说，这不是“模型智商排行榜”，而是更偏现在谁更像一个真正能用的 Agent 产品。

第 1 名：OpenAI Codex#

如果只看 2026 年 5 月 这个时间点，我会把第一名给 Codex。

原因很简单：它现在已经不只是“写代码工具”，而是一个越来越完整的 任务执行平台。

OpenAI 在 2026 年 4 月 16 日发布的 Codex for (almost) everything 里，已经把 Codex 的定位拉得非常明确：

可以操作电脑
可以并行运行多个 agent
可以使用浏览器
可以生成图片
可以记忆偏好
可以承担持续性和重复性工作

再往前看，OpenAI 在 2026 年 2 月 2 日发布 Introducing the Codex app 时，就已经把它定义成一个 command center for agents。

为什么它排第一？

产品方向最完整
多 agent 和长任务能力已经成形
工具链整合速度非常快
2026 年春季的更新节奏明显领先

如果今天你想看“AI Agent 下一阶段长什么样”，Codex 基本是绕不过去的。

第 2 名：Anthropic Claude Code#

如果说 Codex 是“Agent 平台化”最明显的代表，那 Claude Code 依然是目前最强势的 终端原生 Agent 之一。

Anthropic 官方文档把它定义得很直接：
Claude Code overview

Claude Code 能做的事包括：

从描述直接构建功能
分析 bug 并修复
理解整个代码库
直接编辑文件、运行命令、创建提交
通过 MCP 接更多外部数据源和工具

它的优势不一定在“界面最完整”，而在于：

很贴近开发者原本的工作方式
在终端里就能完成大量动作
组合性强
和 MCP 生态天然贴合

为什么不是第一？

因为站在 2026 年 5 月这个时间点，Codex 在“多 agent、桌面能力、浏览器能力、持续任务和产品扩展性”上已经拉得更开。
但如果你问“现在最能打的 coding agent 之一是谁”，Claude Code 仍然一定在前排。

第 3 名：ChatGPT Workspace Agents#

这个产品很新，但我还是把它排进前三。

OpenAI 在 2026 年 4 月 22 日发布 Introducing workspace agents in ChatGPT 时，给出的信号非常强：

这是 GPTs 的进化版
由 Codex 驱动
面向团队
可在云端持续运行
可接 Slack 和更多工具
可共享、可治理、可设置权限边界

为什么它排名这么高？

因为它代表的是另一条非常重要的趋势：

AI Agent 正在从个人工具，走向团队执行层。

这和传统“我自己开一个助手”完全不一样。
它更像是：

团队共同使用的 Agent
能处理长流程工作
能跨工具协同
能被组织内复用

如果 2025 年大家还在谈“个人 AI 助手”，那 2026 年的一个明显变化，就是“组织级 Agent”开始成型了。

第 4 名：Devin#

Devin 现在已经不只是一个“概念证明产品”了，而是持续在往产品化和企业化推进。

Cognition 官方站点和最近公开动态能看到几条很清晰的线：

Devin 2.2
Schedule Devins
Manage Devins
Devin for Terminal
新 self-serve plans

参考：

Devin 的核心吸引力还是很鲜明：

云端异步执行
更像“AI 软件工程师”而不是普通代码助手
任务可以持续推进
正在往多 agent 和更强管理能力演进

为什么我把它放在第 4，而不是更高？

不是因为它不强，而是因为 2026 年春天这一波，OpenAI 和 Anthropic 的产品扩张速度更快、覆盖面更广。
但 Devin 依然是整个 Agent 赛道里最值得持续盯着的核心选手之一。

第 5 名：Google Jules#

Jules 是我觉得很多人低估了，但其实非常值得关注的一个产品。

Google 在 2025 年 5 月 20 日就已经把 Jules public beta 推出来了，而最近的官方更新更关键：

Jules 结束公测，开始全面可用
现在由 Gemini 2.5 驱动
支持复用之前的 setup
支持 GitHub issues integration
面向异步 coding workflows

它的特点很明确：

异步
云端安全 VM
直接围绕代码仓库工作
做完后给计划、推理和 diff

Jules 之所以排到第 5，不是因为它弱，而是因为它更聚焦在 异步 coding agent 这个子赛道。
如果你本身就在 Google / Gemini 生态里，Jules 反而可能是非常值得试的一条线。

第 6 名：Manus#

如果你希望找的是“不是只给开发者用”的通用型 AI Agent，那 Manus 仍然值得上榜。

Manus 官方自己的定位很直白：

它强调的是：

general AI agent
complete tasks and deliver results
secure sandbox
browser + file system + shell
长任务上下文持续

而且 Manus 这段时间也在持续补能力：

Slack integration
Agent Skills
My Computer / Desktop
浏览器和工作流能力扩展

参考：

为什么只排第 6？

因为它的覆盖面很广，但从当前公开产品成熟度和生态稳定性来看，前面几个在“开发工作流落地”上更清晰。
不过如果你想看“通用型 Agent 怎么走向大众使用”，Manus 仍然非常值得关注。

第 7 名：Project Mariner#

严格说，Project Mariner 还带着明显的“研究原型”气质。
但我还是把它放进榜单，因为它在 浏览器任务 Agent 这个方向上的代表性太强了。

Google 官方帮助文档里对它的描述已经很具体：

截至目前，公开能确认的点包括：

最多可同时自动化 10 个任务
在虚拟机里跑浏览器任务
可以暂停、恢复、取消
可以通过录屏“教”它做任务
当前仍是 research prototype

它为什么能进榜？

因为它代表的是另一条极有潜力的方向：

真正面向网页任务执行的浏览器 Agent。

如果 Google 把这条线继续做深，未来影响力不会小。

第 8 名：OpenHands#

如果你更关心开源世界，那 OpenHands 仍然是必须提到的名字。

它不是这份榜单里最商业化的产品，但它在“开源 Agent 实用化”上很有代表性。

官方文档里能看到几个关键点：

它的价值主要在：

开源
可自托管
有 Docker / Local / Remote Runtime
更适合自己搭实验和定制

为什么它排第 8？

因为从“普通用户可直接上手”到“产品完成度”来看，它确实不如前面那几家完整。
但如果你在意开放性、可控性和自定义空间，OpenHands 依然是很重要的一条线。

这份榜单里，我最看好的三条主线#

如果把整个榜单再往上收一层，我觉得 2026 年 5 月最值得持续关注的，其实是三条大趋势。

1. Agent 平台化#

代表产品：

Codex
ChatGPT Workspace Agents

这条线的重点已经不是“单次对话”，而是：

长任务
多 agent
权限控制
企业工作流接入

2. Coding Agent 深化#

代表产品：

Claude Code
Devin
Jules

这条线比拼的已经不是“会不会写代码”，而是：

谁更能理解代码库
谁更能持续执行
谁更适合真实开发环境

3. 通用执行 Agent 扩展#

代表产品：

Manus
Project Mariner

这条线更像是在探索：

AI 能不能不仅帮开发者
还能帮更广泛的人做网页、办公、研究和流程任务

如果你现在才开始接触 AI Agent，我建议这样看#

很多人一上来就想问：

哪个最强？
哪个最好？
哪个能完全替我工作？

但更实际的问法可能是：

如果你是开发者#

优先看：

Codex
Claude Code
Devin
Jules

如果你是团队负责人 / 企业工作流方向#

优先看：

ChatGPT Workspace Agents
Codex
Devin

如果你更想要通用型任务执行#

优先看：

Manus
Project Mariner

如果你更在意开源和可控性#

优先看：

OpenHands

也就是说，AI Agent 现在已经不太适合只用“一个总冠军”去理解了。
更重要的是看：你到底想把什么任务交给它。

结语#

如果一定要用一句话总结 2026 年 5 月 的 AI Agent 格局，我会这么说：

这个赛道已经过了“只会聊天就能惊艳所有人”的阶段，真正开始进入“谁更能把任务做完”的比拼。

所以这份榜单里，排在前面的产品都有一个共同点：

不只是会回答
不只是会生成
而是越来越像真正的执行系统

这也是为什么我会把今天这份榜单的第一名给 Codex。
但从更长的时间看，Claude Code、Workspace Agents、Devin、Jules、Manus 这些产品，接下来几个月都还会持续很有看头。

如果你现在正准备认真跟一条 AI Agent 主线，这 8 个，基本都值得你至少看一遍。

第 1 名：OpenAI Codex#

第 2 名：Anthropic Claude Code#

第 3 名：ChatGPT Workspace Agents#

第 4 名：Devin#

第 5 名：Google Jules#

第 6 名：Manus#

第 7 名：Project Mariner#

第 8 名：OpenHands#

这份榜单里，我最看好的三条主线#

1. Agent 平台化#

2. Coding Agent 深化#

3. 通用执行 Agent 扩展#

如果你现在才开始接触 AI Agent，我建议这样看#

如果你是开发者#

如果你是团队负责人 / 企业工作流方向#

如果你更想要通用型任务执行#

如果你更在意开源和可控性#

结语#

参考资料#