2562 字
13 分钟
2026 年 5 月 AI Agent 排行榜:这 8 个产品,最值得关注

如果你最近在看 AI Agent,应该会发现一个很现实的问题:

现在“自称是 Agent”的产品太多了,但真正值得持续关注的,其实没那么多。

有些只是把聊天界面换了个名字。
有些能回答问题,但不太能真的把任务接过去。
也有些虽然很强,但离普通用户还很远。

所以这篇文章,我不想做那种“把所有热门词都堆进去”的榜单,而是想给你一个更实际的版本:

截至 2026 年 5 月 5 日,现在最值得关注的 AI Agent,到底是哪些?

先说明一下这份榜单的标准。

我这次主要看 5 件事:

  • 产品完成度
  • 任务执行能力
  • 当前可用性
  • 生态和工作流扩展能力
  • 2026 年 4 月到 5 月之间的公开更新热度

也就是说,这不是“模型智商排行榜”,而是更偏现在谁更像一个真正能用的 Agent 产品


第 1 名:OpenAI Codex#

如果只看 2026 年 5 月 这个时间点,我会把第一名给 Codex。

原因很简单:它现在已经不只是“写代码工具”,而是一个越来越完整的 任务执行平台

OpenAI 在 2026 年 4 月 16 日发布的 Codex for (almost) everything 里,已经把 Codex 的定位拉得非常明确:

  • 可以操作电脑
  • 可以并行运行多个 agent
  • 可以使用浏览器
  • 可以生成图片
  • 可以记忆偏好
  • 可以承担持续性和重复性工作

再往前看,OpenAI 在 2026 年 2 月 2 日发布 Introducing the Codex app 时,就已经把它定义成一个 command center for agents

为什么它排第一?

  • 产品方向最完整
  • 多 agent 和长任务能力已经成形
  • 工具链整合速度非常快
  • 2026 年春季的更新节奏明显领先

如果今天你想看“AI Agent 下一阶段长什么样”,Codex 基本是绕不过去的。


第 2 名:Anthropic Claude Code#

如果说 Codex 是“Agent 平台化”最明显的代表,那 Claude Code 依然是目前最强势的 终端原生 Agent 之一。

Anthropic 官方文档把它定义得很直接:
Claude Code overview

Claude Code 能做的事包括:

  • 从描述直接构建功能
  • 分析 bug 并修复
  • 理解整个代码库
  • 直接编辑文件、运行命令、创建提交
  • 通过 MCP 接更多外部数据源和工具

它的优势不一定在“界面最完整”,而在于:

  • 很贴近开发者原本的工作方式
  • 在终端里就能完成大量动作
  • 组合性强
  • 和 MCP 生态天然贴合

为什么不是第一?

因为站在 2026 年 5 月这个时间点,Codex 在“多 agent、桌面能力、浏览器能力、持续任务和产品扩展性”上已经拉得更开。
但如果你问“现在最能打的 coding agent 之一是谁”,Claude Code 仍然一定在前排。


第 3 名:ChatGPT Workspace Agents#

这个产品很新,但我还是把它排进前三。

OpenAI 在 2026 年 4 月 22 日发布 Introducing workspace agents in ChatGPT 时,给出的信号非常强:

  • 这是 GPTs 的进化版
  • 由 Codex 驱动
  • 面向团队
  • 可在云端持续运行
  • 可接 Slack 和更多工具
  • 可共享、可治理、可设置权限边界

为什么它排名这么高?

因为它代表的是另一条非常重要的趋势:

AI Agent 正在从个人工具,走向团队执行层。

这和传统“我自己开一个助手”完全不一样。
它更像是:

  • 团队共同使用的 Agent
  • 能处理长流程工作
  • 能跨工具协同
  • 能被组织内复用

如果 2025 年大家还在谈“个人 AI 助手”,那 2026 年的一个明显变化,就是“组织级 Agent”开始成型了。


第 4 名:Devin#

Devin 现在已经不只是一个“概念证明产品”了,而是持续在往产品化和企业化推进。

Cognition 官方站点和最近公开动态能看到几条很清晰的线:

  • Devin 2.2
  • Schedule Devins
  • Manage Devins
  • Devin for Terminal
  • 新 self-serve plans

参考:

Devin 的核心吸引力还是很鲜明:

  • 云端异步执行
  • 更像“AI 软件工程师”而不是普通代码助手
  • 任务可以持续推进
  • 正在往多 agent 和更强管理能力演进

为什么我把它放在第 4,而不是更高?

不是因为它不强,而是因为 2026 年春天这一波,OpenAI 和 Anthropic 的产品扩张速度更快、覆盖面更广。
但 Devin 依然是整个 Agent 赛道里最值得持续盯着的核心选手之一。


第 5 名:Google Jules#

Jules 是我觉得很多人低估了,但其实非常值得关注的一个产品。

Google 在 2025 年 5 月 20 日就已经把 Jules public beta 推出来了,而最近的官方更新更关键:

它的特点很明确:

  • 异步
  • 云端安全 VM
  • 直接围绕代码仓库工作
  • 做完后给计划、推理和 diff

Jules 之所以排到第 5,不是因为它弱,而是因为它更聚焦在 异步 coding agent 这个子赛道。
如果你本身就在 Google / Gemini 生态里,Jules 反而可能是非常值得试的一条线。


第 6 名:Manus#

如果你希望找的是“不是只给开发者用”的通用型 AI Agent,那 Manus 仍然值得上榜。

Manus 官方自己的定位很直白:

它强调的是:

  • general AI agent
  • complete tasks and deliver results
  • secure sandbox
  • browser + file system + shell
  • 长任务上下文持续

而且 Manus 这段时间也在持续补能力:

  • Slack integration
  • Agent Skills
  • My Computer / Desktop
  • 浏览器和工作流能力扩展

参考:

为什么只排第 6?

因为它的覆盖面很广,但从当前公开产品成熟度和生态稳定性来看,前面几个在“开发工作流落地”上更清晰。
不过如果你想看“通用型 Agent 怎么走向大众使用”,Manus 仍然非常值得关注。


第 7 名:Project Mariner#

严格说,Project Mariner 还带着明显的“研究原型”气质。
但我还是把它放进榜单,因为它在 浏览器任务 Agent 这个方向上的代表性太强了。

Google 官方帮助文档里对它的描述已经很具体:

截至目前,公开能确认的点包括:

  • 最多可同时自动化 10 个任务
  • 在虚拟机里跑浏览器任务
  • 可以暂停、恢复、取消
  • 可以通过录屏“教”它做任务
  • 当前仍是 research prototype

它为什么能进榜?

因为它代表的是另一条极有潜力的方向:

真正面向网页任务执行的浏览器 Agent。

如果 Google 把这条线继续做深,未来影响力不会小。


第 8 名:OpenHands#

如果你更关心开源世界,那 OpenHands 仍然是必须提到的名字。

它不是这份榜单里最商业化的产品,但它在“开源 Agent 实用化”上很有代表性。

官方文档里能看到几个关键点:

它的价值主要在:

  • 开源
  • 可自托管
  • 有 Docker / Local / Remote Runtime
  • 更适合自己搭实验和定制

为什么它排第 8?

因为从“普通用户可直接上手”到“产品完成度”来看,它确实不如前面那几家完整。
但如果你在意开放性、可控性和自定义空间,OpenHands 依然是很重要的一条线。


这份榜单里,我最看好的三条主线#

如果把整个榜单再往上收一层,我觉得 2026 年 5 月最值得持续关注的,其实是三条大趋势。

1. Agent 平台化#

代表产品:

  • Codex
  • ChatGPT Workspace Agents

这条线的重点已经不是“单次对话”,而是:

  • 长任务
  • 多 agent
  • 权限控制
  • 企业工作流接入

2. Coding Agent 深化#

代表产品:

  • Claude Code
  • Devin
  • Jules

这条线比拼的已经不是“会不会写代码”,而是:

  • 谁更能理解代码库
  • 谁更能持续执行
  • 谁更适合真实开发环境

3. 通用执行 Agent 扩展#

代表产品:

  • Manus
  • Project Mariner

这条线更像是在探索:

  • AI 能不能不仅帮开发者
  • 还能帮更广泛的人做网页、办公、研究和流程任务

如果你现在才开始接触 AI Agent,我建议这样看#

很多人一上来就想问:

  • 哪个最强?
  • 哪个最好?
  • 哪个能完全替我工作?

但更实际的问法可能是:

如果你是开发者#

优先看:

  • Codex
  • Claude Code
  • Devin
  • Jules

如果你是团队负责人 / 企业工作流方向#

优先看:

  • ChatGPT Workspace Agents
  • Codex
  • Devin

如果你更想要通用型任务执行#

优先看:

  • Manus
  • Project Mariner

如果你更在意开源和可控性#

优先看:

  • OpenHands

也就是说,AI Agent 现在已经不太适合只用“一个总冠军”去理解了。
更重要的是看:你到底想把什么任务交给它。


结语#

如果一定要用一句话总结 2026 年 5 月 的 AI Agent 格局,我会这么说:

这个赛道已经过了“只会聊天就能惊艳所有人”的阶段,真正开始进入“谁更能把任务做完”的比拼。

所以这份榜单里,排在前面的产品都有一个共同点:

  • 不只是会回答
  • 不只是会生成
  • 而是越来越像真正的执行系统

这也是为什么我会把今天这份榜单的第一名给 Codex。
但从更长的时间看,Claude Code、Workspace Agents、Devin、Jules、Manus 这些产品,接下来几个月都还会持续很有看头。

如果你现在正准备认真跟一条 AI Agent 主线,这 8 个,基本都值得你至少看一遍。


参考资料#

2026 年 5 月 AI Agent 排行榜:这 8 个产品,最值得关注
https://upsubs.com/posts/ai_agent/ai-agent-ranking-may-2026/
作者
优阅博客
发布于
2026-05-05
许可协议
CC BY-NC-SA 4.0