Manus 速评: 全委 Agent or 协作 Agent ?
Manus 定位成一个通用的 Agent ,最快速度的实现了 , Input 加强(DeepSearch )和Output(Artifact )的统合,+ 加上 Planing/Reasoning(类 Cursor)等 , 按照其官方说法 ,定位通用 Agent ,且 【Less Structure 】
上午我很快测试了几种 Case ,包括出行规划(信息收集类)、市场归因(时效Context 收集)、建议给出(表达 意图层次,而不是形式罗列) 、以及制作 Artifact 等。
【直观感受】
- 信息收集类任务 远好于 分析类任务
- 过程比较长,通常 3-15 分钟 ,最快的是代码类任务(重写 PitchDeck, 3 分钟)
- 有流程性的互动请求人参与(比如过程访问关键网页,被识别 robot 需要人的协助或跳过)
- 会有用户偏好识别和记录确认过程 )人参与)
- 有 todo.md 和 Draft.md 来记录中间过程,有很好的可见度
- 但是整体 人在 3-10 分钟过程中,可以介入的余地不大 ,尤其对内容和质量 调整方面 。
那么我想 1.0 Manus 已经非常好流程完成度
【正式讨论】
BUT 问题在于 : 通用 Agent 应该是个:
【A】 ”协作 Agent “ , 还是
【B】 “全委Agent”
当然可以是有模糊地带
(此处借用了私人银行的两种账户服务形态, 前者投顾,一起产生决策一起承担后果, 后者 只看 交付结果和 Performance )
如果是【B】 “全委Agent” :
Manus 目前的版本更像一个【全委Agent】(围观 15 分钟,直接看一个完整的交付) 。
但是会发现一个问题,目前的交付质量:相比【 专业分析任务的完成,Manus 更擅长信息收集任务, 和更好的形式交付。 类似 ”AI 会议摘要“的进阶版本
或者说通用 Agent 很难胜任【专业级的交付】,这个结果与 Manus 没有关系,而是推理过程中:
- 对专业的“Structure” 理解和储备不足
- 高质量的数据 Context 是输入不足
但是作为专业 Agent 来说,很好的"形式程度“ ,但是"有用性程度“ 距离生产标准,, 那么我的假设问题:
通用 Agent 是否能在中远期 胜任 专业交付, 因为这里需要 私有和 Structure 的意图 。
* Structured 约等于 行业共识
如果是【A】 ”协作 Agent “ :
如果定位 A来审视 当前的产品
- Manus 当前一次性的交付的这个形态,目前每个 request 过于细致 和完整的执行,会导致时间过长, 用户介入结果质量的空间偏少, (Vs Cursor)
- 用户可以:快速打断,纠正,补充信息,补充指令,
- 机器可以:先规划,确认,再 move on ,先 high level ,再 Detail , 再 action
----
因为一个好的交付,是一个【讨论结果】/共识结果,不是一个执行结果。根本原因,用户无法一次性给出意图和 context ,但是, 任务完成过程, 是一个 context 完整、对齐过程。
- 那么我初步的感受,如果作为通用 Agent ,是一个更开放的协作 Agent, 这部分交互 是极其前沿,和值得期待的
所以我想初步判断
通用 Agent , Less Structured,更高开放度,是一个 【协作 Agent】, 突破在 人机意图和 context 持续交互
专业 Agent ,更像人力外包, More Structured ,接近全委 Agent,