AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴

【本周AI新闻: AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴】 https://www.bilibili.com/video/BV1bkQyYCEvQ/?share_source=copy_web&vd_source=32ed33e1165d68429b2e2eb4749f3f26

最近AI圈子里最火的话题非Manus莫属！这款由中国武汉创业公司“蝴蝶效应”推出的通用AI代理自上周发布以来，在全球范围内掀起了一阵热潮。不仅在国内备受瞩目，在国际科技圈也频频刷屏。连推特联合创始人杰克·多西（Jack Dorsey）和Hugging Face产品负责人维克多·穆斯塔尔（Victor Mustar）都对其赞不绝口，甚至有人称其为“第二个DeepSeek”——毕竟，这款AI的实力和它的“出身”都让人意想不到。

Manus到底是什么？

官方介绍称，Manus是全球首个真正意义上的“通用AI代理”。它并不像传统AI聊天机器人那样仅依赖单一大模型，而是集成了多个AI模型（包括Anthropic的Claude 3.5 Sonnet和阿里巴巴的开源Qwen的微调版本），并通过多个独立运行的代理协作完成各种任务。换句话说，它不仅会聊天，更具备主动执行复杂任务的能力。

当然，虽然热度空前，但能亲自体验到Manus的用户少之又少。当前，仅有不到1%的候补名单用户收到了邀请码，而Manus的Discord频道成员却已超过18.6万，足见市场期待值之高。

MIT科技评论的实测

MIT科技评论最近拿到了Manus的测试权限。整体体验下来，这款AI确实像一个超高效的智能实习生。它有时候会误解指令，甚至偶尔偷懒，但逻辑清晰、适应力强，而且给出详细反馈后会显著改进。虽然目前并不完美，但确实充满潜力。

Manus的界面设计简洁，默认语言为英语。登陆后，用户会看到一个类似ChatGPT或DeepSeek的主页，左侧显示历史对话记录，中间是聊天输入框。此外，官方还提供了一系列示例任务，如商业策略制定、交互式学习以及定制化音频冥想等。

一个独特的功能是**“Manus’s Computer”**窗口，允许用户实时查看Manus执行任务的过程，甚至在关键时刻介入调整，这点比大多数AI助手都更透明。

为了评测Manus的能力，测试员设置了三个任务：

列出知名的中国科技记者
搜寻纽约市两居室房源
推荐“35岁以下创新者”候选人

任务1：寻找中国科技记者

初版名单仅包含5个记者，外加5个“荣誉提名”。部分记者的代表作被标注，部分却没有。问Manus原因，得到的答案令人哭笑不得——“偷懒了。”
它直言自己在“优化研究效率”的过程中，部分信息没补充完整。在要求统一标准后，它迅速调整，最终给出了30名记者的详细列表，并附上了他们目前所在的媒体和代表作。值得一提的是，Manus的输出可以直接下载为Word或Excel文件，方便后续整理和分享。

不过，它在处理付费墙内容时遇到了障碍，许多新闻网站识别其为“可疑行为”并拒绝访问。如果未来版本能在遇到此类问题时主动请求用户协助，体验会更进一步。

任务2：搜寻纽约房源

Manus起初误解了“某种户外空间”的概念，直接筛掉了所有没有私人阳台或露台的房源。但经过调整，它最终生成了一个分层推荐列表，类似Wirecutter风格，包括“最佳整体选择”、“性价比最高”和“豪华选项”等类别。这项任务花了不到半小时，比整理记者名单快得多，可能是因为房地产数据更公开、结构化程度更高。

任务3：“35岁以下创新者”候选人

这个任务的难度最大。Manus需要研究往年榜单、制定搜索策略、筛选候选人，并确保多元化。然而，由于无法访问学术论文和部分新闻网站，研究进展受限。三小时后，它仅找到3个完整背景资料的候选人。最终，在强制要求下，它凑出了50个名字，但部分领域和机构过度集中，反映出研究仍有漏洞。在进一步补充“中国候选人”后，它确实找到了一些合适的人选，但不少是国内媒体常见的“明星创新者”。

最终评测

从实测来看，Manus确实是一个直观、适合无代码背景用户的AI工具。在某些任务上，它比ChatGPT DeepResearch表现更好，尤其擅长在开放网络上进行深入研究。但它的处理速度较慢，特别是涉及大范围搜索时，效率还有提升空间。

然而，它的稳定性仍需优化。测试过程中，Manus偶尔崩溃，甚至因服务器负载过高拒绝创建新任务。相比ChatGPT DeepResearch，它的任务失败率更高。Manus的首席科学家Peak Ji表示，团队正努力改善这一问题。而根据中国媒体36Kr的报道，每次任务的成本仅约2美元，远低于DeepResearch的20美元，成本优势明显。

Manus的一大亮点是透明且可定制的工作流程。它会主动询问问题，并在“知识”记忆中保留用户的重要指令，以便未来任务中使用。每个任务的操作步骤也可以回放和分享，提高了可控性和协作体验。

虽然Manus当前仍存在一些短板，但它已经展示了中国AI公司在通用智能代理上的独特创新能力，不再只是跟随西方步伐，而是在自主塑造AI技术的发展方向。未来，如果服务器架构得到优化，它有望成为白领、独立开发者和小型团队的新宠！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/33977.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！