AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴

【本周AI新闻: AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴】 https://www.bilibili.com/video/BV1bkQyYCEvQ/?share_source=copy_web&vd_source=32ed33e1165d68429b2e2eb4749f3f26

最近AI圈子里最火的话题非Manus莫属!这款由中国武汉创业公司“蝴蝶效应”推出的通用AI代理自上周发布以来,在全球范围内掀起了一阵热潮。不仅在国内备受瞩目,在国际科技圈也频频刷屏。连推特联合创始人杰克·多西(Jack Dorsey)和Hugging Face产品负责人维克多·穆斯塔尔(Victor Mustar)都对其赞不绝口,甚至有人称其为“第二个DeepSeek”——毕竟,这款AI的实力和它的“出身”都让人意想不到。

Manus到底是什么?

官方介绍称,Manus是全球首个真正意义上的“通用AI代理”。它并不像传统AI聊天机器人那样仅依赖单一大模型,而是集成了多个AI模型(包括Anthropic的Claude 3.5 Sonnet和阿里巴巴的开源Qwen的微调版本),并通过多个独立运行的代理协作完成各种任务。换句话说,它不仅会聊天,更具备主动执行复杂任务的能力。

当然,虽然热度空前,但能亲自体验到Manus的用户少之又少。当前,仅有不到1%的候补名单用户收到了邀请码,而Manus的Discord频道成员却已超过18.6万,足见市场期待值之高。

MIT科技评论的实测

MIT科技评论最近拿到了Manus的测试权限。整体体验下来,这款AI确实像一个超高效的智能实习生。它有时候会误解指令,甚至偶尔偷懒,但逻辑清晰、适应力强,而且给出详细反馈后会显著改进。虽然目前并不完美,但确实充满潜力。

Manus的界面设计简洁,默认语言为英语。登陆后,用户会看到一个类似ChatGPT或DeepSeek的主页,左侧显示历史对话记录,中间是聊天输入框。此外,官方还提供了一系列示例任务,如商业策略制定、交互式学习以及定制化音频冥想等。

一个独特的功能是**“Manus’s Computer”**窗口,允许用户实时查看Manus执行任务的过程,甚至在关键时刻介入调整,这点比大多数AI助手都更透明。

为了评测Manus的能力,测试员设置了三个任务:

  1. 列出知名的中国科技记者
  2. 搜寻纽约市两居室房源
  3. 推荐“35岁以下创新者”候选人
任务1:寻找中国科技记者

初版名单仅包含5个记者,外加5个“荣誉提名”。部分记者的代表作被标注,部分却没有。问Manus原因,得到的答案令人哭笑不得——“偷懒了。”
它直言自己在“优化研究效率”的过程中,部分信息没补充完整。在要求统一标准后,它迅速调整,最终给出了30名记者的详细列表,并附上了他们目前所在的媒体和代表作。值得一提的是,Manus的输出可以直接下载为Word或Excel文件,方便后续整理和分享。

不过,它在处理付费墙内容时遇到了障碍,许多新闻网站识别其为“可疑行为”并拒绝访问。如果未来版本能在遇到此类问题时主动请求用户协助,体验会更进一步。

任务2:搜寻纽约房源

Manus起初误解了“某种户外空间”的概念,直接筛掉了所有没有私人阳台或露台的房源。但经过调整,它最终生成了一个分层推荐列表,类似Wirecutter风格,包括“最佳整体选择”、“性价比最高”和“豪华选项”等类别。这项任务花了不到半小时,比整理记者名单快得多,可能是因为房地产数据更公开、结构化程度更高。

任务3:“35岁以下创新者”候选人

这个任务的难度最大。Manus需要研究往年榜单、制定搜索策略、筛选候选人,并确保多元化。然而,由于无法访问学术论文和部分新闻网站,研究进展受限。三小时后,它仅找到3个完整背景资料的候选人。最终,在强制要求下,它凑出了50个名字,但部分领域和机构过度集中,反映出研究仍有漏洞。在进一步补充“中国候选人”后,它确实找到了一些合适的人选,但不少是国内媒体常见的“明星创新者”。

最终评测

从实测来看,Manus确实是一个直观、适合无代码背景用户的AI工具。在某些任务上,它比ChatGPT DeepResearch表现更好,尤其擅长在开放网络上进行深入研究。但它的处理速度较慢,特别是涉及大范围搜索时,效率还有提升空间。

然而,它的稳定性仍需优化。测试过程中,Manus偶尔崩溃,甚至因服务器负载过高拒绝创建新任务。相比ChatGPT DeepResearch,它的任务失败率更高。Manus的首席科学家Peak Ji表示,团队正努力改善这一问题。而根据中国媒体36Kr的报道,每次任务的成本仅约2美元,远低于DeepResearch的20美元,成本优势明显。

Manus的一大亮点是透明且可定制的工作流程。它会主动询问问题,并在“知识”记忆中保留用户的重要指令,以便未来任务中使用。每个任务的操作步骤也可以回放和分享,提高了可控性和协作体验。

虽然Manus当前仍存在一些短板,但它已经展示了中国AI公司在通用智能代理上的独特创新能力,不再只是跟随西方步伐,而是在自主塑造AI技术的发展方向。未来,如果服务器架构得到优化,它有望成为白领、独立开发者和小型团队的新宠

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33977.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis实现高并发排行榜的功能

生活中排行榜是常见的功能,如游戏的排行榜,销售额的排行榜等等,排行榜不仅可以让用户有更多的激情参与到活动中来,而且可以更好的留存住用户,如下所示的拉新排行榜: 排行榜是一个常见的业务需求&#xff0…

数字孪生像魔镜,映照出无限可能的未来

在当今科技飞速发展的时代,数字孪生作为一项极具潜力的前沿技术,正逐渐崭露头角,成为众多领域关注的焦点。它犹如一面神奇的魔镜,以数字化的方式精准映照出现实世界中的各种实体与系统,为我们开启了一扇通往无限可能未…

每日一题---

深拷贝和浅拷贝的区别是什么? null 浅拷贝是指只复制对象本身和其内部的值类型字段,但不会复制对象内部的引用类型字段。换句话说,浅拷贝只是创建一个新的对象,然后将原对象的字段值复制到新对象中,但如果原对象内部有…

Chrome 扩展开发 API实战:Sessions (六)

1. 引言 chrome.sessions 是 Chrome 扩展开发者工具的一部分,提供了对最近关闭的标签页和窗口的访问,以及对会话恢复功能的支持。现代浏览器的一个显著特点是为用户提供更多的便利性,比如快速恢复意外关闭的页面。通过 chrome.sessions API&…

Spring Boot对接twilio发送邮件信息

要在Spring Boot应用程序中对接Twilio发送邮件信息,您可以使用Twilio的SendGrid API。以下是一个简单的步骤指南,帮助您完成这一过程: 1. 创建Twilio账户并获取API密钥 注册一个Twilio账户(如果您还没有的话)。在Twi…

学习15天:pytest

1、.pytest强大的插件 pytest-html(生成html格式的自动化测试报告) pytest-xdist测试用例分布式执行。多CPU分发。 pytest-ordering 用于改变测试用例的执行顺序 pytest-rerunfailures用例失败后重跑 allure-pytest 用于生成美观的测试报告。 2、规则: 模块…

Springboot+mybatis实现增删改查操作

继续写一下删除操作,删除有些不一样,首先在controller里面,我们需要改一下路由,我们后面要写/{id}传入路径参数,用PathVariable注解绑定id,剩下的都一样,传入id,然后写service和mapp…

Visual Studio里的调试(debugging)功能介绍

参考 1- Introduction to Debugging | Basic Visual Studio Debugging(这是一位印度博主视频,我下面做到笔记也主要参考她的视频,但不得不说口音太重了,一股咖喱味) 目录 个人对调试浅显的认识和对调试的介绍逐行调…

Java多线程与高并发专题——原子类和 volatile、synchronized 有什么异同?

原子类和 volatile异同 首先,通过我们对原子类和的了解,原子类和volatile 都能保证多线程环境下的数据可见性。在多线程程序中,每个线程都有自己的工作内存,当多个线程访问共享变量时,可能会出现一个线程修改了共享变…

c语言笔记 作用域

目录 作用域的基本概念 1.函数声明的作用域 2.局部变量的作用域 3.全局作用域 4.static修饰后的作用域 作用域的基本概念 在c语言中,我们的标志符是具有一定的可见范围的,我们称这个可见范围为作用域 在软件开发中,我们要确定好标识符的作…

MySQL数据库知识总结

MySQL数据库知识总结 一、基本概念及其介绍二、数据库中的数据类型(一)数值类型(二)字符串类型(三)日期类型 三、数据库基础语法(一)数据库的常用操作(二)数据…

SpaceSync智能排班:重构未来办公空间的神经中枢

文心智能体平台可免费使用DeepSeek 满血版啦,使用DeepSeek模型创建并提交智能体,即有机会瓜分万元奖金!有这等好事还不快冲! 文心智能体官网:文心智能体平台AgentBuilder | 想象即现实 本片文章为作者参加文心智能体平…

Blender-MCP服务源码3-插件开发

Blender-MCP服务源码3-插件开发 Blender-MCP服务源码解读-如何进行Blender插件开发 1-核心知识点 1)使用Blender开发框架学习如何进行Blender调试2)学习目标1-移除所有的Blender业务-了解如何MCP到底做了什么?3)学习目标2-模拟MC…

每日一题---dd爱框框(Java中输入数据过多)

dd爱框框 实例: 输入: 10 20 1 1 6 10 9 3 3 5 3 7 输出: 3 5 这道题要解决Java中输入的数过多时,时间不足的的问题。 应用这个输入模板即可解决: Java中输入大量数据 import java.util.*; import java.io.*;pu…

Qlik Sense New Install with Restore

Background In case you meet the upgrade issue like us , you can follow the below step to recover the existing data to new installed Qlik Sense . Powered by Moshow郑锴-CSDN博客 please follow below steps: pgsql dump backupbackup table into sql by DBeaverst…

大数据-spark3.5安装部署之standalone模式

真实工作中还是要将应用提交到集群中去执行,Standalone模式就是使用Spark自身节点运行的集群模式,体现了经典的master-slave模式。集群共三台机器,具体如下 u22server4spark: master worker u22server4spark2: worke…

Uniapp 开发 App 端上架用户隐私协议实现指南

文章目录 引言一、为什么需要用户隐私协议?二、Uniapp 中实现用户隐私协议的步骤2.1 编写隐私协议内容2.2 在 Uniapp 中集成隐私协议2.3 DCloud数据采集说明2.4 配置方式3.1 Apple App Store3.2 Google Play Store 四、常见问题与解决方案4.1 隐私协议内容不完整4.2…

【C++】 —— 笔试刷题day_5

刷题day_5 一、游游的you 题目链接:游游的you 题目解析 题目要求: 输入a,b,c表示y、o、u三个字母的个数; 将这些字母连成字符串,并且这里you三个字母相邻获得2分,两个o字母相邻获得1分。 让我…

78. Harmonyos NEXT 懒加载数据源实现解析:BasicDataSource与CommonLazyDataSourceModel详解

温馨提示:本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦! Harmonyos NEXT 懒加载数据源实现解析:BasicDataSource与CommonLazyDataSourceModel详解 文章目录 Harmonyos NEXT 懒加载数据源实现解…

如何打包数据库mysql数据,并上传到虚拟机上进行部署?

1.连接数据库,使得我们能看到数据库信息,才能进行打包上传 2. 3. 导出结果如下,是xml文件 4.可以查询每个xml文件的属性,确保有大小,这样才是真实导出 5跟着黑马,新建文件夹,并且把对应的东西放…