ChatGPT 已能操控机器人,工程师连代码都不用写,网友:微软在搞天网?

Alex 发自 凹非寺

本文源自:量子位 | 公众号 QbitAI

当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。

不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软

到目前为止,开发者调教机器人不仅技术门槛高,还道阻且长:

工程师需要在工作流程回路中,不断手写新代码和规范来纠正机器人行为;另外,操控不同的机器人可能需要不同的编程语言和环境。

而在ChatGPT的帮助下,工程师甚至不用手写代码——直接用人话描述想做什么,AI就能自动翻译成机器语言。

这意味着,一方面专业人士与机器人的交互效率起飞;另一方面,技术门槛也降低一大截,外行人甚至也能参与调试,创造出更多使用方法。

举个简单的例子:让无人机自动检查货架。

首先,操作者只需用自然语言给ChatGPT提出要求;然后,AI就能自动翻译成代码,并指挥无人机行动。(还可以规定无人机的飞行路径。)

难怪特斯拉前AI主管Andrej Karpathy会调侃:

最新的热门编程语言是英语。

一个AI指挥多种机器人

实际上,ChatGPT会玩儿的花样可多了。

比如,一位操作者跟AI说:“我渴了,请帮我找个喝的。”

此时AI并不会直愣愣地就去找水了,而是会很机灵地反问:

请问你想喝哪种?这里有好几种饮料,比如椰子水、可乐等等。

当然操作者也不是吃素的,他并未直接告诉AI选哪个,而是说:“我刚从健身房回来,请帮我找个健康点儿的饮料。”

然后更神奇的操作就开始了:

AI先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释):

写完就自己指挥无人机去找椰子水:

除了无人机,ChatGPT还能轻松操控别的小机器人,包括摄像头、机械臂等等。

比如让摄像头在房间里找出能加热午饭的东西。

还有指挥机械臂拼出一个微软的Logo。(悄悄夹带私货)

看到这些,有网友脑洞大开,有人发问:

他们是不是正在建立无所不能的天网?

还有人甚至调侃称,AI可能连发射核弹的指令都会写:

不过话说回来,其实离网友说的这些还差得远,毕竟现在还是需要人类参与的。

怎么实现的?

从前文可以看出,这只灵活的AI不仅与人交流畅通无阻,而且和机器也能快速沟通。

这主要得益于微软团队专门开发的一系列API高级函数库

他们没有让ChatGPT背后的语言大模型(LLM),生成某固定种类的代码;因为机器人是个多元化领域,这样可能会在不同场景下涉及大量微调。

而在新颖的操作框架下,不同机器人,都有自己对应的特定函数库。

——一个AI,就能适应不同的对象、不同的任务

一方面,这些函数库,能够连接到机器人控制系统中管理底层硬件,以及执行基本运动的代码和功能模块。

另一方面,为了让ChatGPT也能遵循函数库的规则,预定义函数命名就很关键。清晰的函数名,能让各API之间建立良好的功能连接,最终生成高质量的回答。

其中一项要求,就是所有API名称必须描述整体功能行为。例如,detect_object(object_name) 函数可以在内部链接到OpenCV函数或计算机视觉模型。

设计好库和API后,微软给ChatGPT编写了一个文本提示(prompt),描述目标任务,并明确说明函数库中哪些函数可用;另外,这还能规定ChatGPT生成代码用哪种编程语言。

值得一提的是,AI生成内容效果,和人为提示的质量呈正相关。为此,微软还开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类机器人的Prompt策略。

到此,幕后部署基本完成,然后用户就能通过“说人话”间接操控机器人了。

如果想要检查AI生成的代码是否有Bug,随时都能在聊天框直接检查,或通过模拟器测试,人类可以用自然语言指导AI进行修正。

另外,还能到等到用户对解决方案满意为止,再在将ChatGPT生成代码部署到机器人上。

最后,如果是你,会想用ChatGPT操控机器人做些什么呢?

论文地址:https://www.microsoft.com/en-us/research/uploads/prod/2023/02/ChatGPT___Robotics.pdf

参考链接:[1]https://arstechnica.com/information-technology/2023/02/robots-let-chatgpt-touch-the-real-world-thanks-to-microsoft/[2]https://www.microsoft.com/en-us/research/group/autonomous-systems-group-robotics/articles/chatgpt-for-robotics/[3]https://github.com/microsoft/PromptCraft-Robotics#promptcraft-robotics

卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的IT前沿阵地,包含技术文章、群组、互动问答、在线学习、大赛活动、开发者平台、OpenAPI平台、低代码平台、开源项目等服务,社区使命是让每一个知识工人成就不凡。

官网链接:Openlab.cosmoplat—打造工业互联网顶级开源社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/57011.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自从使用了Cursor工作效率飞起

什么是Cursor 官网:https://www.cursor.so/ 看官网接受大家应该就知道是什么东西了,他是一个开源的AI编程编辑器。开源地址https://github.com/getcursor/cursor 目前在国内是可以不需要其他东西,可以之间访问的。而且目前免费使用。支持多…

大模型惨遭人类大范围攻击!国内各领域专家组团投毒,GPT-4 也 Hold 不住

这是「进击的Coder」的第 852 篇技术分享 作者:关注前沿科技 来源:量子位 “ 阅读本文大概需要 9 分钟。 ” 包括 GPT-4 在内等多个大模型惨遭人类攻击!还是大范围、多边形那种。 而且这个军团被爆个个来头不小。 包括社会学家李银河、心理学…

宵夜杂谈 | Uni3D是自动驾驶脱不去的长衫?

作者 | matrix明仔 编辑 | 汽车人 原文链接:https://zhuanlan.zhihu.com/p/616531799 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【全栈算法】技术交流群 1说在前面的话 我一个朋友昨天喝了两大…

CUDA实战 | CUDA卷积算子手写详细实现流程!

作者 | Pegessi 编辑 | 极市平台 原文链接:https://zhuanlan.zhihu.com/p/613538649 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【模型部署】技术交流群 后台回复【CUDA】获取CUDA实战书籍&…

万字长文 | 详解CUDA卷积算子手写实现

作者 | Pegessi 编辑 | 极市平台 原文链接:https://zhuanlan.zhihu.com/p/613538649 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【模型部署】技术交流群 导读 本篇文章主要介绍如何利用CUDA实现…

第一次玩剧本杀,基本说明与模型抽取

本文分两部分,第一部分是基本说明,第二部分是模型抽取。 一、基本说明 根据不同剧本,参与人数7/-2人,跟Scrum的黄金人数一致。游戏时长3~5小时,跟两周迭代的计划会时长一致。 每个角色都有自己的剧本,剧本中…

巴比特 | 元宇宙每日必读:虚拟数字人是否享有著作权或邻接权?杭州互联网法院判决首例涉“虚拟数字人”侵权案...

摘要:据杭州互联网法院报道,近日,杭州互联网法院就首例涉“虚拟数字人”侵权案作出了一审判决。本案判决结合人工智能技术应用及虚拟数字人发展现状,从权利主体、客体、权利归属等多层面分析虚拟数字人在现有《著作权法》框架下不…

京东撸货前期准备流程急设备要求

1硬件设备:电脑一台货苹果手机一部,手机推荐苹果6S以上,系统版本14以下的好操作,如果现有的设备是14的也可以。 电脑的话推荐配置E5系列,可以多开模拟器窗口。64位系统你开启VT功能,其他的无所谓,如果配置不够差一点也能行, 2软件方面,推荐用佐罗,爱丽丝或者爱新机…

生活需要套路

文章来自公众号:胖琪的升级之路 一般说到套路,总感觉是一个贬义词,但今天所说的套路是为了给自己减负,或者是帮助提高的一种想法。 生活为什么需要套路 学习,生活,办事等等,很多时候在这些事情里…

微软官方的《Power BI权威指南》译版发售

你是否也和职场中的大多数人一样,曾经很多次挣扎在Excel 报表的“压榨”之下,一边赞叹Excel 软件的威力,一边期待着一些改变?文末参与互动,赢取来自微软官方的《Power BI权威指南》。激活你的数据禀赋,让你…

《口袋妖怪》大战:通过数据分析,一次性揭示最强王者,谁能成为最后的胜者?

最新游戏《Pokemon LEGENDS Arceus》发售啦!在这款游戏中,两种全新的口袋妖怪佐鲁亚和佐罗亚克受到了大家的关注。值得注意的是,这两种妖怪都是来自未曾出现过的普通幽灵类型。对于《口袋妖怪》的粉丝来说,这是一个非常令人期待的消息。 普通类型在游戏中一直以来是一个较…

前端-angular佐罗表格的使用和效果展示

前言   小编最近在做项目的时候用的佐罗的控件来进行数据显示,佐罗的 Ant Design 的 Angular 实现地址在这里:https://ng.ant.design/docs/introduce/zh 很多样式和模板可以供我们参考和应用。下面是小编进行的一个table表格的使用,仅供参考…

Angular6-Zorro(佐罗)组件使用-持续更新++

前言 ZORRO&#xff1a;https://ng.ant.design/components/layout/zh 博主当前库&#xff1a;7.0.0 beat3 loading组件 业务场景&#xff0c;预加载给予用户思想缓冲时间 通过ngIf判断是否显示loading组件 html代码如下 <nz-spin [nzSize]"small" class"…

L1-6 佐罗与魔法石板 (15 分)

佐罗&#xff08;Zorro&#xff09;是一个传奇人物&#xff0c;出现在很多电影&#xff08;小说、动画、电视剧&#xff09;中&#xff0c;他经常用利剑划下Z字标记&#xff0c;让我们印象深刻。&#xff08;出题者是不是暴露年龄了 -_-#&#xff09; 佐罗发现了一块古老的石板…

佐罗官网zorro软件安装教程及一键新机屏蔽越狱使用方法详细简介

cydia添加佐罗源&#xff1a;https://apt.zorroxj.com 佐罗zorro是一款全新技术架构的隐私保护工具&#xff0c;可以在 iOS 8.0 ~ iOS 14.8 越狱后的苹果iPhone手机上使用&#xff0c;专业防止您的隐私信息被第三方不当获取&#xff0c;拒绝隐私泄露&#xff0c;伪装手机环境参…

佐罗BI真经连续剧

学习必读代码 public void string main(String agrs[]){//获取课程vx 80407290 } 一、表格 表是保存信息的容器&#xff0c;分为行和列。每行包含关于单个实体的信息&#xff0c;而每行中的每个单元格包含数据库中表示的最小的信息片段。例如&#xff0c;客户表包含所有客户的…

佐罗一键新机软件安装教程及使用方法

Cydia添加源地址:a p t . z o r r o g w . c o m 佐罗zorro是一款全新技术架构的隐私保护工具&#xff0c;可以在 iOS 8.0 ~ iOS 14.8 越狱后的苹果iPhone手机上使用&#xff0c;专业防止您的隐私信息被第三方不当获取&#xff0c;拒绝隐私泄露&#xff0c;伪装手机环境参数和清…

佐罗与魔法石板

佐罗&#xff08;Zorro&#xff09;是一个传奇人物&#xff0c;出现在很多电影&#xff08;小说、动画、电视剧&#xff09;中&#xff0c;他经常用利剑划下Z字标记&#xff0c;让我们印象深刻。&#xff08;出题者是不是暴露年龄了 -_-#&#xff09; 佐罗发现了一块古老的石板…

佐罗PowerBI真经连续剧

学习必读代码 public void string main(String agrs[]){//获取课程vx 80407290 } 一、表格 表是保存信息的容器&#xff0c;分为行和列。每行包含关于单个实体的信息&#xff0c;而每行中的每个单元格包含数据库中表示的最小的信息片段。例如&#xff0c;客户表包含所有客户的…

本地使用okhttp3发送请求,最多只能发5个/64个请求的限制问题

文章目录 一丶问题二丶原因三、解决方案 一丶问题 我个人的需求及业务场景描述起来比较麻烦&#xff0c;参考价值不高&#xff0c;不多赘述。 问题就是本地发送请求数量分别达到5个&#xff0c;64个的时候&#xff0c;后续的请求全部超时失败。 二丶原因 经过公司各位大佬的…