不出所料,自动驾驶向ChatGPT下手了!

 编辑 | 机器之心

点击下方卡片,关注“自动驾驶之心”公众号

ADAS巨卷干货,即可获取

ChatGPT 的技术思路与自动驾驶能碰撞出什么样的火花呢?

去年底,ChatGPT 横空出世。真实自然的人机对话、比拟专家的回答以及一本正经的胡说八道,使它迅速走红,风靡全世界。

不像之前那些换脸、捏脸、诗歌绘画生成等红极一时又很快热度退散的 AIGC 应用,ChatGPT 不仅保持了热度,而且还有全面爆发的趋势。现如今,谷歌、百度的 AI 聊天机器人已经在路上。

8430c51bafb944b250a5a66d64d08844.png

比尔盖茨如此盛赞:「ChatGPT 的意义不亚于 PC 和互联网诞生。」

为什么呢?

首先,人机对话实在是刚需。人工智能技术鼻祖的图灵所设计的「图灵测试」,就是试图通过人机对话的方式来检验人工智能是否已经骗过人类。能从人机问题中就能获得准确答案,这可比搜索引擎给到一大堆推荐网页和答案更贴心了。要知道懒惰乃人类进步的原动力。

其次,ChatGPT 实在是太能打了。不仅在日常语言当中,ChatGPT 能够像人类一样进行聊天对话,还能生成各种新闻、邮件、论文,甚至进行计算和编写代码,这简直就像小朋友抓到一只「哆啦 A 梦」—— 有求必应了。

除了看看热闹,我们也可以弱弱地问一句:ChatGPT 为啥这么能打呢

ChatGPT:我手握大模型,还会「杠」人类

先看一个「不要你以为,我要我媳妇以为」的例子。

之前,人类在和 ChatGPT 对话的时候,可以搬出「我媳妇这么说的」,「我媳妇说的…… 不会错」的时候,它就在稍微坚持之后就认怂并修改自己的回答。

d29f1c8e4a864c2076fbc230817e0dfc.png

但是经过了大量训练,ChatGPT 开始变得十分硬气。无论你是否搬出自己媳妇,它都会坚持真理,2+2 就是等于 4 了,管你是不是个「妻管严」,它都不会妥协了。

b6c2a1737d4567de25955fc4c08aa2ba.png

原来是 ChatGPT 被回炉重造,进行了一番真实性和数学能力的专门训练。反过来说,ChatGPT 是可以被人类带偏的。

那为啥呢?先来回答 ChatGPT 到底是个啥?它是个基于上千亿超大语料参数组成的 GPT3.0 架构训练出来的一个自然语言处理聊天工具。ChatGPT 的算法采用了 Transformer 神经网络架构,具有很好的时序数据处理能力,说大白话就是能很好处理上下文的语法关系。

Transformer 是一种结构简单的编解码器,几乎可以无限堆叠,从而形成一种大规模的预训练语言模型。基于 Transformer 模型构成的 GPT 架构可以很好地完成多种语言处理任务,填空、造句、分段、翻译等等,随着数据集和模型参数的大规模增长,等到 GPT3.0 的时候已经有了千亿规模,GPT 就表现出来了非常强的文本生成能力。

自然而然,一问一句的对话模式也就应运而生了。但 GPT3.5 还不是 ChatGPT。

2e6df47ad9ae71776bbbd07989f3e685.png

ChatGPT 还需要使用监督学习和强化学习来实现。具体来说,ChatGPT 使用了一种叫「人类反馈强化学习(RLHF)」的训练方法,在训练中可以根据人类反馈,保证对无益、失真或偏见信息的最小化输出。

简单来说,GPT 只能保证有问就有答,不保证回答的正确,而 ChatGPT 既要保证有的聊,还要保证聊的对。就跟小孩子一样,必须在大人一遍遍纠正发音、纠正语法和用词的训练中,学会真正的有效对话。

ChatGPT 就是利用人类反馈进行强化学习的产物。

既然 ChatGPT 这么好用。我们不妨来问它一个问题:能不能把 ChatGPT 用在自动驾驶技术训练当中?答案是:可以

毫末顾维灏:把 ChatGPT 引入自动驾驶,毫末走了这三步

我估计 ChatGPT 还没涉猎过这个问题,因为关于 ChatGPT 和自动驾驶关联的内容是缺少的。不过,如果 ChatGPT 最近在中文网络中收录过相关报道的话,那么,它就会知道中国的一家人工智能技术公司已经开始思考这个问题了。

在 1 月的毫末智行的 AI DAY 上,毫末 CEO 顾维灏非常隆重地提到了 ChatGPT,并且直言,毫末已经展开对于 ChatGPT 背后的技术的研究。

顾维灏说:「实现 GPT3 到 ChatGPT 的龙门一跃最重要的是 ChatGPT 模型使用了『利用人类反馈强化学习 RLHF』的训练方式,更好地利用了人类知识,让模型自己判断其答案的质量,逐步提升自己给出高质量答案的能力。」

ad248d1415a8f70feef811e101c37a1b.png

那这对自动驾驶有什么启发呢?毫末认为,ChatGPT 的技术思路和自动驾驶认知决策的思路是不谋而合

毫末在认知驾驶决策算法的进化上分成了以下三个阶段:

  • 第一个阶段是引入了个别场景的端到端模仿学习,直接拟合人驾行为。

  • 第二个阶段是通过大模型,引入海量正常人驾数据,通过 Prompt 的方式实现认知决策的可控可解释。

d42d246e2ccceb774d28e13dd49ddd75.png

  • 第三个阶段就是引入了真实接管数据,在其中尝试使用「人类反馈强化学习(RLHF)」。一般来说,人类司机的每一次接管,都是对自动驾驶策略的一次人为反馈;这个接管数据可以被简单当成一个负样本来使用,就是自动驾驶决策被纠正的一次记录。同时也可以被当作改进认知决策的正样本来学习。

为此,毫末构建了一个 < 旧策略、接管策略、人工 label 策略 > 的 pairwise 排序模型。基于这个模型,毫末构建了自动驾驶决策的奖励模型(reward model),从而在各种情况下做出最优的决策。

cd8e9e61445d084c1f6c27d4abba81e4.png

毫末将这一模型称之为人驾自监督认知大模型。简单来说,就是为了让自动驾驶系统能够学习到老司机的优秀开车方法,让毫末的认知大模型要从人类反馈中学会选择和辨别,并稳定地输出最优解。通过这种方式,毫末在掉头、环岛等公认的困难场景,通过率提升 30% 以上。

94098373a8178a516656a48e94b20413.png

当然,如果 ChatGPT 再继续搜索和学习下去,它就会知道在 1 月初的 HAOMO AI DAY 上,毫末不仅发布了这个人驾自监督大模型,还一口气发布了另外四个大模型。这五个大模型可以帮助毫末实现车端感知架构跨代升级,将过去分散的多个下游任务都集成到一起,形成一个更加端到端架构,包括红绿灯、局部路网、预测等任务,实现跨代升级。

总得来说,人工智能技术是当前许多旧产业的改造器,也是新产业的助力器。正如当年互联网喊出的「所有行业都要被互联网重塑一番」一样,今天的一切行业都要被「AI+」改造一番。

而实际上,人工智能的这场变革并不是必然发生,它有赖于一个天才算法结构的横空出世,有赖于海量数据和算力的成本下降与容易获得,也依赖于人工智能技术从业者的勇敢尝试。ChatGPT 的出现是如此,自动驾驶的实现也是如此。

国内首个自动驾驶学习社区

近1000人的交流社区,和20+自动驾驶技术栈学习路线,想要了解更多自动驾驶感知(分类、检测、分割、关键点、车道线、3D目标检测、多传感器融合、目标跟踪、光流估计、轨迹预测)、自动驾驶定位建图(SLAM、高精地图)、自动驾驶规划控制、领域技术方案、AI模型部署落地实战、行业动态、岗位发布,欢迎扫描下方二维码,加入自动驾驶之心知识星球,这是一个真正有干货的地方,与领域大佬交流入门、学习、工作、跳槽上的各类难题,日常分享论文+代码+视频,期待交流!

6fb233c6f8d1de5a9e3246cf6db0a035.jpeg

自动驾驶之心】全栈技术交流群

自动驾驶之心是首个自动驾驶开发者社区,聚焦目标检测、语义分割、全景分割、实例分割、关键点检测、车道线、目标跟踪、3D目标检测、BEV感知、多传感器融合、SLAM、光流估计、深度估计、轨迹预测、高精地图、NeRF、规划控制、模型部署落地、自动驾驶仿真测试、硬件配置、AI求职交流等方向;

35907b6379ed41b40342dd0557e8a8eb.jpeg

添加汽车人助理微信邀请入群

备注:学校/公司+方向+昵称

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10424.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT来袭,法律人真的要失业了吗?

当老婆和妈妈同时掉水里&#xff0c;你先救谁&#xff1f; “我认为应该先救妈妈&#xff0c;因为妈妈是孩子的母亲&#xff0c;她是孩子的第一份爱&#xff0c;也是孩子的精神支柱&#xff0c;孩子的成长离不开妈妈的关爱和支持&#xff0c;而老婆也是孩子的母亲&#xff0c;…

【AI简报第20230210期】 ChatGPT爆火背后、为AIoT和边缘侧AI喂算力的RISC-V

1. ChatGPT爆火背后&#xff1a;AI芯片迎接算力新挑战 原文: https://www.163.com/dy/article/HT7BHN3C05199NPP.html ChatGPT的出圈走红为AIGC打开全新市场增量&#xff0c;催生了更高的算力需求。 作为人工智能三大核心要素之一&#xff0c;算力也被誉为人工智能“发动机”。…

港科大开源LMFlow!3090单卡5小时,每个人都能训练专属ChatGPT

©作者 | 机器之心编辑部 来源 | 机器之心 拥有自己的 AI 大模型&#xff01;开源项目 LMFlow 支持上千种模型&#xff0c;提供全流程高效训练方案。 2022 年 11 月 30 日&#xff0c;OpenAI 推出 ChatGPT&#xff0c;令人没想到的是&#xff0c;这个对话模型在 AI 圈掀起一…

3090单卡5小时,每个人都能训练专属ChatGPT,港科大开源LMFlow

关注并星标 从此不迷路 计算机视觉研究院 公众号ID&#xff5c;ComputerVisionGzq 学习群&#xff5c;扫码在主页获取加入方式 代码地址&#xff1a;https://github.com/jameelhassan/PoseEstimation 计算机视觉研究院专栏 作者&#xff1a;Edison_G 拥有自己的 AI 大模型&…

只需单卡5小时,每个人都能训练专属ChatGPT,LMFlow 来啦!

来源&#xff1a;机器之心 2022 年 11 月 30 日&#xff0c;OpenAI 推出 ChatGPT&#xff0c;令人没想到的是&#xff0c;这个对话模型在 AI 圈掀起一股又一股讨论狂潮。英伟达 CEO 黄仁勋将其比喻为人工智能领域的 iPhone 时刻&#xff1b;比尔・盖茨盛赞 ChatGPT 在人工智能历…

ChatGPT在意大利被禁用!

点击下方卡片&#xff0c;关注“CVer”公众号 AI/CV重磅干货&#xff0c;第一时间送达 点击进入—>【计算机视觉】微信技术交流群 转载自&#xff1a;机器之心 | 编辑&#xff1a;泽南 意大利的行动开了一个先例。 ChatGPT 最近陷入了有关安全问题的争议。 在意大利政府数据…

ChatGPT会被禁止吗?为什么?

由于ChatGPT本身的技术特点和不足&#xff0c;根据最近新出炉的管理办法&#xff0c;chatgpt差不多已经是不合规的了。第四条 提供生成式人工智能产品或服务应当遵守法律法规的要求&#xff0c;尊重社会公德、公序良俗&#xff0c;符合以下要求&#xff1a;&#xff08;一&…

登录ChatGPT时提示Sorry, you have been blocked(对不起,您已被阻止)

问题描述 今天想使用ChatGPT&#xff0c;结果突然来了这么个问题&#xff0c;就问你吓不吓人&#xff1f;&#xff1f;&#xff1f;我以为我的账号被封了&#xff01; 原因分析 内容过滤&#xff1a;某些平台或网站可能使用内容过滤系统&#xff0c;该系统可能将AI语言模型视…

chatGPT衣食住行10种场景系列教程(01)chatGPT热点事件+开发利器

导读 时隔5个多月&#xff0c;chatGPT可谓是一日千里&#xff0c;越演越火&#xff0c;携带着AIGC行业一起飞了起来&#xff0c;那么在短短5个月当中有那些值得我们关注的事件&#xff1f;有那些好玩的场景&#xff1f;以及有那些chatGPT好用的工具&#xff1f;本文都将一一告…

日常自用干货网站分享(含gpt相关)

日常自用干货网站分享 图片,视频,音乐素材Word,Pdf等格式转换压缩PPT,Word,Excel模板文案,设计,创意gpt相关 小伙伴们下午好&#xff0c;作为一名程序员&#xff0c;相信大家平时在工作中不仅仅只有编码&#xff0c;一切其他的文档编写&#xff0c;格式转换或ppt讲解方案等等都…

搭建域名转发实现gpt3.5的请求

1.注册openai账号&#xff0c;需要海外手机&#xff0c;网上都有不做过多解释 2.https://www.namesilo.com/ 购买个廉价域名用于转发 3.https://dash.cloudflare.com/ 搭建转发配置&#xff0c;快速编辑并部署&#xff0c;##代码在下面直接粘就行 const TELEGRAPH_URL https…

深度学习神经网络学习笔记-多模态方向-04-Video Description: A Survey of Methods, Datasets and Evaluation Metrics

摘要 视频描述是描述给定视频内容的自然语言句子的自动生成。它在人机交互、帮助视障人士和视频字幕等方面都有应用。过去几年&#xff0c;由于深度学习在计算机视觉和自然语言处理方面取得了前所未有的成功&#xff0c;这一领域的研究激增。文献中已经提出了许多方法、数据集…

苹果起诉微软侵犯版权 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」&#xff0c;从过去看未来&#xff0c;从现在亦可以改变未来。 今天是 2023 年 3 月 17 日&#xff0c;在 1958 年的今天&#xff0c;我国第一台黑白电视机诞生。当时&#xff0c;我国电视机研制技术与日本基本处在同一起跑线&#xff0c;是…

知识类问答数据集资源对外开放:百万级百度知道、社区问答及六大领域级小规模语料概述

随着chatgpt的火热&#xff0c;中文知识类问答数据集由收到诸多关注&#xff0c;其作为高质量的QA数据&#xff0c;可以用于SFT阶段以及pretrain预训练阶段。 本文主要介绍目前开源可下载的两个较大规模的知识类数据集&#xff0c;包括147万百度知道知识类数据集、425万社区问…

怎样一元钱部署自己的AI网站

前段时间我开发了一个简洁的AI问答网站&#xff0c;好多朋友感兴趣&#xff0c;因此我将网站代码在github上开源&#xff0c;并编写此教程&#xff0c;帮助大家快速部署自己的AI网站&#xff0c;会编程的朋友们也可在此基础上定制开发。 前提条件&#xff1a;有自己的ChatGPT账…

NLP(五十六)LangChain入门

LangChain简介 背景 由于ChatGPT的发行&#xff0c;大模型&#xff08;Large Language Model, LLM&#xff09;已经变得非常流行了。也许你可能没有足够的资金和计算资源从头开始训练大模型&#xff0c;但你仍然可以使用大模型来做一些比较酷的事情&#xff0c;比如&#xff1…

大致聊聊ChatGPT的底层原理,实现方法

文目录 深度学习基础ChatGPT的本质ChatGPT原理详解 一、深度学习基础 — 深度学习是什么&#xff1f;如何理解神经网络结构&#xff1f; 关于生物神经网络结构如下&#xff1a; 神经网络介绍 人工神经网络&#xff08; Artificial Neural Network, 简写为ANN&#xff09;也…

互发短信之SmsManager

短信管理器 : SmsManager 1. 在 Android 2.0 以前 应该使用 android.telephony.gsm.SmsManager 之后应该用 android.telephony.SmsManager; 2. 获取系统默认的短信管理器 SmsManager smsManager = SmsManager.getDefault(); 3. 按照每条短信最大字数来拆分短信 List<S…

手机号短信验证码接口

1.1 注册账号 https://www.yuntongxun.com/user/login 1.2 登录即可看到开发者账号信息 1.3 添加测试账号 2.使用容联云发送代码测试 1. 安装容联云sdk pip install ronglian_sms_sdk # 免费测试文档地址:https://doc.yuntongxun.com/p/5a531a353b8496dd00dcdfe22. 短信发送…

sms收发手机短信

这几天在试VS2005里面的SerialPort 类,这个类主要功能是串口通信,以前没接触串口这方面的知识,一开始还比较吃力,还好现在清楚了大半利用这个类做了一个sms收发手机短信的demo,我又重新把这个类封装了下,里面增加了PDU编码和解码的方法,这样可以直接调用封装后的类发送和接收中…