轻松客观认识大模型系列:一

这是我关于《轻松客观认识大模型系列》第一篇

一、前言

这篇文章旨在为没有计算机科学背景的读者提供一些关于ChatGPT及其类似的人工智能系统(如GPT-3、GPT-4、Bing Chat、Bard等)如何工作的原理。ChatGPT是一种聊天机器人,建立在一个大型语言模型之上,用于对话交互。这些术语可能比较晦涩难懂,我将对其进行解释。同时,我们将讨论它们背后的核心概念,而且本文并不需要读者具备任何技术或数学方面的背景知识。我们将大量使用比喻来解释相关概念,以便更好地理解它们。我们还将讨论这些技术的意义,以及我们应该期待或不应该期待大型语言模型如ChatGPT所能做的事情。

接下来我们将以尽可能不使用专业术语的方式,从基础的“什么是人工智能”开始,逐步深入讨论与大型语言模型和ChatGPT相关的术语和概念,并将使用比喻来解释它们。同时,我们也将谈论这些技术的意义,以及我们应该期待它们能够做什么或不应该期待它们能够做什么。

二、什么是人工智能

首先,让我们从一些基本术语开始,这些术语你可能经常听到。那么什么是人工智能呢?

人工智能:指一种能够表现出类似于人类所认为的智能行为的实体。用“智能”来定义人工智能有些问题,因为“智能”本身并没有一个清晰的定义。但是,这个定义仍然比较恰当。它基本上意味着,如果我们看到一些人造的东西,它们能够进行有趣、有用、看起来有一定难度的行为,那么我们可能会说它们具有智能。例如,在电脑游戏中,我们通常称计算机控制的角色为“AI”。这些角色大多是基于if-then-else代码的简单程序(例如,“如果玩家在射程范围内,则开火,否则移动到最近的石头后躲藏”)。但是,如果这些角色可以保持我们的参与度和娱乐性,同时不做任何显然愚蠢的事情,那么我们可能会认为它们比实际上更为复杂。

一旦我们了解了某个东西的工作原理,我们可能就不会觉得它很神奇,而是期望在幕后有更为复杂的东西。这完全取决于我们对幕后发生的事情的了解程度。

重要的一点是,人工智能不是魔术。因为它不是魔术,所以它是可以被解释的。

三、 什么是机器学习

另一个与人工智能经常相关联的术语是机器学习。

机器学习:一种通过收集数据、形成模型,然后执行模型的方式来创建行为的方法。有时候,手动创建一堆if-then-else语句以捕捉某些复杂现象(比如语言)是很困难的。在这种情况下,我们尝试找到大量数据,并使用能够在数据中找到模式的算法进行建模。

那么什么是模型呢?模型是某种复杂现象的简化版本。例如,汽车模型是真实汽车的更小、更简单版本,它具有真实汽车许多属性,当然并不意味着要完全替代原始版本。模型汽车可能看起来很真实,在实验的时候很有用。

image-1683548234500

就像我们可以制造一个更小、更简单的汽车一样,我们也可以制造一个更小、更简单的人类语言模型。我们使用“大型语言模型”这个术语,因为这些模型从需要使用的内存(显存)量的角度来看是非常大的。目前生产中最大的模型,例如ChatGPT、GPT-3和GPT-4,非常庞大,需要运行在数据中心服务器上的超级计算机才能创建和运行。

四、什么是神经网络

有很多方法可以通过数据来学习一个模型,其中神经网络就是其中一种方法。这种技术大致基于人脑的结构,人脑由一系列互相连接的神经元组成,神经元之间传递电信号,使我们能够完成各种任务。神经网络的基本概念在20世纪40年代就已经被发明了,如何训练神经网络的基本概念则是在20世纪80年代发明的,当时神经网络非常低效,直到2017年左右计算机硬件升级,我们才可以大规模地使用它们。

但是,个人比较喜欢用电路的隐喻来模拟神经网络。通过电阻、电流经过电线的流动,我们可以模拟神经网络的工作。

想象一下我们想要制作一辆可以在高速公路上行驶的自动驾驶汽车。我们在车的前、后和两侧装上了距离传感器。当有物体接近时,距离传感器会报告一个值为1的数值,而当附近没有可检测的物体时,传感器会报告一个值为0的数值。

我们还安装了机器人操作方向盘,踩刹车和加速。当油门接收到1的数值时,它使用最大的加速度,而0的数值意味着没有加速。同样,发送给制动机构的数值为1意味着紧急刹车,而0则意味着没有制动。转向机构接受-1到+1之间的数值,负数表示向左转,正数表示向右转,而0表示保持直线行驶。

当然我们必须记录驾驶的数据。当前方的道路清晰时,你会加速。当前方有汽车时,你会减速。当一辆汽车从左侧靠得太近时,你会向右转向并变换车道,当然,前提是右侧没有车。这个过程非常复杂,需要根据不同的传感器信息组合进行不同的操作(向左或向右转,加速或减速,制动),因此需要将每个传感器都连接到每个机器人机构上。

image-1683548252771

当你开车上路时会发生什么?电流从所有传感器流向所有机器人执行器,车辆同时向左转、向右转、加速和刹车。会形成一团乱麻。

拿出电阻器并开始将它们放在电路的不同部分,以便电流可以在某些传感器和某些机械臂之间更自由地流动。例如,我们希望电流能够从前方接近传感器更自由地流向刹车而不是转向机构。我们还安装了称为门的元件,直到足够的电荷积累以触发开关之前,电流才会停止流动(只有在前方和后方的接近传感器都报告高数字时才允许电流流动),或者仅在输入电强度较低时向前发送电能(当前方接近传感器报告低值时向加速器发送更多电力)。

但是我们应该在哪里放置这些电阻器和门呢?我也不知道。随机地将它们放在各个位置。然后再试一次。也许这次汽车开得更好,这意味着它有时会在数据表明最好刹车和转向等时刹车和转向,但它并不是每次都正确。而有些事情它做得更糟糕(在数据表明有时需要刹车时它加速了)。因此,我们不断地随机尝试不同的电阻器和门的组合。最终,我们会偶然发现一个足够好的组合,那么我们宣布成功。比如下面这个组合:

image-1683548266697

(实际上,我们不会添加或删除门,但我们会修改门,使其可以以较低的能量从下方激活,或者需要更多的能量从下方输出,或者只有在下方有非常少的能量时才释放大量的能量。机器学习是纯粹主义者,可能会对这种描述感到不舒服。技术上,这是通过调整门上的偏置来完成的,这通常不会在此类图示中显示,但从电路隐喻的角度来看,它可以被认为是一个插入直接连到电源的线缆,可以像所有其他线缆一样进行修改。)

随意尝试并不好。一个名为反向传播的算法在改变电路配置方面具有相当不错的猜测能力。算法的细节并不重要,只需知道它会微调调整电路以使其行为更接近于数据所建议的行为,经过成千上万次的微调,最终可以得到与数据相符的结果。

我们称电阻器和门为参数,因为实际上它们无处不在,而反向传播算法所做的是宣布每个电阻器更强或更弱。因此,如果我们知道电路的布局和参数值,整个电路可以在其他汽车上复制。

敬请观看《轻松客观认识大模型系列》第二篇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13946.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【综述专栏】“ChatGPT的问题、风险与机遇”会议综述

来源:清华大学智能法治研究院 在科学研究中,从方法论上来讲,都应“先见森林,再见树木”。当前,人工智能学术研究方兴未艾,技术迅猛发展,可谓万木争荣,日新月异。对于AI从业者来说&am…

利用ChatGPT来学习Power BI

学习Power BI,或者说学习微软的相关产品的时候,最讨厌的就是阅读微软的官方文档,写的真的太硬了,有时候实时是啃不动,只能说不愧是巨硬。 但是,我们现在有AI帮忙了啊,ChatGPT3都通过了谷歌L3工…

如何用ChatGPT协助搭建品牌视觉体系(VI)?

该场景对应的关键词库(18个): VI体系、品牌、目标市场、品牌DNA、人群特征、设计理念、标志设计、配色方案、字体选择、图形元素、价值观、形象、客户经理、需求、品牌定位、目标受众、主色调、辅助色 提问模板(2个)&…

用Python代码画chatGPT的LOGO

文章目录 简介代码运行效果备注 简介 用python代码画chatGPT的LOGO,仅使用turtle库。如下: 绘画过程可以在下列平台查看: 抖音:用代码画chatGPT的logo b站:用代码画chatGPT的logo_哔哩哔哩_bilibili 代码 # codin…

2023,AIGC能赚到钱吗?

2022年,AIGC(生成式AI)是当之无愧的网红。 AI作画在各大社交平台刷屏,ChatGPT火爆国内外出尽了风头,依靠AI生成语音和表情、动作的数字人也频频露脸。2022年12月,Science杂志发布了2022年度科学十大突破&am…

跳出零和博弈,AIGC是元宇宙的“催命符”还是“续命丹”?

文 | 智能相对论 作者 | 青月 从科幻小说《雪崩》里走出来的元宇宙,如今正在上演“地价雪崩”。 CoinGecko的一项调查显示,Otherdeed for Otherside、The Sandbox、Decentraland、Somnium Space和Voxels Metaverse 这五款知名元宇宙土地价格近期均出现…

人工智能落地新范式:“大模型+”

7月8日,在2023世界人工智能大会(下称WAIC)上,一位参展商透露——“大模型”,是绕不开的主题。为期3天的大会,每场会议都有关于大模型的话题,每个论坛都离不开围绕大模型的讨论,国内A…

元宇宙退潮,人工智能起飞,大厂 Al 新赛点在哪?

作者 | 何苗 出品 | CSDN(ID:CSDNnews) 自去年底至今,多个企业在近期缩减元宇宙业务,如今ChatGPT有多火爆,上一任科技“网红”元宇宙就显得有多落寞。在大厂集体撤退元宇宙之后,似乎纷纷…

【饭谈】你是不是最近很少玩chatGPT了?AI泡沫可能要碎呀~

从三月份左右突然大火的chatGPT,席卷了全球后,带动了一大批的行业和造富运动。全世界人民为之疯狂,连我乡下的大婶都天天研究gpt,并为此付出了几千块的学费。 一晃,四个月过去了.... 猛然之间我发现,好像…

九龙证券|下阶段市场主线逐渐浮现 资金偏好或转向中大盘成长股

上星期,“中字头”基建股连续大幅攀升,成为带动沪指站稳3300点的主要力量。与此一起,前期火热的题材股则呈现退潮,例如部分ChatGPT概念股高位回撤,新动力概念也继续低位运行,资金呈现“以大为美”的特征。 …

不做XR业务,腾讯如何做元宇宙?

作者 | 刘然 来源 | 洞见新研社 腾讯的XR业务,沦为弃子。 去年6月份成立,到目前不足1年的腾讯XR(混合现实)部门,在今年一月份开始陆续退场,其XR部分业务开始暂停。有媒体报道,2月16日下午&…

Potato家族提权学习

声明 出品|博客(ID:moon_flower) 以下内容,来自moon_flower作者原创,由于传播,利用此文所提供的信息而造成的任何直接或间接的后果和损失,均由使用者本人负责,长白山攻防实验室以及文章作者不承担任何责…

potato电脑版连接不上_potato chat正式版PC端安装教程

potato chat正式版PC端是一款非常优秀的聊天工具,potato chat正式版PC端具有快速、安全、云存储等特点,它支持主流的操作系统进行使用,也可选择您需要使用的平台,支持windows、mac、linux、ios、android、web多平台;软件的功能方面也比较的全面,支持多国语言进行使用,可…

PG::Potato

nmap -Pn -p- -T4 --min-rate1000 192.168.171.101 nmap -Pn -p 22,80,2112 -sCV 192.168.171.101 打开80端口未发现可利用的服务 尝试对路径爆破,同时FTP可匿名访问,查看FTP内是否有可用信息 dirb http://192.168.171.101 在FTP中得到了网站源码的…

python实现一个土豆聊天 potato chat 机器人

python实现一个土豆聊天 potato chat 机器人 一、下载安装1、 官网: [https://www.potato.im/](https://www.potato.im/), 下载对应版本的程序 二、创建机器人1、创建机器人注册开发者注册开发者成功后,创建机器人 2、获得token设置允许您的机…

ios跳转到potato群聊

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_43299553/article/details/84632269 首先贴代码: NSString *url [NSString stringWithFormat:"pt://join?invite202cb962ac59075b964b07152d234b70…

ChatGPT | LangChain的文本切割方法对比

本文来自http://blog.csdn.net/hellogv/ ,引用必须注明出处! ChatGPT面向对话格式的文本理解很好,但如果要把网络上的文章让ChatGPT直接分析则会有格式的问题。文本清洗是个大课题,讲起来需要很多篇幅,优化起来前路漫…

ChatGPT确实有一种即时学习的能力

以下是ChatGPT即时纠正自己错误的一段对话,大家发现了什么没有,欢迎评论。 再次回答时,它立即更正了自己之前的错误; 提问中的个别错别字并没有影响到它对问题的理解; 再次回答时并没有重复第一次回答中的大部分内容&a…

ChatGPT办公应用:制作PPT大纲

正文共 617字,阅读大约需要 4 分钟 解决方案专家必备技巧,您将在4分钟后获得以下超能力: 制作PPT大纲 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐人 | Kim 编辑者 | Yuke PPT技能是一…

chatgpt赋能python:Python抢单软件:如何优化SEO?

Python抢单软件:如何优化SEO? 导言 随着互联网技术的飞速发展,越来越多的人开始关注SEO(Search Engine Optimization)技术。而对于Python编程工程师来说,了解SEO技术也是非常重要的。那么,如何…