一文理解GPT及向ChatGPT提问的技巧

一、什么是ChatGPT?

人工智能已成为当今科技领域的一大热门话题。随着深度学习的快速发展,OpenAI团队在其GPT(Generative Pre-trained Transformer)模型的基础上,推出了ChatGPT,这是一种革命性的大型语言模型,为人们提供了一种全新的与计算机进行对话的方式。

ChatGPT从字面上可以分解成两个词Chat+GPT。Chat是聊天的意思,GPT是Generative Pre-trained Transformer的缩写,生成式预训练语言模型,使用Transformer架构来处理自然语言处理(NLP)任务。说人话就是能够通过理解和学习人类的语言来进行对话,使其能够生成与输入语句相匹配的自然语言响应。它使用了海量的文本数据进行预训练,涵盖了互联网上的网页、书籍、论文等丰富资源,从而掌握了丰富的语法、语义、常识和上下文理解能力。可以真正像人类一样来聊天交流,能完成撰写邮件、视频脚本、文案、翻译、代码 ,写论文 等任务。

总结一下就是它有大量的训练语料,超大规模的训练参数(上千亿),能自己生成内容(注意这里不是检索,所以你会发现每次向GPT提问同样的问题,得到的答案都是不一样的)。就算一个它不知道的东西,它都可以根据已掌握的数据,生成一个答案,虽然有时候可能在胡说八道,从这个角度,确实已经很像人类了。

二、ChatGPT有什么特性?

ChatGPT具备许多令人兴奋的特性,使得它成为当今领域内备受瞩目的创新。主要的特点有:

  1. 根据上下文理解问题

ChatGPT展现了强大的上下文理解能力,可以深入理解对话的背景,并提供准确的回答。这使得对话更加连贯,用户可以轻松进行复杂的交流,无需重复提供背景信息。

  1. 提供答案与解决方案

ChatGPT擅长回答各种问题,无论是实际知识、推理还是其他领域的问题,都能给出相应的回答并提供有用的解决方案。

  1. 持续学习与进化

ChatGPT具备学习能力,能够从大量数据中不断吸收新知识,并将其应用于对话和问题的回答中。这使得ChatGPT能够跟上时代的发展,逐渐变得更加智能和准确。

  1. 多语言支持,全球交流

ChatGPT可以使用多种语言进行对话,包括中文、英文、西班牙语、法语和日语等。它能够流利地进行交流,满足全球用户的需求。

  1. 理解复杂问题,简单解释

ChatGPT具备处理复杂问题的能力,并以简单易懂的语言解释和回答。即使是看似复杂或专业的问题,ChatGPT也能够以用户友好的方式解释,使用户更容易理解。

  1. 广泛应用

由于其出色的性能和灵活性,ChatGPT适用于各种场景。无论是智能家居、智能客服还是其他领域,ChatGPT都能够帮助人们解决问题,并提供高质量的交互体验。

四、如何与ChatGPT对话,Prompt是什么?

遇事不决,先问GPT。我们先问一下ChatGPT,Prompt是什么?

什么是prompt

我们来简单概括一下ChatGPT的回答,Prompt 就是提示工程(Prompt Engineering)是指在使用自然语言处理(NLP)模型(例如 GPT-4)时,设计和优化输入文本(即提示)的过程。这一过程旨在更有效地引导模型生成所需的输出结果。提示工程的关键在于提高模型的表现,使其更准确、有趣或符合特定上下文要求。

好了,那如何才能写出清晰的Prompt呢?让他能理解我们的问题,给出高质量的答案。就像与人沟通其实也是有很多技巧学问的,同样的,其实跟ChatGPT沟通也是有一些规律、模版是可以遵循的。

五、如何写出清晰的Prompt?

  1. 用清晰明确的语言表达问题

    就像人与人之间的沟通一样,需要用清晰明确的语言表达问题,它就会给我们简明扼要的答案。避免重复含糊不明确的词汇和句子。

    对比以下案例:

    较差的prompt❌更好的prompt✅
    总结会议记录总结会议记录,用markdown的格式列出每个发言者和他们的主要观点,并且在最后列出发言者建议的后续步骤或行动
    写一篇关于XX产品的种草日记写一篇关于XX产品的种草日记,要求:从产品使用体验的角度,有哪些优点和缺点,以第一人称写作,让人有购买的欲望
  2. 给ChatGPT设定身份

    给ChatGPT设定一个相应的回复者身份,它可以模仿这个身份来更好的回答你的提问。设定身份的同时最好包括身份、任务和约束三个元素

    较差的prompt❌更好的prompt✅
    我怎么反驳对方,关于『xxx』我希望你能担任辩论教练。我将为你提供一个辩论队和他们即将进行的辩论的议题。你的目标是为团队的成功做好准备,组织练习回合,重点是有说服力的演讲,有效的时间策略,反驳对方的论点,并从提供的证据中得出深入的结论。

    右边的提示词包含的3个元素分别是:

    身份 - 辩论教练

    约束 - 一个辩论队和他们即将进行的辩论的议题

    任务 - 为团队的成功做好准备,组织练习回合,重点是有说服力的演讲,有效的时间策略,反驳对方的论点,并从提供的证据中得出深入的结论。

  3. 提供示例或喂相关数据

    比如你想让它用鲁迅的写作风格给你写一段文字, 你可以先提供一些鲁迅的文章发送给它。

  4. 使用分隔符清晰标示输入的不同部分

    如使用 “”“三重引号”“” 、<XML标记> 、章节标题等有助于划分需要区别对待的文本部分。

    示例:

    将以下由三重引号包含的文本总结为一句话。 “”“在这里插入文本”“”

  5. 告诉ChatGPT完成任务所需要的步骤

    有些任务最好指定为一系列步骤。明确的写出步骤可以使ChatGPT更容易遵循这些步骤。

    示例:

    按照以下逐步说明来响应用户输入。

    第1步 - 用户将用三重引号提供文本, 以『总结:』作为前缀 ,用一句话总结这段文字。

    第2步 - 将第1步的摘要翻译成中文 , 前缀为『翻译:』。

  6. 指定ChatGPT回复输出内容的长度

    可以要求ChatGPT生成具有给定目标长度的输出。可以根据字数、句子、段落、项目符号等的数量来指定目标输出长度。

    💡 注意:指示ChatGPT生成特定数量的单词并不能实现高精度,绝大多数情况下都有误差,我猜可能和Token数有关

    示例:

    ✅ 将以下由三重引号包含的文本总结为100个字。 “”“一段文本”“”

相信你掌握了以上6个最佳实践技巧, 对ChatGPT的使用已经很熟悉啦~

不过,任何一个技巧、模版都不可能是万能的,很多时候,模版或技巧确实可以帮我们快速的达到及格线的水平,但是如果一直靠这些花里胡哨的东西,你永远也不可能成为一个行业顶尖的人才。很多东西是需要大家下苦功夫,在实战中一点点慢慢摸索出来的。实践才是检验真理的唯一标准。

七、大模型发展这么久,为什么到GPT3.5才具有了真正的智能?

GPT(Generative Pre-trained Transformer)生成式预训练语言模型。也就是这个语言模型是基于Transformer的,Transformer是一种基于注意力机制的神经网络模型,最早由谷歌公司提出,其最初目的是用于自然语言处理任务,如机器翻译、文本摘要、语音识别等。相比于传统的循环神经网络模型,如LSTM和GRU,Transformer模型具有更好的并行化能力和更短的训练时间,在处理长序列任务方面表现出色,因此在自然语言处理领域得到了广泛应用。

其实GPT不是OpenAI公司的原创,而是由谷歌公司发明。是不是跟当年操作系统的图形用户界面其实是施乐公司最新发明的,却被乔布斯窃取到并应用到苹果的系统上一样。包括后来的iphone手机,大家也可以搜一下,其实所有的设计都是借鉴了其他公司的产品,但是乔布斯把他们组合并创新成了一件最伟大的艺术品,从而开启了一个全新的移动互联网时代,所以有时候并不一定什么都要原创,站在巨人的肩膀上来微创新,有时候更容易出成果。

上面扯的有点远了,我们回到为什么GPT3.5才算真正的人工智能这个问题上。

2018 年 OpenAI 采用 Transformer Decoder 结构在大规模语料上训练了 GPT1 模型,揭开了NLP模型预训练+微调的新范式。2019 年,OpenAI 提出了 GPT2,GPT2 拥有和 GPT1 一样的模型结构,但得益于更多和更高的数据质量以及新引入的多任务学习方式,语言生成能力得到大幅提升。之后由于 GPT 采用 Decoder 单向结构天然缺陷是无法感知上下文,Google 很快提出了 Encoder 结构的 Bert 模型可以感知上下文,效果上也明显有提升,同年 Google 采用Encoder-Decoder 结构,提出了 T5 模型,从此大规模预训练语言模型朝着三个不同方向发展。

也就是说在GPT3.0之前,谷歌的Bert 模型是远超OpenAI 的GPT模型的。这里补充一个知识点,GPT3.0之前都是开源的,OpenAI由于一些商业等多方面的考虑,从GPT3.5开始,模型都是闭源的。

直到2020 年 OpenAI 提出了 GPT3 将 GPT 模型提升到全新的高度,其训练参数达到了 1750 亿,训练语料超45TB,自此GPT系列模型的数据飞轮便转动起来,超大模型时代开启, NLP 任务走向了预训练+情境学习新路线。由于 GPT3 可以产生通顺的句子,但是准确性等问题一直存在,于是出现了InstructGPT、ChatGPT 等后续优化的工作,通过加入强化学习模式实现了模型可以理解人类指令的含义,会甄别高水准答案,质疑错误问题和拒绝不适当的请求等。

从GPT3.5,GPT突然涌现出了“乌鸦”能力,之前的都可以理解成量变,一种鹦鹉学舌的能力,并没有真正的智能。

可能是大力出奇迹,我感觉跟人脑是一个道理,一个神经元没啥智慧,一百万个、一百亿个可能也没啥智慧,不过增加到一千亿个神经元连接,突然就有智慧了,涌现出了能力。这是一件很玄学的事情,包括现在世界顶级的人工智能专业也无法解释这种现象,我们只能理解成大力出奇迹。

这里拿出一点篇幅来普及一下什么“鹦鹉学舌”的假人工智障,什么是拥有“乌鸦”能力的真人工智能

所谓鹦鹉学舌,就是东施效颦。没有GPT之前,几乎所有的自然语言处理都遵循着这一范式。他没有真的懂你的意思,只是一种模式匹配,比如之前的语音助手,只能识别有限的场景,比如你问他,帮我导航去天安门,他可以给你答案,但如果你让问他火星怎么去,他可能就回答不了你,因为他的数据库里没有这个问题的答案。也就是说,他只能回答在自己的数据库里有对应答案的问题,一旦你的问题超出了他的数据范围,他是没办法给你回复的。无法做到根据现有的数据生成新的数据,但是世界的问题千千万,不可能穷尽所有的可能把所有的问题答案都事先准备好,这也是之前的人工智能大家感觉并不智能的原因,因为他的底层实际上还是在做匹配。我举一个程序员都能理解的例子,比如你要实现一个不同条件得到不同结果的功能,我相信大部分程序员都是这样实现的。

  if($sex == '男' && $age < 18){echo "小男孩";}else if($sex == '女' && $age < 18){echo "小女孩";}else if($sex == '男' && $age >= 18 && $age <= 35){echo "小伙子";}else if($sex == '女' && $age >= 18 && $age <= 35){echo "小姑娘";}else{echo "老年人";}

如果新增了条件,还是要新增一堆的if else才能匹配更多的情况。

而乌鸦不一样,小时候我们读过乌鸦喝水的故事,乌鸦是有真正智慧的,他能真的读懂你要表达的意思。这里我们引用华人最厉害的AI学者之一朱松纯教授,在2017年写的一篇思考人工智能和智能本质的文章,通过这篇文章来理解乌鸦是如何感知、认知、推理、学习、执行的。

乌鸦如何感知、学习

乌鸦通过观察,自主串通了

  • 汽车能压碎坚果
  • 红绿灯能控制汽车
  • 车能撞死我

这三件事情,从而利用红绿灯和汽车,来帮自己达到“安全打开坚果”这一任务结果。

如果类比成机器学习模型,过往“鹦鹉学舌”范式的解法,是要求所有乌鸦可以共享一个大脑,它们有很清晰的优化目标,即“保住性命的前提下打开坚果”。它们的方式是,随机尝试所有事件的组合,并向着最优解的方向不断演化。

但现实世界的乌鸦无法共享大脑,也不能去冒着死亡风险去尝试所有可能。乌鸦只有一次机会,把观测到的两个现象,产生了一个新的可能性,并应用在一个全新的场景下。这里最接近的词汇可能是“inference”,是“基于证据和逻辑推演,得到结论”的过程,有的时候,还要加入很多猜测、抽象、泛化。举个例子,这篇文章把朱教授对于乌鸦的比喻,跟ChatGPT最本质的能力联系起来,就是在做inferencing这件事。

但很明显,inferencing不是乌鸦智能的全部。而且在机器学习领域里,inferencing特指使用训练好的深度学习模型来预测新的数据这一件事,会产生误解。其他词汇也有类似问题,所以我们在自己文章里,会直接使用“乌鸦能力”来指代ChatGPT的新能力。在对外交流时,我们没办法每次都把乌鸦能力是什么解释一遍,所以我们会用“理解”能力来进行指代。从“乌鸦”到“理解”,当然是一个信息量损失很大的过度概括。但是好处是可以把ChatGPT的本质能力凸显出来。过往互联网的两次能力跃进一次来自于搜索,一次来自于推荐,现在ChatGPT带来了“理解”,也非常有结构感。

最后,再给大家看一张图,让大家了解ChatGPT是如何一步步演化到目前的水平的:

演化

通过上图,大家可以看到:

  1. GPT-3.5通过InstructGPT的模式 + 阅读代码,涌现了“乌鸦”能力,产生了质变。但是还没找到合适的应用界面,也不符合人类喜好
  2. ChatGPT在RLHF的帮助下,找到了GPT-3.5和人类自然语言的合理接口,解锁了模型应用的前景

(以上关于鹦鹉学舌和乌鸦能力的例子引用自"课代表立正的文章")

这里解释几个专用名词:

InstructGPT:

ChatGPT的交互模式,让GPT的能力,更加贴近人类真实交互方式。在in-context learning基础之上,进一步降低了prompting的门槛;一定程度解决了GPT-3生成结果与用户期望不一致的非预期输出,大幅降低了有害的、错误或偏差的输出结果,让GPT更符合人类胃口

RLHF

ChatGPT背后的核心技术之一,让模型学习人类的偏好。全称是reinforcement learning from human feedback,通过构建人类反馈数据集,训练一个reward模型,模仿人类偏好对结果打分,是GPT-3后时代LLM越来越像人类对话的核心技术

ChatGPT

InstructGPT的亲戚,但一些优化方式也带来了ChatGPT的更泛化和准确能力,再次引爆了AIGC。ChatGPT总体来说和InstructGPT一样是使用RLHF进行训练,但模型是基于GPT3.5,而且数据设置上也不同。ChatGPT是一个输入,模型给出多个输出,然后人给结果排序,让模型可以学习人类的排序策略,即使是一本正经的胡说八道看起来也很合理的样子

六、结束语

AI时代已来,面对每天海量的信息铺面而来,我想说,不要焦虑、不要担心自己会被替代,最好的方式就是保持一颗平常心,主动的拥抱AI,让AI成为你的个人助理,根据自身的情况,先从能马上提高自己工作生活效率的内容学起,躬身入局,日拱一卒,相信不久的将来,你一定会感谢今天的你的坚持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10253.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022mathorcup数学建模大数据竞赛原创成品

“MathorCup高校数学建模挑战赛”全称“MathorCup高校数学建模挑战赛——大数据竞赛”&#xff08;简称“MathorCup高校大数据竞赛”&#xff09;。 1. 2022年竞赛初赛时间为2022年12月20日18:00至2023年1月19日20:00&#xff1b;初赛前10%的队伍进入复赛&#xff0c;复赛时间…

数学建模常用功能

目录 pandas读取数据 查看数据异常 提取指定列 将dataframe数据以numpy形式提取 数据划分 随机森林回归 GBDT回归 特征重要性可视化 输出&#xff1a; ​ 绘制3D散点图 导入自定义包且.py文件修改时jupyter notebook自动同步 dataframe删除某列中重复字段并删除对应行…

什么是数学建模?如何在数学建模中拿奖?通过建模学到了啥?

个人大学四年经验分享之数学建模 无论什么水平&#xff0c;看过此文章后必有收获&#xff01;一、数学建模到底是什么&#xff1f;1&#xff0c;数学模型2&#xff0c;数学建模 二、如何在数学建模中拿奖(三个方面&#xff09;1.组队2&#xff0c;知识准备3&#xff0c;比赛过程…

【2023 年第十三届 MathorCup 高校数学建模挑战赛】A 题 量子计算机在信用评分卡组合优化中的应用 详细建模过程解析及代码实现

相关信息 &#xff08;1&#xff09;建模思路 【2023 年第十三届 MathorCup 高校数学建模挑战赛】A 题 量子计算机在信用评分卡组合优化中的应用 详细建模过程解析及代码实现 【2023 年第十三届 MathorCup 高校数学建模挑战赛】 B 题 城市轨道交通列车时刻表优化问题 详细建…

数学建模【三款超实用建模小软件!】

最近听到很多小伙伴的反馈&#xff0c;说学编程好麻烦&#xff0c;有没有一些简单的软件可以实现数学建模的相关模型&#xff0c;今天“科研交流”工作室为大家带来了几款实用的数学建模小软件&#xff0c;可以实现基础的评价、预测、网络分析等功能&#xff0c;在比赛时能缩短…

还在为数学建模的事发愁?带你一起来看看数模竞赛中必备的经典算法

前言 数学建模比赛是本科生和研究生阶段最重要的比赛之一&#xff0c;包括全国大学生数学建模竞赛&#xff08;俗称“国赛”&#xff09;和美国大学生数学建模竞赛&#xff08;俗称“美赛”&#xff09;。在这些比赛中取得好成绩&#xff0c;不仅有助于保研、有助于找工作&…

一份简短又全面的数学建模技能图谱:常用模型算法总结

声明一下&#xff1a;下述内容的多数链接出自一本教材&#xff1a; 司守奎《数学建模算法与应用》 第二版的PDF版本&#xff0c;改成转载需要给出原创链接&#xff1b;实属无意冒犯。 【pdf版教材链接-百度网盘&#xff1a; https://pan.baidu.com/s/1TEYSW5ZImQU4Sy7Om2rxgA …

美国大学生数学建模竞赛选题、经验以及准备材料

一、美赛题目选择&#xff1a; A连续 B离散 C数据见解 D运筹学&#xff0f;网络科学&#xff08;优化/规划类&#xff09; E环境科学&#xff08;评价类&#xff09; F政策 1.C数据见解&#xff0c;没有擅长统计数据处理的人在的话&#xff0c;可以考虑避开大数据量的题目&am…

2022mathorcup数学建模大数据竞赛选题建议及初步思路来啦!

大家好呀&#xff0c;mathorcup大数据赛今天下午六点开赛了&#xff0c;我先给大家带来一个初步的选题建议及思路哈&#xff0c;需要后续完整成品的可以直接点击本文章最下面的卡片哈。 OK废话不多说&#xff0c;本次mathorcup大数据赛时间跨度是很长的&#xff0c;一共一个月…

2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题二建模方案及代码实现详解

2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 建模方案及代码实现 更新进展 2022年12月21日 12:20 发布问题一、二思路及问题一的python代码实现 2022年12月22日 15:00 发布问题二python实现的代码 更新完毕 相关链接 &…

2023年MathorCup数学建模赛题浅析

MathorCup俗称妈杯&#xff0c;是除了美赛国赛外参赛人数首屈一指的比赛&#xff0c;而我们的妈杯今天也如期开赛。今年的妈杯难度&#xff0c;至少在我看来应该是2023年截至目前来讲最难的一场比赛。问题的设置、背景的选取等各个方面都吐露着我要难死你们的想法。难度是恒定的…

2021MathorCup高校数学建模挑战赛——大数据竞赛的一些想法总结

文章目录 1 前言2 数据预处理2.1 数据文件的分割2.2 数据文件的去重 3 问题一的求解3.1 数据提取3.2 去除数据异常值3.3 数据格式化3.4 数据集的插值3.5 ARIMA模型进行短期预测 4 问题二的求解4.1 人工神经网络&#xff08;ANN&#xff09;4.2 深度神经网络&#xff08;DNN&…

2023MathorCup数学建模比赛的思路汇总帖

更新时间【4.13 19&#xff1a;45】ABCD均已更新&#xff0c;选题指导已更新&#xff0c;速看&#xff01;后续会出各题详细思路及代码&#xff01; 这里是小云的2023MathorCup数学建模比赛的思路汇总帖&#xff0c;比赛开始后将实时更新~ 竞赛共4道题目&#xff08;A题、B题…

参加大学生数学建模大赛,Matlab和Python到底哪个更好?

前言 后台的小伙伴经常会问编程过程中&#xff0c;MATLAB和Python到底哪个更好&#xff1f;这个问题一直困惑很多同学&#xff0c;今天小编来给大家从实用型来综合分析一下&#xff1a; 首先从两者各自的应用做个对比。 一、python的优势 Python相对于Matlab最大的优势&…

chatgpt赋能python:Python和数学建模:如何参与数学建模比赛

Python和数学建模&#xff1a;如何参与数学建模比赛 介绍 数学建模比赛通常是学术界和工业界一起组织的比赛&#xff0c;旨在让学生掌握实际问题的建模方法以及如何处理数据、分析和解决实际问题。Python是一个流行的编程语言&#xff0c;广泛应用于数据科学和数学建模领域&a…

2023Mathorcup数学建模(妈妈杯)思路分析与选题建议

选题建议 建议根据自己的专业背景和兴趣&#xff0c;选择适合自己的题目进行作答。根据比赛规定的难度和开放度&#xff0c;我们推荐如下&#xff1a; A题 量子计算机在信用评分卡组合优化中的应用&#xff1a;建议统计学、数学等相关专业同学选择&#xff0c;难度较易&#x…

ChatGPT在Web3.0的应用:如何探索去中心化AI的新领域?

随着Web3.0技术的不断发展&#xff0c;去中心化应用已经成为了互联网领域的热点之一。作为人工智能领域的新星&#xff0c;ChatGPT的出现&#xff0c;进一步推动了去中心化应用的发展。在Web3.0应用中&#xff0c;ChatGPT可以被用于许多新领域&#xff0c;为用户提供更加智能、…

人类怎么管好以 ChatGPT 为代表的 AI ?

这个问题很有意思。 当前的 ChatGPT 模型并没有真正的意识&#xff0c;它只是根据训练数据和算法生成回答。在当前的技术水平下&#xff0c;人工智能不具备自我意识和自我决策的能力&#xff0c;也无法脱离其预先设定的目标进行行动。 然而&#xff0c;随着人工智能技术的发展…

解决局域网下安装python和pycharm的两个问题

第一个问题&#xff0c;无法启动此程序&#xff0c;因为计算机中丢失api-ms-win-core-path-11-1-0.dll&#xff0c;实际是因为win10和win7系统不兼容出现的问题。解决方式&#xff0c;把api-ms-win-core-path-l1-1-0.dll复制到一个文件夹中C:\Windows\System32。下载地址如下。…

腾讯首次投资大模型!Minimax被曝完成2.5亿美元新融资

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 大模型正在垒起新的投资掘金热潮。 最新消息&#xff0c;大模型赛道创业公司MiniMax&#xff0c;又完成了新一轮2.5亿美元融资&#xff0c;整体估值超过12亿美元。 量子位进一步获悉&#xff0c;MiniMax这轮投资&#xff0c;还成功吸引…