你真的会跟ChatGPT聊天吗?(上)

前言:即使你对文中提及的技术不大了解,你也可以毫无压力地看完这篇描述如何更好地获得ChatGPT生成内容的文章。因为我也是利用Azure OpenAI等认知服务来学习,然后就这样写出来的……所以,舒服地坐下来,慢慢看吧~

    相信看到标题而点进来的你,已经试过跟ChatGPT聊过天了。我猜,要么你曾惊叹于人工智能的强大,要么,你嘲笑过这是人工智障……

    为什么有时候GPT会有看着很弱智的回复呢?大模型不傻,我们当然也不傻……那有没有一种可能…是我们问问题的方式不对?

    请和我一起确认,你提问时是否有如下几种情况:

  • 是否试过在提示中提供示例?

  • 是否试过使用角色扮演提问?

  • 是否不让ChatGPT去猜猜猜?

    如果存在“没有”的情况,那请允许我为人工智能申个冤——是的,问对问题,人工智能会表现的更好。这也是提示工程(prompt engineering)的重要性所在。接下来,我们花点时间来搞清楚为什么问对问题很重要,以及怎样问问题更好。

🧠 对话上下文

    首先,ChatGPT是可以使用上下文来持续优化语言理解和生成内容输出的。为了便于确定和理解,我选择了同源(使用相同的API)的Azure OpenAI服务[1]作为样例,因为在Azure OpenAI Studio里,你可以很容易地通过示例代码或JSON数据观察到来往你和模型之间的文本。

    我们先看看使用GPT-3中text-davinci-003模型的对话样例。

5e2dbb32843e10809de8059a145ab6bc.png

    GPT这个大语言模型(LLM),从全局上下文模型Transformer[2]发展而来,而没有使用局部上下文的传统长短期模型(LSTM[3])。上下文对模型能够准确了解提问和提供回答非常重要。因此每次通过API提交完成(Completion)请求的时候,我们能看到就连之前的交互文本,都被提交到了API接口。

a55b4791a039d5944af15ea35cb89905.png

    这样,GPT就能够根据之前的对话内容,生成更加相关的回复。

    也许你已经知道,和GPT模型交互有个重要的概念,就是token。我自己把它理解为“语素”,即构成词语的组成部分,按照通常计算,大约4个英文字符为1个token。我们和GPT的交互,就需要消耗token并受到token数量的限制。

    随着GPT-3.5和GPT-4的推出,原来API接口使用的Completion[4]改为了ChatCompletion[5]。新的接口要求提交的prompt从以往的字符串改为包含系统(system)、用户(user)和助手(assistant)三种角色消息的数组。其中系统角色消息只需要在最开始声明一次即可,后面我们也会讨论这个有趣的设定。

0846e5543efe4ea87bb19aa7a343257b.png

    通过这个样例,就可以看到具体三种角色消息的表现形式。我们打开“查看代码”,就能够很方便地看到这三种角色的消息数组是如何发送到API接口的。

0a91eba50e1ce96330ec039e2a160327.png

    那么我们的问题就来了——即使我们使用GPT-4的8K或32K模型,不断地发送整个会话,token也有用完的时候吧?那是不是意味着GPT就会“失忆”?

    理论上是的。人类也不可能记得对话的全部信息啊~那怎么解决这个问题呢?一般人我不告诉Ta~ 我们完全可以对之前的对话内容进行小结,然后将小结作为后续会话的开始。

    你问我怎么小结对话?问GPT啊……

🧠 不如来一发

    有几个概念伴随LLM的流行为更多人所知:Zero Shot、One Shot和Few Shot。这几个概念或许可以翻译为零样本学习、单样本学习和少样本学习。

    零样本学习、单样本学习和少样本学习某种意义上有相同的好处——模型不再需要进行繁杂的训练,就可以对新的类别进行识别判断。某些方面上,这其实和我们期待的人工智能有点类似,看上去具备了举一反三的能力。在机器学习的领域里,相关的词汇有模型泛化和迁移学习等,意味着从某些类别或样例的训练中,具备了将获得的推理扩展到其他类别或样例上的能力。

    考虑到监督机器学习时需要的标签,这是一项包含巨大成本(人力和经济)的工作——也许你已经听说过数据标记师和数据标记工作的传闻…更别说标签有时无法提供合适的数据进行训练,比如样本分布或样本过少导致的偏差等等。

    这也许就是大模型的威力…算力的强大使得巨量的语料数据能够进行无监督学习,由此产生了对语义的概率性推断,再体现到对输入的语义理解和内容生成……不断发展的神经网络(连接派)强大之后,却发现了对“意思”(符号派)的更好识别,简直是华山气宗和剑宗的殊途同归……扯远了,后续再写一篇聊这个吧……

    我们从少样本学习到零样本学习一个一个聊。开始说这几个之前,先回顾一下以往的监督学习。在如下的ImageNet示例中,模型就是使用不同的狗狗的照片来训练,从而提取分辨狗狗的特征,作为判断今后图片中是否存在狗狗的依据。

    是的,你得为狗狗的照片提供标签,说明这些训练数据(图片)是狗狗。这个训练过程你很容易通过Azure认知服务中的自定义机器视觉来体验和理解——你甚至不需要懂得写代码或配置模型,图形界面的工作室里提供图片和批量设置标签即可完成训练。

58b398a2a8d505992971ffa264068ed9.png

ImageNet数据集的部分数据——狗的照片

    OpenAI通过CLIP模型发现了多模态模型的能力,利用互联网等语料数据集中对图片的文字描述,进行了交叉的训练,使得多模态大模型将图片的“意思”和图片的“显示”关联在一起。从而实现了对图片的无监督学习——这个过程不再需要我们给图片打标签了。这也是人工智能内容生成(AIGC)里,从文本提示自动生成图片的能力来源;亦可以说明GPT-4为什么懂人类在图片里玩的梗——AI通过概率,明白了“意思”。

    我们应该为此恐慌吗?不不不,意思别说离意识,离意图还有一段距离呢,所以至少到这个周末,我们不用担心“天网”毁灭人类~😄

    好吧我又扯远了…这个话题也留到以后再聊。回到这一节的主题,我们先举例来说明一下少样本学习。

💡 少样本学习

    一个从来没有见过无毛猫的小朋友,假设这个小朋友不是特别聪明,但已经知道通过分辨耳朵啊鼻子啊脸型啊什么的,分清楚是猫猫还是狗狗(比如通用预训练模型,GPT)。

7f921de219a62ef55beebf7586a408de.jpeg

有一说一,这小喵小汪真可爱

    为了让他知道什么是无毛猫,我们也许需要提供以下两张照片:

f2d49a81575401d72f3f92568148b8b8.png

不得不说,我对无毛欣赏不来……

    然后告诉他,左边没有毛的但看得出猫脸的,是无毛猫,右边没有毛但是有狗脸的不是无毛猫。当然也许还可以再给他看几张照片加深印象…

    于是,小朋友知道了,没有毛的狗,不是无毛猫;没有毛的猫,才是无毛猫。

💡 单样本学习

    那单样本学习的例子呢?很简单:

    一个从来没有见过无毛猫的小朋友,假设这个小朋友比较聪明,我们只要给他看左边这张图…看,这只猫没有毛,它叫无毛猫。小朋友只要能认出这是猫,就认识了无毛猫。

💡 零样本学习

    那零样本学习的例子呢?更简单:

    一个从来没有见过无毛猫的小朋友,假设这个小朋友很聪明,我们不需要给他看照片(我其实也怕吓到小朋友的…),只要告诉他有一种猫没有毛。当他看到无毛猫的时候,他自己已经对猫有了概念(懂得猫的“意思”),一看没有毛,就明白了,这是你们说的无毛猫…

    这个小朋友自己学习的能力,就叫做元学习。这个能力不像传统的监督学习,目标不是识别具体类别,而是学习本身——学会判断归类从未见过的对象(懂得“意思”)。

    让我们倒过来想这个问题。如果一个模型还没那么聪明的时候,即使可能具备了零样本的能力,但单样本和少样本是不是也能帮助模型更好地推断、提高准确性呢?

    ——我认为,是的。所以在Azure OpenAI Studio里面你能够找到这样的例子。

以下是一个例子:“通过少数的几个例子,从一句话中按照示例提取结构化的数据。

3e7a3db3ae2442d0e0e0d449810f4033.png

    在这个对话中,通过提供两个属性的范例,实现了准确地从自然语言描述中,抽取结构化的数据以产生表格。这不就是少样本学习的例子吗?

    想象一下我们现在有多少人力在做着同样的事情——从文件和报告中收集数据,然后做成表格……现在AI比你做得更快更好……

    当然,目前,至少目前,我们还是比AI聪明的,比如下面这张图:

b928b4d75e9f254e21690b95c8c7bd2d.png

我的天呐,小喵小汪也玩《Face Off》这么神奇的吗?

    当我们使用Azure视觉认知服务[6]工作室来调戏人工智能的时候,AI就会很纠结这到底是猫是狗了。

c848d633475f6e5cfbb2663683398b79.png

    对于全图,AI能够一定程度上识别出狗和猫,但具体到换脸的猫,却被认成了狗…我们当然知道,这俩货既不是猫也不是狗,哈哈哈。

     在本文的下半部分,我们将继续轻松地聊聊其他更好的ChatGPT聊天方式。

参考:

[1] Azure OpenAI Service - Documentation, quickstarts, API reference - Azure Cognitive Services | Microsoft Learn[EB/OL]. [2023-04-11]. https://learn.microsoft.com/en-us/azure/cognitive-services/openai/?WT.mc_id=AI-MVP-33253.

[2] VASWANI A, SHAZEER N, PARMAR N, 等. Attention Is All You Need[M/OL]. arXiv, 2017[2023-04-11]. http://arxiv.org/abs/1706.03762.

[3] SHI X, CHEN Z, WANG H, 等. Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting[M/OL]. arXiv, 2015[2023-04-11]. http://arxiv.org/abs/1506.04214.

[4] Completions - OpenAI API[EB/OL]. [2023-04-11]. https://platform.openai.com/docs/api-reference/completions.

[5] Chat - OpenAI API[EB/OL]. [2023-04-11]. https://platform.openai.com/docs/api-reference/chat.

[6] 计算机视觉文档 - 快速入门、教程和 API 参考 - Azure 认知服务 | Microsoft Learn[EB/OL]. [2023-04-11]. https://learn.microsoft.com/zh-CN/azure/cognitive-services/computer-vision/?WT.mc_id=AI-MVP-33253.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/9294.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

iOS 版 ChatGPT 集成 Bing 搜索功能,仅对付费用户开放!

整理| 梦依丹 出品 | CSDN(ID:CSDNnews) 自 ChatGPT 去年 11 月发布以来,OpenAI 围绕 ChatGPT 打造的 AI 生态逐渐增强,开放 API、推出线上插件再到今年 5 月上线 APP。如今,iOS 版的 ChatGPT 再进一步&am…

windows本地安装chatGPT3 的openAi的对话

一、windows本地安装chatGPT3聊天对话 1.安装nginx 1.我安装的最新版本的,使用命令到达nginx的加压缩后的目录 cd c:\nginx-1.15.2 2.启动nginx服务,启动时会一闪而过是正常的 start nginx 3、查看任务进程是否存在,dos或打开任务管理器都行…

训练自己的ChatGPT(ChatGLM微调 )

目录 准备 操作 上传数据数据 训练进度 推理 验证 异常处理 总结 参考资料 ChatGLM微调 ptuning 准备 接上文https://blog.csdn.net/dingsai88/article/details/130639365 部署好ChatGLM以后,对它进行微调 操作 如果已经使用过 API 或者web模式的应该已经…

试用ChatGPT一段时间后

最近半年,互联网一款现象级的应用诞生:「ChatGPT」; 其火爆的程度,不输前面的羊了个羊; 最初了解到ChatGPT还是春节的时候,但那时网上的测评还没引起足够的好奇心; 对于纯文本式的聊天&#…

写博客一个月,我收获了什么?送你 3 条为什么要坚持写技术博客的理由!

写博客一个月,我收获了什么?给你 3 条为什么要坚持写技术博客的理由! 前言 大家好,我是「周三不Coding」。 工作休息之余,翻了翻博客,发现自己已经坚持写博客一个月了,输出了 20 篇左右的技术…

2023.3.6-3.12 AI行业周刊(第140期):AI视觉算法开发平台

17年的时候,开始业余时间探索互联网方向。比如淘宝、自媒体、微信公众号等。 当时偶然之间关注到一个苏州90后的小伙,网名叫刘大猫,开始在博客上分享自己互联网创业的过程。 从上大学开始,通过SEO、网站等方式,获取海…

这是什么神仙操作!为了自证清白,车主竟安装刹车记录仪

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 近年来,新能源汽车赛道的发展速度明显加快。作为新能源汽车巨头的特斯拉也总是处于风口浪尖,特斯拉汽车事故层出不穷,不少车主也因此走上漫漫维权之路。 电商平台上线特斯拉脚部专用记录仪…

python怎么自学

其实0基础选择python学习入行的不在少数,Python近段时间一直涨势迅猛,在各大编程排行榜中崭露头角,得益于它多功能性和简单易上手的特性,让它可以在很多不同的工作中发挥重大作用。 正因如此,目前几乎所有大中型互联网…

ChatGPT带火了一个新职业,年薪200W+

作者| Mr.K 编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 吃着火锅聊着天就把钱赚了,年薪还能高达33万美刀,你敢信吗?不用怀疑,除了“吃着火锅”这四个字是玩梗,其它全是真的。这个负责“聊天”的活儿…

又来一个神器!如何用ChatGPT帮你自动对excel数据进行分析和挖掘!

(永久免费,扫码加入) 大家好,我是菜哥!欢迎关注我的频道。 前面我们介绍过很多chatgpt的插件,有兴趣的同学可以翻一翻我们的历史文章。我们会员群里面也详细整理了45篇干货。今天我们来介绍一款神器&#x…

分红十亿?!羊了个羊公司清仓式分红,程序员做游戏到底有多赚钱?

昨日,羊了个羊小游戏又再度登上了热搜,此次却和其难度没有关系,而是因其背后公司的分红有关。 在26日晚间,吉比特(603444)发布三季报,公司前三季度实现营业收入38.3亿元,同比增长9.8…

腾讯员工平均月薪高达8.5万元,过来人教你普通人如何进大厂

互联网大厂又又又上热搜了! 昨日#腾讯员工平均月薪达8.54万元#的词条登上了热搜第一,点进去看发现,是腾讯发布了 2022 年度第二季度财报。 财报中,除了腾讯的整体数据外,还有一个数据让广大网友吃惊,虽然…

提示工程师最全秘籍来了!论文工具用例应有尽有,GitHub星标破万,年入百万不是梦...

白交 发自 凹非寺量子位 | 公众号 QbitAI 提示工程师的最强辅助来了! 这不,Meta前工程师搞了份全面指南,星标飙升破万。 最新论文、工具、常见用例、讲座数据集应有尽有~还包括一些最新提示技术总结,比如主动提示、定向刺激提示等…

老罗落泪!北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用

上一篇:30岁硕士拿100万在云南开启“吃利息躺平式养老” 现在年轻人在怎样规划养老? 做Excel表,真就动动嘴就够了! 看,输入想要干的事:给学生成绩排个名吧。 简单敲个回车,表格唰一下就列好了&a…

机会来了!小白想搞自动驾驶不要错过这个平台

人工智能不断进步,经常有新的技术进展登上头条,比如最近大火的扩散模型、ChatGPT等,但最让人兴奋且将深刻改变世界的,无疑还是自动驾驶。 相信很多搞技术开发的也很兴奋,毕竟每一个新的趋势,也都代表着新的…

AI在劳动节淘汰7800打工人,永久的

👇👇关注后回复 “进群” ,拉你进程序员交流群👇👇 来源丨量子位(ID:QbitAI) 丰色 萧箫 发自 凹非寺 https://mp.weixin.qq.com/s/crPVttsbyYWhBdRyWYSNDA “这不是演习,…

微信:有零钱的微信号不会被系统注销;拼多多旗下 Temu 在美起诉 Shein;Rust 1.71.0 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

一周 AIGC 丨国内掀起大模型军备竞赛,第一季度推出超 150 个 AI 聊天机器人

国内互联网圈好久没有这么热闹了,要感谢漂洋过海的 ChatGPT。它让互联网大厂意识到,除了和小区门口卖菜的大妈争夺流量,原来还有更有意义的事情可做,于是一股脑扎进来掀起大模型军备竞赛。它还让隐退的互联网大佬重新出山&#xf…

ShowMeAI周刊 | AI独立开发者:帆船旅行但月入万刀;创业吧!新黄金时代来了;资本看好哪些创业方向;被AI震麻的一周again

这是ShowMeAI周刊的第8期。聚焦AI领域本周热点,及其在各圈层泛起的涟漪;拆解AI独立开发者的盈利案例,关注中美AIGC的创业者们,并提供我们的商业洞察。欢迎关注与订阅! | 👀日报&周刊合辑 ⌛ 『Danielle…

互联网晚报 | 三星超过苹果成手机市场份额第一;特斯拉回应中国内地市场降价传闻;ChatGPT或会暴露企业机密信息...

苹果手机失去市场份额第一,2023年第一季度被三星反超 调研机构Canalys发布了2023年第一季度的全球智能手机市场报告,该季度同比继续下跌12%,是连续第五个季度出现下跌。三星是头部厂商中唯一实现环比增长的厂商,以22%的市场份额重…