李宏毅2023春季机器学习笔记 - 01生成AI(ChatGPT)

一、引言

预设的知识储备要求:数学(微积分、线性代数、机率);编程能力(读写python)

这门课专注在 深度学习领域deep learning,

事实上深度学习在今天的整个机器学习(ML)的领域使用非常广泛,可以说是最受重视的一项ML技术。

这门课可以作为你的机器学习的第一堂课,修完后可以更深入的把这个技术,用在你未来感兴趣的领域。

 

 

 课程录像和作业:

 

如果 只凭google colab可以取得及格的成绩,基本上如果有越多的运算资源,越有机会在这门课取得比较好的成绩。

要做机器学习、尤其是深度学习相关的任务,运算资源往往是非常重要的。


二、【生成式AI】ChatGPT原理剖析

2022.11.30,被公开

1. 对ChatGPT的常见误解:

 

 

  输出机率分布,之后取样

2. Chat-GPT怎么被训练出来的:(原理)

Chat-GPT背后的关键技术:预训练(Pre-train)。又叫督导式学习(Self-supervised Learning)、基石模型(Foundation Model)

一般机器是怎样学习的? 督导式学习

  怎么通过成对资料(督导式学习),机器自动寻找函式f,本课程后面会学习。

 但仅仅这样做,能力很有限,因为成对资料非常有限。

 ChatGPT的前身GPT,就是单纯从网络上大量资料来学习做文字接龙。

 GPT一代没有受到什么关注。

 GPT-2可以 说一段话给他,他就开始瞎掰、并且像模像样。这种能力今天看起来很正常,但当时让学界震惊。

 测试在CoQA问答资料集上,具备了一定回答问题的能力。

openAI官方说: 拿GPT3做一些微调 都叫GPT3.5,并不是特指某个模型。

GPT3(2020)是来自“暗黑大陆”的模型,因为实在太过巨大。

参数量越高、模型表现越好。

 但是GPT3有非常明显的能力上限 。

 很多时候GPT3不受控,给的答案不一定是我们想要的。

 强化GPT3的能力:人工介入。 ----->  加入督导式学习 ChatGPT

 李老师个人猜测,没有用翻译引擎。因为:

  multi-Bert也是一个自督导式的预训练模型,在GPT前非常热门的模型。

 下面这个实验是测试在DRCD中文阅读能力理解测验资料库上。

在机器心里把所有人类的语言都内化成同一种语言(自己的语言)。

总结: ChatGPT是在自督导式学习/预训练/基石模型的基础上,加入微调(finetune)/督导式学习,再加上RL(ppo算法)。 

适用增强式学习的情况,1)想偷懒时,更容易搜集更多资料。2)人类自己都不知道答案时。

很多时候问ChatGPT问题,他给的答案非常棒,不太像在做文字接龙,是因为你问的问题,人类老师都教过了。 

如果问一些莫名其妙的问题:

 

3. ChatGPT带来的新的研究问题

ChatGPT的出现,对自然语言处理相关研究带来蛮大的打击。

未来可能会被重视的研究方向:

1)如何精准提出需求

 需要好好调教他,不然不像在聊天。

需要精确提出需求,(”催眠“,Prompting):

  • 想象你是我的朋友----让他讲话更像人
  • 要求中文回答
  • 请试着跟我聊聊--- 这样他才会反问你问题,不会一直句号。
  • 现在我们开始--- 这句话还挺重要的,不讲有时候他不知道你要开始了。

 网络上有很多”调教指南“,都是乡民试出来的,不一定是最好的,未来会有一系列的研究,用更系统化的方法自动找出催眠指令。

 2)【Neutral Editing

 

 

 3.) 侦测AI生成的物件

 李老师 没有把握chatGPT生成的答案的diversity有多大。

这类的工具如果是可以轻易取用的,应该是需要被学习的内容。

 4.)不小心泄露机密?

chatGPT口风不紧, 可以像小孩一样,绕圈骗他。

 不过这个地址是错的😀...

 

 开放世界的文字冒险游戏,不是既定脚本,根本不知道会发生什么。。

  •   关键催眠指令:请开始一个文字冒险游戏。
  • 多讲一些描述让游戏更流畅。由玩家决定要采取的动作,不讲有时候就会自己出题自己玩...
  • 要求他精确的描述场景,不然有时候他会描述很随便..
  • 要先说故事背景,不然有时候会突然从中间开始。

 Midjourney来生成图,更带感🤭。用这个软件,也需要”咏唱“。(Midjourney需要说英文)

自动pipeline,在chatGPT和Midjourney中间。

google催眠指令一大堆:

 

 

 

 

 RPG感觉:

 

 

 

 笑死,玩起来好随便,选项完全没难度,而且很快就结束了。

4. ChatGPT是怎么练成的

----GPT社会化的过程

https://chat.openai.com/chat

 

 

虽然不是很完美, 有基本的翻译能力,

 

 chatGPT目前只有blog没有论文,

 官方blog上chatGPT的训练步骤:

 

 

 学会文字接龙还可以做什么:参考影片

 

 

 instructGPT,人工标注的问题和答案只有数万则,

 每种问题提供几个范例,告诉他什么样的回答是人类希望得到的。

雇佣人类来标注哪些答案是好的。

 训练一个”模仿老师的模型“,模仿人类评分的标注(学习人类偏好)

 

 使用RL技术来调整参数,来得到最高的reward

 

 想找chatGPT的破绽:问一些没用的问题

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20974.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

穷人入门区块链指南

本文来自作者 Fengy 在 GitChat 上分享 「区块链与比特币快速入门」 编辑 | 甘道夫 写在前面 本人是个对编程以及区块链感兴趣的人。平时没事的时候喜欢阅读技术博客,技术书籍。 本次在 GitChat 上发起 Chat,主要是带领区块链小白、炒币者、区块链爱好者…

穷人翻身唯一出路是什么?穷人赚钱一点都不难?

世界上有很多种人,可以分为男人或者女人。更全面一点可以说是穷人和富人,有些人出生就含着金钥匙,而有的人可能连饭都吃不上,但是又不想就此放弃,所以会选择创业这条路,穷人翻身唯一出路到底是什么&#xf…

这个社会穷人的出路在哪里?

穷人也分上进的穷人和不上进的穷人,如果你自己不上进,那就根本没有出路。 如果你上进,就多少还有点办法。 如果你没有学历,说实话,挺难的,在现在这个社会,没有学历,只知道苦做&…

中国移动牵头定义【“1”个技术底座+“X”个厂商算法】隐私计算平台

开放隐私计算 《中国移动“1X”隐私计算平台纳管集成规范》于2月10日正式发布,该规范是中国移动牵头组织业内技术伙伴亚信科技、富数科技、蓝象智联、数牍科技、同盾科技等多个业内技术合作伙伴联合编写,主要基于1X架构的互联互通分级纳管模式展开说明。…

一万年太久,只争朝夕 | Foundation model的进展仍不够快

编者按:如今根基模型(Foundation Models)的应用和相关创新正在快速涌现,但仍有很大的提升空间,目前还无法充分发挥根基模型的潜能、将其高效快速地应用于企业级AI应用中。 根基模型的加速应用和落地,带动了…

【思维模型】概率思维的价值:找到你的人生算法!打开你的人生格局!实现认知跃迁!

把同样公平的机会放在放在很多人面前,不同的人生算法,会得到迥然不同的结果。 概率思维是什么? 【ChatGPT】概率思维是一种通过使用数学模型来思考和评估不确定性事件的方法。它通过计算不同可能性的概率来预测事件的结果,并评估风险和机会。 概率思维的价值在于它可以帮…

GPT-4越强,这些数据隐私问题就越需要被重视!

开放隐私计算 今天,ChatGPT4.0版本(下称GPT-4)正式发布,引爆了我们的话题圈子。GPT-4霸榜各个频道、社区的热度头条,不管是学术界还是工业界,是茶余饭后的谈资还是头脑风暴的创新,到处都能听到“…

学习英语给你带来了哪些机会?

昨天文章发出后,J姐姐给予了一些更正,我希望将来也能够像她那样走出去看一看。 Y呢,并不是我说的那样混日子,了解更多之后,才发现他是个王者,顿时肃然起敬。 “一起学英语”群里大佬云集,希望他…

如何填报高考志愿2020流程图解和最全指南

详细原文,点击 https://zhuanlan.zhihu.com/p/161167881 阅读。 每年高考完后,并不是最轻松的时刻,因为这个时候学生要做的就是,估分以及报考大学,填报志愿。 而怎么填写高考志愿,难倒了一大众家长学生&a…

给高考生填报专业和志愿的建议

给高考生填报专业,志愿建议 开头提示:我又来参加活动啦~ 活动:【高考季征文】高考那些事儿,作为过来人我有话要说 时间过的真快,想想19级高考已经过去三年了,不知不觉就上20多岁了,今天我们就聊…

【高考志愿填报-让你领先在起跑线上】学长给学弟学妹七点建议,字字珠玑!

文章大纲 一:前言二: 选择什么学校和选择什么专业(一): 选择学校需要前需要考虑的事情(二): 辅助你做决策的工具(三): 选择什么专业 三: 计算机专业如何(一) 什么是计算机类专业:(二): 计算机科学与技术专业一:定义:二:各类专业排名:三:《2020年中国大学生就业报告》Top10行业四…

老菜鸟学PYthon - 高考志愿填报数据的实时采集

一直想学习Python,又一直懒,直到今年高考志愿填报开始,在跟进学习的过程中发现了很多高分却报漏未被录取或没有报上的情况。(自家小子今年下半年开始高三生涯) 学习目的:2022年7月开始的高考志愿填报时&am…

教你用Python浪漫表白

虽然2.14情人节已过,但接下来还有白色情人节,黑色情人节,玫瑰情人节…… 如果你有意中人, 赶紧抓住机会表白! Python浪漫表白! Python具有超强大的绘图功能,可以在你准备表白时祝你一臂之力. Python导包 import numpy as np impor…

本周大新闻|苹果首款MR没有主打卖点;Meta认为AI是AR OS的基础

​本周XR大新闻,AR方面,苹果首款MR或没有主打卖点,反而尽可能支持更多App和服务;扎克伯格表示基于AI的AR眼镜操作系统是下一代计算平台的基础;微软芯片工程VP Jean Boufarhat加入Meta芯片团队;Humane展示了…

《塞尔达传说》发售 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 2 月 21 日,在 1804 年的今天,英国人理查德特里维西克经过多年的探索、研究,终于制造了一台单一汽缸和一辆蒸汽机车&#xf…

Language Models Meet World Models: Embodied Experiences Enhance Language Models翻译

摘要 尽管大型语言模型(LM)在众多任务中表现出了出色的能力,但它们经常在物理环境中无法进行的简单推理和计划,例如理解目标的持续性或计划家庭活动。这种局限源于以下事实:LM仅在书面文本中训练,而缺乏基…

OpenAI CEO 称公司没有上市计划;特斯拉自动驾驶将开放给其他车企;百度智能云推出代码助手 Comate|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

Python代码解蓝桥杯第十三届省赛(C/C++大学B组)赛题

Python代码解蓝桥杯第十三届省赛(C/C大学B组)赛题。 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单…… 地址:https://lqpybook.re…

GDOUCTF2023 WriteUP by 肥猪拱菜队

前言 本篇WriteUP为B0、ccc、Boogipop、树木共同编写,感谢三位师傅带我打比赛拿了个第五Orz Misc 签到 关注微信公众号发送指令得到flag Matryoshka 解压附件得到一个zip和一个txt,看看txt的内容 不难发现,是将数字和一些运算符号给用英…

chatGPT教你学sql的事务

事务的隔离级别 事务的隔离级别是指多个并发事务之间相互隔离的程度,主要是为了解决并发事务带来的一致性问题,它的主要作用是控制数据库中事务的可见性和可重复读。 在 SQL 标准中,定义了四种事务隔离级别,分别为: …