外网爆火的LLM应用手册来了!内行人都在学的大模型黑书,豆瓣评分高达9.9!!!

Transformer模型介绍
在这里插入图片描述

Transformer 是工业化、同质化的后深度学习模型,其设计目标是能够在高性能计算机(超级计算机)上以并行方式进行计算。通过同质化,一个Transformer 模型可以执行各种任务,而不需要微调。Transformer 使用数十亿参数在数十亿条原始未标注数据上进行自监督学习。

这些后深度学习架构称为基础模型。基础模型Transformer 是始于 2015年的第四次工业革命的一部分(通过机器-机器自动化将万物互联)。工业4.0(I4.0)的 AI,特别是自然语言处理(NLP)已经远远超越了过往时代,颠覆了以往的开发范式。

Transformer 架构具有革命性和颠覆性,它打破了过往RNN和CNN 的主导地位。BERT 和GPT模型放弃了循环网络层,使用自注意力机制取而代之。Transformer 模型优于RNN和CNN,这是AI历史上划时代的重大变化,Transformer模型标示着AI新时代的开始。

在这里插入图片描述

图源《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》

掌握Transformer 模型的必读书

在不到4 年的时间里,Transformer 模型以其强大的性能和创新的思想,迅速在NLP 社区崭露头角,打破了过去30 年的记录。BERT、T5 和GPT 等模型现在已成为计算机视觉、语音识别、翻译、蛋白质测序、编码等各个领域中新应用的基础构件。因此,斯坦福大学最近提出了“基础模型”这个术语,用于定义基于巨型预训练Transformer 的一系列大型语言模型。所有这些进步都归功于一些简单的想法。

《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》可作为所有对Transformer 工作原理感兴趣的人的参考书。作者在理论和实践两方面都做出了出色的工作,详细解释了如何逐步使用Transformer。阅读完本书后,你将能使用这一最先进的技术集合来增强你的深度学习应用能力。本书在详细介绍BERT、RoBERTa、T5 和GPT-3 等流行模型前,先讲述了Transformer 的架构以便为你的学习奠定坚实基础。本书还讲述了如何将Transformer 应用于许多用例,如文本摘要、图像标注、问答、情感分析和假新闻分析等。如果你对这些主题感兴趣,那么本书绝对是值得一读的。

在这里插入图片描述

图源《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》

内容简介

Transformer正在颠覆AI领域。市面上有这么平台和Transformer模型,哪些最符合你的需求?本书将引领你进入Transformer的世界,将讲述不同模型和平台的优势,指出如何消除模型的缺点和问题。本书将引导你使用Hugging Face从头开始预训练一个RoBERTa模型,包括构建数据集、定义数据整理器以及训练模型等。

《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》分步展示如何微调GPT-3等预训练模型。研究机器翻译、语音转文本、文本转语音、问答等NLP任务,并介绍解决NLP难题的技术,甚至帮助你应对假新闻焦虑(详见第13章)。

从书中可了解到,诸如OpenAI的高级平台将Transformer扩展到语言领域、计算机视觉领域,并允许使用DALL-E 2、ChatGPT和GPT-4生成代码。通过本书,你将了解到Transformer的工作原理以及如何实施Transformer来决NLP问题。
在这里插入图片描述
清华大学出版社/2024.01

主要内容

• 了解用于解决复杂语言问题的新技术

• 将GPT-3与T5、GPT-2和基于BERT的Transformer的结果进行对比

• 使用TensorFlow、PyTorch和GPT-3执行情感分析、文本摘要、非正式语言分析、机器翻译等任务

• 了解ViT和CLIP如何标注图像(包括模糊化),并使用DALL-E从文本生成图像

• 学习ChatGPT和GPT-4的高级提示工程机制

原版评价

图片

样章试读
在这里插入图片描述

目录

第1 章 Transformer 模型介绍
1.1 Transformer 的生态系统
1.2 使用Transformer 优化NLP模型
1.3 我们应该使用哪些资源
1.4 本章小结
1.5 练习题
第2 章 Transformer 模型架构入门
2.1 Transformer 的崛起:注意力就是一切
2.2 训练和性能
2.3 Hugging Face 的Transformer模型
2.4 本章小结
2.5 练习题
第3 章 微调BERT 模型
3.1 BERT 的架构
3.2 微调BERT
3.3 本章小结
3.4 练习题
第4 章 从头开始预训练RoBERTa模型
4.1 训练词元分析器和预训练Transformer
4.2 从头开始构建Kantai BERT
4.3 后续步骤
4.4 本章小结
4.5 练习题
第5 章 使用Transformer 处理下游NLP 任务
5.1 Transformer 的转导与感知
5.2 Transformer 性能与人类基准
5.3 执行下游任务
5.4 本章小结
5.5 练习题
第6 章 机器翻译
6.1 什么是机器翻译
6.2 对WMT 数据集进行预处理
6.3 用BLEU 评估机器翻译
6.4 Google 翻译
6.5 使用Trax 进行翻译
6.6 本章小结
6.7 练习题
第7 章 GPT-3
7.1 具有GPT-3 Transformer模型的超人类NLP
7.2 OpenAI GPT Transformer模型的架构
7.3 使用GPT-2 进行文本补全
7.4 训练自定义GPT-2 语言模型
7.5 使用OpenAI GPT-3
7.6 比较GPT-2 和GPT-3 的输出
7.7 微调GPT-3
7.8 工业4.0 AI 专家所需的技能
7.9 本章小结
7.10 练习题
第8 章 文本摘要(以法律和财务文档为例)
8.1 文本到文本模型
8.2 使用T5 进行文本摘要
8.3 使用GPT-3 进行文本摘要
8.4 本章小结
8.5 练习题
第9 章 数据集预处理和词元分析器
9.1 对数据集进行预处理和词元分析器
9.2 深入探讨场景4 和场景5
9.3 GPT-3 的NLU 能力
9.4 本章小结
9.5 练习题
第10 章 基于BERT 的语义角色标注
10.1 SRL 入门
10.2 基于BERT 模型的SRL 实验
10.3 基本示例
10.4 复杂示例
10.5 SRL 的能力范围
10.6 本章小结
10.7 练习题
第11 章 使用Transformer 进行问答
11.1 方法论
11.2 方法0:试错法
11.3 方法1:NER
11.4 方法2:SRL
11.5 后续步骤
11.6 本章小结
11.7 练习题
第12 章 情绪分析
12.1 入门:使用Transformer进行情绪分析
12.2 斯坦福情绪树库(SST)
12.3 通过情绪分析预测客户行为
12.4 使用GPT-3 进行情绪分析
12.5 工业4.0 依然需要人类
12.6 本章小结
12.7 练习题
> 第13 章 使用Transformer 分析假新闻
13.1 对假新闻的情绪反应
13.2 理性处理假新闻的方法
13.3 在我们继续之前
13.4 本章小结
13.5 练习题
> 第14 章 可解释AI
14.1 使用BertViz 可视化Transformer
14.2 LIT
14.3 使用字典学习可视化Transformer
14.4 探索我们无法访问的模型
14.5 本章小结
14.6 练习题
> 第15 章 从NLP 到计算机视觉
15.1 选择模型和生态系统
15.2 Reformer
15.3 DeBERTa
15.4 Transformer 视觉模型
15.5 不断扩大的模型宇宙
15.6 本章小结
15.7 练习题
> 第16 章 AI 助理
16.1 提示工程
16.2 Copilot
16.3 可以执行领域特定任务的GPT-3 引擎
16.4 基于Transformer 的推荐系统
16.5 计算机视觉
16.6 数字人和元宇宙
16.7 本章小结
16.8 练习题
第17 章 ChatGPT 和GPT-4
17.1 超越人类NLP 水平的Transformer 模型:ChatGPT和GPT-4
17.2 ChatGPT API
17.3 使用ChatGPT Plus 编写程序并添加注释
17.4 GPT-4 API
17.5 高级示例
17.6 可解释AI(XAI)和Whisper语音模型
17.7 使用DALL-E 2 API入门
17.8 将所有内容整合在一起
17.9 本章小结
17.10 练习题
附录A Transformer 模型术语
附录B Transformer 模型的硬件约束
附录C 使用GPT-2 进行文本补全
附录D 使用自定义数据集训练GPT-2 模型
附录E 练习题答案 参考资料

朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/408133.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java数据结构】---二叉树OJ

乐观学习,乐观生活,才能不断前进啊!!! 我的主页:optimistic_chen 我的专栏:c语言 ,Java 欢迎大家访问~ 创作不易,大佬们点赞鼓励下吧~ 文章目录 相同的树另一颗树的子树翻…

ES 模糊查询 wildcard 的替代方案探索

一、Wildcard 概述 Wildcard 是一种支持通配符的模糊检索方式。在 Elasticsearch 中,它使用星号 * 代表零个或多个字符,问号 ? 代表单个字符。 其使用方式多样,例如可以通过 {"wildcard": {"field_name": "value&…

docker-compose示例:nacos单机部署

前面咱们完成了docker基本环境搭建,下面就趁热打铁来练习下nacos的单机部署。 参考官方文档:Nacos Docker 快速开始。考虑到官方搭建教程过于精炼,笔者把搭建过程分享给大家。 文章目录 下载最新部署源码解决网络导致的sql文件下不下来docke…

unity AssetBundle 使用_什么是AssetBundle_导入必要的插件_创建AssetBundles_AB包资源下载_大文件下载

一、什么是AssetBundle? 定义AssetBundle。 AssetBundle 是一个存档文件,包含可在运行时由 Unity 加载的特定于平台的非代码资源(比如模型、纹理、预制件、音频剪辑甚至整个场景)。AssetBundle 可以表示彼此之间的依赖关系&…

防范小程序隐私合规风险,筑牢用户信任防线

随着国内APP软件生态的成熟,依托于头部APP的小程序逐渐成为零售、娱乐、出行等行业必选的获客渠道之一。较低的开发成本和成熟的用户营销功能,令小程序的数量在过去几年呈指数级增长。截止2023年,头部APP内集成的小程序总量已超千万。然而&am…

OpenCV(开源计算机视觉库)

OpenCV(开源计算机视觉库)是一个专注于实时计算机视觉的全面库,包含了丰富的工具和功能。以下是 OpenCV 中一些关键知识点的详细列表: 核心功能 基本结构:Mat、Scalar、Point、Size、Rect 等。 图像 I/O:读…

Latex 插入图片或表格导致页面空白过多

如图所示: Latex 插入图片或表格导致页面空白过多 我们可以采用这个方式来减少空白。 \documentclass{article} \usepackage{graphicx} % 包含图形支持 \usepackage{caption} % 提供更多对caption的控制% 设置标题上方和下方的间距 \setlength{\abovecaptionskip}{…

数据结构【链试结构二叉树】

🌟个人主页:落叶 目录 ​编辑 实现链式结构⼆叉树 前中后序遍历: 遍历规则 代码实现 前序遍历: 中序遍历: 后序遍历: 图解遍历: 函数递归栈帧图: 结点个数以及高度等 【⼆…

Oracle归档日志满了,导致程序打不开,如何解决。

加油,新时代打工人! 归档日志错误,登录不上,只能用system 角色登录, 错误提示 oracle 错误257 archiver error connect internal only until freed 解决cmd进入rman RMAN(Recovery Manager)是一…

数学基础(六)

一、分布 正态分布 二项式分布 均匀分布 卡方分布 二、核函数 核函数的目的: 将低维数据转换为高维数据 线性核函数: Linear核函数对数据不做任何变换 当特征已经比较丰富了,样本数据量巨大,需要进行实时得出结果时进行使用…

小程序学习day11-生命周期函数、组件所在页面的生命周期、自定义组件的插槽、自定义组件的父子通信

40、自定义组件(续)(续) (10)生命周期函数 1)小程序里的全部生命周期函数 ①created(在组件刚被创建时执行)(被创建,但未被放入页面&#xff09…

Servlet---axios框架 ▎路由守卫

前言 在现代Web应用中,前端和后端通常分离,前端使用框架(如Vue.js、React)与后端服务交互。Servlet是Java EE中处理HTTP请求的重要组成部分,能够生成动态Web内容。 Axios是一个基于Promise的HTTP客户端,简…

手机mkv转换mp4:轻松实现视频格式兼容

如今手机已成为我们日常生活中不可或缺的伴侣,而视频文件则是我们享受娱乐、获取信息的重要来源。然而,由于不同设备和平台对视频格式的支持各有不同,我们有时会遇到无法在手机上播放某些视频文件的问题。 mkv是一种常见的视频格式&#xff…

AI赋能奥维云网数字生态大会,瞰见智慧家庭市场新未来

近日,主题为“智无界鉴未来”的“奥维云网2024数字生态大会”在杭州盛大开启。 据「TMT星球」了解,本次大会邀请到了国务院发展研究中心专家做政策解读,得到了中国电子视像行业协会、中国家用电器协会、中国五金制品协会、中国家用电器商业协…

如何使用ssm实现保险业务管理系统设计与实现

TOC ssm131保险业务管理系统设计与实现jsp 绪论 1.1 研究背景 当前社会各行业领域竞争压力非常大,随着当前时代的信息化,科学化发展,让社会各行业领域都争相使用新的信息技术,对行业内的各种相关数据进行科学化,规…

使用Python做一个脚本自动化机器人(二)

刚发现一个好用的Python库DrissionPage,使用该库不区分浏览器,也无需下载driver文件。 import logging from DrissionPage import WebPage from DrissionPage import ChromiumPage,ChromiumOptionsclass BaiduPage():# 创建对象page ChromiumPage()# 访…

【深度学习与NLP】——最全环境配置总指南

目录 一、Anaconda 的环境准备 1.下载和安装 1.1. 下载 1.1.1. 官网下载 1.1.2. 镜像站下载(官网下载速度慢可选) 1.2. 安装 2. 环境配置 2.1 Windows 平台 2.2 MacOS 和 Linux 平台 3. 环境验证 3.1 Windows 平台 3.2 MacOS 和 Linux 平台 …

漏洞挖掘 | 浅谈一次edusrc文件上传成功getshell

0x1 前言 这里记录一下我在微信小程序挖人社局等一些人力资源和社会保障部信息中心漏洞,人社这类漏洞相对于web应用端的漏洞来讲要好挖很多,里面的WAF过滤等一些验证也少。比如你在开始学习src漏洞挖掘,就可以从微信小程序下手。 一般像这类…

C#为复杂属性提供下拉式编辑框和弹出式编辑框

一.为属性提供编辑类 弹出式和下拉式是如何实现的呢,这需要为属性提供一个专门的编辑类。.Net为我们提供了一个System.Drawing.Design.UITypeEditor类,它是所有编辑类的基类,从他继承出了诸如ColorEditor、FontEditor的类,因此我们…

B. 不知道该叫啥

题意:求长度为n的数列方案数,数列需满足两个条件:1.均为正整数。2.相邻两个数乘积不能超过m 思路:考虑dp。 设表示前i个点以j结尾的方案数,则有: 可以得出: 双指针数论分块解决。把每个m/i相…