官方正式版!哈工大最新93页《ChatGPT调研报告》,系统介绍大模型技术,内测哈工大“活字”对话大模型...

来源:哈尔滨工业大学、自然语言处理研究所(HIT-NLP)

2023年3月6日,哈工大自然语言处理研究所 ( HIT-NLP, since 1979 ) 师生联合撰写出《ChatGPT调研报告》(84页),对“大模型”技术进行了系统的介绍。该报告原定仅供内部师生参考,但过去2个月中在网上也多有流传。5月4日,研究所决定将该报告公开,以期听取同行意见,并随着“大模型”技术的发展,持续对报告进行更新。

此外,哈工大自然语言处理研究所已经研制出哈工大“活字”对话大模型(通用),目前处于研究所内测阶段。同时,研究所积极研发各行业大模型(专用),欢迎拥有算力、数据、场景、资金优势的企事业单位来信洽商合作。

f4082faf301491bcf048a18d2aa07817.png

2022 年11 月30 日,OpenAI 推出全新的对话式通用人工智能工具—— ChatGPT。ChatGPT 表现出了非常惊艳的语言理解、生成、知识推理能力, 它可以很好地理解用户意图,做到有效的多轮沟通,并且回答内容完整、重 点清晰、有概括、有逻辑、有条理。ChatGPT 上线后,5 天活跃用户数高达 100 万,2 个月活跃用户数已达1 个亿,成为历史上增长最快的消费者应用 程序。除了被广大用户追捧外,ChatGPT 还受到了各国政府、企业界、学 术界的广泛关注,使人们看到了解决自然语言处理这一认知智能核心问题的 一条可能的路径,并被认为向通用人工智能迈出了坚实的一步,将对搜索引 擎构成巨大的挑战,甚至将取代很多人的工作,更将颠覆很多领域和行业。 

哈工大自然语言处理研究所组织多位老师和同学撰写了本调研报告,从 技术原理、应用场景、未来发展等方面对ChatGPT 进行了尽量详尽的介绍 及总结

本报告仅供内部参考。

主要编撰人员

第一章由车万翔、杨沐的、张伟男、赵妍妍、冯骁骋、孙承杰、李佳朋编写;第二章由张伟男、隋典伯、高翠芸、朱庆福、李明达、王雪松编写;第三章由刘铭、朱聪慧、汤步洲编写;第四章由徐永东、高翠芸、朱庆福编写;第五章由杨沐昀、张伟男、韩一、庄子或编写;第六章由隋典伯、高翠芸编写;第七章由车万翔、刘铭编写。参与各章审校工作的还有:崔一鸣、徐志明等。

报告整体由车万翔统稿。

目录

第一章 ChatGPT的背景与意义

1.1 自然语言处理的发展历史

1.2 大规模预训练语言模型的技术发展历程 

1.3 ChatGPT技术发展历程

1.3.1 ChatGPT的相关技术

1.3.2 ChatGPT技术发展脉络的总结

1.3.3 ChatGPT的未来技术发展方向

1.4 ChatGPT的优势与劣势

1.4.1 ChatGPT的优势

1.4.2 ChatGPT的劣势

1.5 ChatGPT的应用前景

1.5.1 在人工智能行业的应用前景及影响

1.5.2 在其他行业的应用前景及影响

1.6 ChatGPT 带来的风险与挑战

第二章 ChatGPT相关核心算法

2.1 基于Transformer的预训练语言模型..

2.1.1  编码预训练语言模型(Encoder-only Pre-trained Models)

2.1.2  解码预训练语言模型(Decoder-only Pre-trained Models) 

2.1.3 基于编解码架构的预训练语言模型(Encoder-decoder Pre-trained Models)

2.2 提示学习与指令精调 

2.2.1  提示学习概述

2.2.2 ChatGPT中的指令学习

2.3  思维链(Chain of Thought,COT)

2.4 基于人类反馈的强化学习(Reinforcement Learning with Hu-man Feedback,RLHF)

第三章 大模型训练与部署

3.1 大模型并行计算技术

3.2 并行计算框架

3.3 模型部署

3.3.1 预训练模型部署的困难

3.3.2 部署框架和部署工具

3.3.3 部署技术和优化方法

3.4 预训练模型的压缩

3.4.1 模型压缩方案概述

3.4.2 结构化模型压缩策略

3.4.3 非结构化模型压缩策略

3.4.4 模型压缩小结

第四章 ChatGPT相关数据集

4.1 预训练数据集

4.1.1 文本预训练数据集

4.1.2 代码预训练数据集

4.2 人工标注数据规范及相关数据集.

4.2.1 指令微调工作流程及数据集构建方法

4.2.2 常见的指令微调数据集

4.2.3 构建指令微调数据集的关键问题

第五章 大模型评价方法

5.1 模型评价方式

5.1.1人工评价

5.1.2 自动评价

5.2 模型评价指标

5.2.1 准确性

5.2.2 不确定性

5.2.3 攻击性

5.2.4  毒害性

5.2.5 公平性与偏见性

5.2.6 鲁棒性

5.2.7 高效性

5.3 模型评价方法小结

第六章 现有大模型及对话式通用人工智能系统

6.1  现有大模型对比

6.2  对话式通用人工智能系统调研

6.2.1  对话式通用人工智能系统

6.2.2不同系统之间的比较

第七章  自然语言处理的未来发展方向

7.1  提高ChatGPT的能力

7.2  加深对模型的认识

7.3  实际应用

7.4  从语言到AGI的探索之路

收集不易,我将资料免费分享在我的星球,后续也将会持续更新

7155901da5ddaf51d4ed74fe29bcedba.jpeg

欢迎大家加入我的这个”AIGC与GPT“知识星球,价格便宜,目前已有近120人

作为一个大厂算法工程师和机器学习技术博主,我希望这个星球可以:

  • 【最全免费资源】免费chatgpt-API,最新AIGC和GPT相关pdf报告和手册。

  • 【最专业算法知识】Transformer、RLHF方法、多模态解读及其论文分享。

  • 【最新变现姿势】如何结合ChatGPT应用落地,各种可以作为副业的AIGC变现方式,打好这个信息差。

  • 【最有趣AICG】ChatGPT+midjourney拍电影,制作壁纸,漫画等等有趣的AICG内 容分享。

一些截图:

040963f5c222f2331bbc42ccd1fc734d.png

8ae6302af84faf7e21aeab2d9177d162.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4648.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【AI领域+餐饮】| 论ChatGPT在餐饮行业的应用展望

💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学会计学专业大二本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后…

用ChatGPT生成openAI全景报告

“云孚科技基于业内领先的自然语言处理、知识图谱、语义匹配、智能写作等技术,打造了云孚开源情报系统YFINT,并结合ChatGPT模型成果,重磅推出OpenAI调研报告。” ChatGPT简介 2022年11月30日,总部位于旧金山的OpenAI推出了其最新…

ChatGPT根据销售数据、客户反馈、财务报告,自动生成报告,并根据不同利益方的需要和偏好进行调整?

该场景对应的关键词库(24个): 汇报对象身份(下属、跨部门平级、领导)、销售数据(销售额、销售量、销售渠道)、财务报告(营业收入、净利润、成本费用)、市场分析&#xf…

如何用ChatGPT分析品牌舆论传播概况,并给到处理建议?

该场景对应的关键词库(25个): 舆论传播、数据分析、主题、事件、时间段、媒体渠道、数据来源、情感分析、关键词提取、主题挖掘、大众集中讨论的话题、讨论关注程度、舆论关注倾向、关联类似事件、聚焦某一种情绪、人群范围、事件涉及群体、谁…

93页 | 最近火出圈的ChatGPT调研报告(附下载)

哈工大研究团队出品《ChatGPT调研报告》,对ChatGPT带来的影响,核心算法,大模型与训练和部署,相关数据集,评价方法还有未来发展方向,都做了详细的分析。 报告介绍 ChatGPT越来越火了,也正在改…

吴军博士被骂惨了!称:ChatGPT不算新技术革命,带不来什么新机会

这是【码农突围】的第 440 篇原创分享 作者 l 突围的鱼 来源 l 码农突围(ID:smartyuge) 最近,吴军博士谈到ChatGPT的一些观点引起了热议。他说:“ChatGPT不算新技术革命,带不来什么新机会。” 此话一出&…

ChatGPT成功做对了这4步丨爱丁堡大学符尧

随着ChatGPT出现,语言大模型的进步与对话交互方式相结合,正在搅动科研、产业,以及普通人的想象力。在上周举办的青源Workshop(第20期)|LLM and Chatbot: Endgame, Worse is Better, How to Win Big 研讨会上…

MIT、北大、浙大、港大的四位讲者分享大模型前沿研究,畅聊ChatGPT

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2023年3月9日,AI TIME 大模型系列活动推出首期专场活动。本次活动邀请到了香港大学一年级博士生谢天宝、北京大学计算机学院四年级博士生张之远、浙江大学一年级硕士乔硕斐、麻省理工学院一年级博士…

【ChatGPT】《GPT-4 可以协助科研人员的研究工作吗?—— ChatPaper:GitHub 5.7K star开源项目-全流程加速科研》- 知识点目录

《GPT-4 可以协助科研人员的研究工作吗?—— ChatPaper:GitHub 5.7K star开源项目-全流程加速科研》 知乎回答 1. ChatPaper:科研加速工具 GitHub:kaixindelele/ChatPaper 主要特点: 论文(离线/在线&am…

【chatgpt-01】部署学术神器chatgpt_academic

目录 1 chatgpt_academic简介2 前置准备3 项目下载/配置4 安装依赖5 项目配置6 运行7 测试实验性功能 1 chatgpt_academic简介 chatgpt_academic是一个科研工作专用ChatGPT拓展,特别优化学术Paper润色体验,支持自定义快捷按钮,支持markdown表…

ChatGPT-5到底有多强?Battle!咱貌似也不输呀!

盘点今年的热点话题,ChatGPT是不可避免要被反复提及的一part。从去年的-3.0到今年的-3.5,再到上月刚发布-4.0。从用户体验和市场反馈来讲,这半年的时间,ChatGPT每一步都走得又稳又快! 回想起今年2月初ChatGPT全网爆火的…

ChatGPT到底有多牛?博主带你亲测

文章目录 论文项目代码算法学习情感职业回答知乎ChatGpt网页版与客户端版个人评价 论文 问他毕设框架: 让他帮我写一段毕设背景部分: 项目代码 我让他帮我用Django写一个demo网站: 算法 matlab写遗传算法: 问一个数据结构…

【ChatGPT】ChatGPT-5 到底有多强?

目录 1、ChatGPT-5 到底有多强2、技术方向3、系统特点4、系统应用5、ChatGPT-5为什么停止训练? 1、ChatGPT-5 到底有多强 OpenAI 最新的自然语言处理技术 ChatGPT-5 近期发布,拥有过去版本的一系列升级和改进。那么,在 ChatGPT-4 强大的基础…

最近非常火的ChatGPT到底是个啥?

简介 ChatGPT (Chat Generative Pre-trained Transformer ) 是由OpenAI开发的一个人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并通过强化学习进行训练。 ChatGPT目前仍以文字方式交互,而除了可以通过人类自然对…

12步骤:Midjourney 注册流程教学 账号手机验证攻略

1、打开 discord 谷歌浏览器搜索discord,点击进入官网。如图 2、登录 discord 点击login登录账号,账号会提示异地登录验证,我们需要去邮箱进行验证 3、打开邮箱 输入邮箱网址(autorambler.ru)点击登录邮箱 4、登录邮…

chatgpt赋能python:用Python实现短信验证的实现方式

用Python实现短信验证的实现方式 Python是一种通用性编程语言,有着易于使用且丰富的库和框架,使其得到无数开发者的喜爱。Python可以用于执行多种任务,包括数据处理、机器学习、网络编程和其他许多领域。在本文中,我们将介绍如何…

华泰证券人工智能系列(1):人工智能选股框架及经典算法简介

(一)人工智能选股框架及经典算法简介2017.6.1 机器学习的基本流程 数据获取、特征提取、数据转换、模型训练、模型选择、模型预测。 数据获取 大量、高质量。 现有接口:雅虎财经、新浪财经、万得终端。 爬虫数据源:新闻网站、财…

AIGC、数字人、ChatGPT:人工智能新浪潮,比移动互联网大十倍

毫不夸张地说,投资行业正在进入“地狱模式”,3000家投资机构正在疯狂看项目。在人工智能行业,由于技术的发展,正在迎来新的投资机遇,在这个过程中,相关公司很容易“拿到大钱”,有投资人确信&…

清华发布工具学习框架,让ChatGPT操控地图、股票查询,贾维斯已来?

文|小戏 首先来考大家一道初中历史题:人区别于动物的根本标志是什么›?书上的标准答案是人会制造与使用工具。那么再来一道思考题,如果 AI 会使用甚至会制造工具了以后,会发生什么呢?是像贾维斯一样的 AI 私…

《自然》杂志:ChatGPT用于研究的五个重点问题

2022年年末,ChatGPT聊天机器人的问世,标志着人工智能生成内容(Artificial Intelligence Generated Content,AIGC)类的人工智能(AI)技术将对科研人员的工作方式产生巨大影响。 ChatGPT是一个大型…