从GLM-130B到ChatGLM,清华ChatGLM一作曾博士报告ppt

摘要:GLM-130B是一个中英双语预训练基座模型,拥有1300亿参数,模型架构采用通用语言模型GLM,其22年8月开源版本已完成4000亿token预训练。斯坦福基础模型中心22年11月对全球30个大模型进行的评测报告显示 GLM-130B在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型(无指令微调)中表现优异。自8月起,GLM团队进一步向模型注入了文本和代码预训练,通过有监督微调等技术实现人类意图对齐,于23年2月开始内测 ChatGLM千亿对话模型,于3月开源ChatGLM-6B模型。此外,GLM-130B(和ChatGLM)的INT4量化版本支持在一台八卡 2080Ti 或四卡3090服务器上对1300亿全参数模型进行基本无精度损失的推理。报告将分享 GLM团队在千亿训练和ChatGLM研发过程的一点思考和尝试。

曾奥涵: 清华大学知识工程实验室一年级博士生,为开源双语预训练模型 GLM-130B 模型和 ChatGLM 系统的主要开发者之一,研究方向为自然语言处理与大规模预训练模型,指导老师为唐杰教授。

  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/62448.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023 年 5 月最新脚本神器合集来了

苏生不惑第429 篇原创文章,将本公众号设为星标,第一时间看最新文章。 之前分享过的上百个实用浏览器扩展和油猴脚本我都同步到博客了https://sushengbuhuo.github.io/blog ,2023年5月继续分享几个实用扩展脚本,如果想导出浏览器扩…

120个颠覆你认知的gpt使用案例汇总,办公效率提高500%

文章目录 介绍1.代码生成2.代码注释3.代码解释器4.充当 Linux 终端5.代码纠正6.英语口语练习7.专业的翻译8.面试官9.写任何考科目的作业10.快速解决学习中的任何问题11.网站推荐12.网络工具软件推荐13.快速学习新技能14.快速总结长文本的核心思想15.解决日常办公问题16.制作各种…

ZOOM join meeting提示密码错误

最近phd面试陆陆续续来了。昨天尝试加入国外的一个会议,但是打开zoom客户端的时候提示没办法登录。更气的是,直接join meeting的话,每次都说我会议密码错误,即使我输入的是对的。 网上看了一下,有人推荐用us官网上下载…

开机密码输对却提示密码错误

今早8点30准时来到实验室 按照惯例: 打开电脑→输开机密码 但提示密码错误 嗯??!! 首先我检查了CapsLock是否开启 因为我设置都是小写 其次我重启、关机、换键盘(台式dell optiplex 3020)都无济…

记录使用git老是出现用户密码错误的情况

出现这个问题的原因是因为 我们在使用android studio 的时候 把git的用户密码给记住了,所以当我们去别人的代码仓库去下载 代码的时候会出现这个问题 解决方法: 在android studio中使用CtrlAlts调出Setting菜单,搜索passowrd ,然…

如何写好一份数据分析报告?

如何写好一份数据分析报告? 很多人在写数据分析报告的时候,往往更关注如何将报告做的更美观,例如:做漂亮的可视化图表,做很炫的PPT等。但当别人看你做的数据分析报告的时候,往往更关注这个报告对他是否有价…

2022-2028年中国PTT行业市场研究及前瞻分析报告

【报告类型】产业研究 【出版时间】即时更新(交付时间约3个工作日) 【发布机构】智研瞻产业研究院 【报告格式】PDF版 本报告介绍了PTT行业相关概述、中国PTT行业运行环境、分析了中国PTT行业的现状、中国PTT行业竞争格局、对中国PTT行业做了重点企业…

chatgpt赋能python:Python上色:提升可视化效果和代码可读性

Python上色:提升可视化效果和代码可读性 Python是一种高级编程语言,被广泛使用,尤其是在数据科学领域。而可视化和代码可读性是Python编程中十分重要的方面。在本文中,我们将介绍Python上色的概念和好处,并提供几种方…

TED+肢体语言塑造你自己+power+fake it till you make it

TED肢体语言塑造你自己powerfake it till you make it AmyCuddy在TED的演讲—Your body language shapes who you are《肢体语言塑造你自己》 首先我想要提供给你们一个免费的 非科技的人生窍门 你只需这样做 改变你的姿势二分钟时间 但在我要把它告诉你们之前,我想…

数据分析师岗位分析

“数据分析师”岗位分析 由于想从事数据分析师方面的工作,而做这个分析 第一可以拿来实际操作一下数据分析的技能,熟悉一下近段时间学习的工具 第二可以用数据的方式来了解一下数据分析师这个职位在成都的大体情况 所以做了这个分析。 一. 数…

人人都是数据分析师

一.耳熟能详的数据你真的了解吗? 1.数据的类型 根据数据的存储形式,可以将数据分为结构化数据和非结构化数据两种类型 存储在数据库中的结构化数据能够很方便地进行检索、分析以及展示分析结果。结构化数据是进 行数据分析的基本类型,大多数…

数据分析师的基本职责(合集)

数据分析师的基本职责 数据分析师的基本职责1 职责: 1、负责使用网站分析工具,对全站的流量进行统计、分析和监控,分析流量的来源、关键词、访问深度,停留时间等维度,能得出相应的逻辑给出指导意见; 2、根据网站的架构…

了解数据分析师,转行数据分析师,成为数据分析师

什么是数据分析师 有人说,数据分析师就是分析数据的人呗。 有人说,数据分析师是从浩如烟海的数据中发掘价值的淘金者。 有人说,数据分析师是对搜集到的数据进行整理、分析,在依据所属行业提出的要求进行研究、评估和预测的人。 有…

数据分析师招聘情况之python分析

项目简介: 通过此次数据分析解决转行数据分析师是否合适的问题 目的: 1.不同城市数据分析师需求量; 2.总体薪酬分布; 3.不同城市薪酬分布情况; 4.数据分析师对经验的要求; 5.经验对薪酬的影响&#xff1b…

我们爬了上千个数据分析师信息, 你真的懂数据分析师嘛?

01 项目简介 有人说,这个时代,只要站在了风口,猪都能飞起来,尤其互联网行业,千变万化,日异月殊,一不小心就错过了风口,如果没记错的话,前几年火的是App开发,后…

如何快速成为数据分析师

没有什么牛逼的事情是能够速成的,越是底层的、收益周期越长的技能越是这样。 但这并不代表,我们不能用一些有意思的方法,把学习的过程变得高效而有趣。 学习一门技术之前,你应该知道,你想要达成的目标是什么样的&…

数据分析案例-数据分析师岗位招聘信息可视化

🤵‍♂️ 个人主页:艾派森的个人主页 ✍🏻作者简介:Python学习者 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞&#x1f4…

数据分析师岗位 分析可视化

目录 前言 一、导入模块 二、数据处理与分析 1.读取数据 2.查看数据表格描述 3.处理重复值 4.处理缺失值 5.提取地区信息 6.提取经验信息 7.提取薪资信息 三、Pyecharts数据可视化 1.每个地区的招聘数量 2.平均工资最高的地区 3.经验学历需求图 4.招聘公司所在…

文心千帆与文心一言API的使用

我在今年三月份左右申请了百度文心一言的测试,不久就通过了申请,体验了一段时间,感觉很棒,但是我更希望百度能早一点开放文心一言的API,不用在线去使用。 在7月19日那天,百度智能云给我打电话,问…

噫吁嚱!文言文亦能编程!此诚年度最骚语言也

栗子 晓查 发自 海边边 量子位 报道 | 公众号 QbitAI 同学,你可知如何用文言文输出“Hello World”? 请君睁圆双眼注视于此: △ 右边一顿输出 吾有一言。曰「「問天地好在。」」。書之。 却为何输出了三遍? 只因有for循环&#x…