轩辕:首个千亿级中文金融对话模型

背景

目前开源的大语言模型或多或少存在以下痛点:

  • 缺少专门针对中文进行优化过的的大语言模型。

  • 支持中文的开源模型的参数规模偏小,没有超过千亿。比如清华和智谱AI的ChatGLM-6B目前只开源了6B参数模型,盘古alpha也只开源了13B的模型。

  • 支持金融这个垂直领域的开源模型基本没有。前段时间Bloomberg发布的BloombergGPT是业界的一个尝试,效果不错,但是不开源。

轩辕(以下内容用XuanYuan表示)基于Bloom-176B开源模型,在该模型基础上,针对金融领域的数据做了pre-training和fine-tune,是国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。

XuanYuan大模型

轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调。

它不仅可以应对通用领域的问题,也可以解答与金融相关的各类问题,为用户提供准确、全面的金融信息和建议。

数据收集

训练数据集包含以下几个方面:

  • 通用预训练数据+金融预训练数据:来源于互联网抓取的数据。

  • 通用指令数据+金融指令数据:先人工构造种子指令数据(seed instruction data),然后基于Self-Instruct (Wang et al., 2022)论文里的方法生成通用指令数据。再基于Self-QA (Zhang and Yang, 2023)里的方法对非结构化和结构化的金融数据生成大语言模型需要的金融指令数据。Self-Instruct和Self-QA的论文参考文末的References。

通用数据的意思是不仅有金融领域的数据,还包含众多其他领域的数据。

金融数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。

实验结果表明,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

训练过程

针对垂直领域做大模型训练和微调,要仔细设计训练过程。

如果只是简单的拿垂直领域的一问一答指令数据做fine tune,可能会产生灾难性遗忘(catastrophic forgetting)。

灾难性遗忘的意思是经过训练的模型忘记了模型最开始被训练出来的通用知识,只记住了这个垂直领域相关的内容,就会导致回答质量下降。

参考上图,训练垂直领域的大模型传统方法是分为如下2个阶段:

  • 第一阶段:unsupervised domain-specific pre-training,简单来说就是把垂直领域的数据喂给大模型做预训练,让大模型去预测下一个token。
  • 第二阶段:supervised domain-specific instruction-tuning,构造垂直领域的一问一答指令数据,再基于指令数据做fine-tune。

XuanYuan提出了一种全新的训练方法hybrid-tuning,不再分为以上2个阶段。

首先,把pre-training data(预训练数据)和instruction data(指令数据)合并为一个训练数据集。

然后,基于这个数据集做训练,训练过程中把通用数据的预训练、通用数据的指令微调、金融数据的预训练和金融数据的指令微调顺序打乱。

训练完成后,模型既有了金融领域的知识和对话能力,也保留了通用领域的知识和对话能力,不会有灾难性遗忘的问题。

训练的硬件是NVIDIA A100 80GB GPU,使用DeepSpeed分布式训练框架来提升训练效率,降低训练成本。

实验效果

金融领域效果评测

为了深入评估轩辕对话大模型在金融领域的专业性,作者构建了一套针对金融领域的详细评测体系。

该评测体系涉及金融名词理解、金融市场评论、金融数据分析和金融新闻理解等四大领域,从多角度全面考察模型的金融处理能力。

评测结果表明,轩辕在主流的四种开源大模型的比较中,赢得了150次回答中63.33%的胜率,凸显出其在金融领域的显著优势。

BloomChat的我在之前的文章里介绍过,是国外开源的支持多语言(包括中文)、可商用的大语言模型,了解详情可以参考可商用、开源、支持多语言的千亿参数大语言模型。

通用领域效果评测

除了在金融领域的突出表现,轩辕还在通用处理能力方面表现优秀。

作者利用由200道多元化问题构成的通用评测集,对轩辕在数学计算、场景写作、逻辑推理、文本摘要等13个主要维度的表现进行了评估,并将其与ChatGPT进行了对比。

结果显示,轩辕在这个评测集上,有71%的问题表现不亚于ChatGPT,验证了其全方面能力。

总结

轩辕是国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型,不能商用

文章和示例代码开源在GitHub: GPT实战教程,可以看到所有主流的开源LLM。

公众号:coding进阶。关注公众号可以获取最新GPT实战内容。

个人网站:Jincheng’s Blog。

知乎:无忌。

References

  • XuanYuan 2.0: https://arxiv.org/pdf/2305.12002.pdf
  • XuanYuan GitHub: https://github.com/Duxiaoman-DI/XuanYuan
  • XuanYuan on HuggingFace: https://huggingface.co/xyz-nlp/XuanYuan2.0
  • Self-Instruct: https://arxiv.org/pdf/2212.10560.pdf
  • Self-QA: https://arxiv.org/abs/2305.11952

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/55766.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

量化择时——SVM机器学习量化择时(第1部分—因子测算)

文章目录 机器学习在量化模型上的应用机器学习量化应用场景量化模型有效性的思考 机器学习模型在量化择时中的应用训练与预测流程训练数据特征构造 SVM模型与测算SVM训练与预测效果测算效果分析 最近ChatGPT比较火,NLP的同学们感触肯定会更深。NLP的应用为人所知并积…

微信表情包下载保存到本地,(新版微信可用)简单教程

问题:微信新版无法保存表情包(微信表情包加密),且微信网页版不能登录 方法一: 1、登录你的企业微信、添加外部微信联系人(自己的微信号) 2、微信(自己的微信号)向企业…

小程序微信聊天功能中发送emoji表情

客服聊天要能发表情,(不用输入法自带的) 1、把emoji表情存入数组中再读取出来 2、微信开发工具上是这样的: 3、手机上是这样的: 4、第2步中改变了大小,到手机上发现没有用,间距还是有用的 5、…

动图太大无法添加到微信表情怎么办?

微信是我们平时经常使用的一种聊天工具,在平时使用微信聊天的时候经常会使用一些非常有趣的GIF表情,但是有时候在自己从其他地方保存的动图却无法添加到微信表情中,提示文件太大无法添加,这时候只能降低GIF动图的体积才能继续使用…

微信添加表情提示过大怎么解决?GIF太大怎么变小?

GIF这种图片格式并不是新出现的一种图片格式,其实很多年前就已经存在了,现在各种社交媒体越来越多,自媒体发展的越来越好,使用gif动图表情包的越来越多,虽然gif动态图非常有趣,但是不得不说gif动态图的优缺…

批量保存微信收藏的表情包

需求 因为最近总是在钉钉聊天,通常使用表情包来替代文字表达自己的意思,但是发现钉钉的表情包太过于官方,就想着如何把微信收藏的表情包偷过来,一键导入进去。 方法 首先需要登录微信如何获取自己收藏的表情包?如何…

微信.gif表情包保存到本地

发现微信动态表情包保存到本地非常的不友好,于是有了表情包保存 先找到微信要保存的表情包添加表情 然后微信搜索表情保存助手 发送表情包,点击表情包链接,下载表情 欢迎点赞感谢我

android高仿微信表情输入与键盘输入详解-解决跳闪与表情切换问题

最近公司在项目上要使用到表情与键盘的切换输入,自己实现了一个,还是存在些缺陷,比如说键盘与表情切换时出现跳闪问题,这个相当困扰我,不过所幸在Github(其中一个不错的开源项目是https://github.com/dss88…

微信emoji表情数据如何添加到json中

json是一种通用的快速传递数据的方式,但是在处理微信消息中,当使用JSON在存储emoji表情数据的时候,由于微信emoji表情的格式比较特殊,例如:[emoji\uD83D\uDC35],如果按照正常的JSON数据来存储,是…

我是如何获得微信内置表情的

View Post on Blog 授人以鱼,不如授人以渔。虽然百度出来有很多下载资源,但并没有讲怎么获得的(毕竟天朝特色) 在 GitHub 上直接搜微信表情,搜出来的多是 https://res.wx.qq.com/mpres/htmledition/images/icon/emotio…

超过1M的网络动图添加到微信表情包

准备工具: 微信电脑客户端、微信手机客户端 http://www.iloveimg.com/zh_cn图片在线处理网站 步骤: 1. 找到自己喜欢的网络动图,下载 2. 查看动图大小 3. 打开网站http://www.iloveimg.com/zh_cn处理动图 4. 使用…

仿微信在对话框文字中插入Emoji表情包

场景 类似于微信聊天的一个对话框,要求可以使用EMOJI表情,对话框是一个div,通过改变contentEditable属性使得内容可以编辑. 问题 Emoji表情在页面中其实是GIF格式的IMG标签.如果直接在innerHTML中改变,会导致表情包只出现在文本最后,所以这样是不符合用户体验的,需要跟踪光标…

微信小程序在聊天中如何插入表情?

一、使用QQ地带Emoji表情代码大全 参考链接:小程序中如何使用Emoji表情 - Jo太郎 - 博客园 如何使用: index.js // index.js // 获取应用实例 const app getApp()Page({data: {emoji: ☀-☔-👷-😜,emojiArr: [01, 02, 03, 04]…

分析Android 搜狗输入法在微信和QQ中发送图片和表情

好记性不如烂笔头。生活中多做笔记,不仅可以方便自己,还可以方便他人。 背景 有没有发现,有时候表情或图片的交流更能让气氛更愉悦。斗图,成了群里的日常小事,然而,当你没有图可斗的时候就尴尬了。最近&am…

微信小程序-如何实现input框输入emoji表情?【亲测有效】

👨‍🎓作者:bug菌 ✏️博客:CSDN、掘金等 💌公众号:猿圈奇妙屋 🚫特别声明:原创不易,转载请附上原文出处链接和本文声明,谢谢配合。 🙏版权声明:文章里可能部分文字或者图片来源于互联网或者百度百科,如有侵权请联系bug菌处理。 先给大家先来看下成品: 一、…

导出微信添加的自定义表情(动图)

打开微信电脑版,在“设置”-“通用设置”,在这里你可以看到微信文件存储的位置,就是下面这个: 复制它!复制它!,在“我的电脑”的地址栏粘贴,就能找到这个存储文件夹,里边…

微信消息收发与微信内部emoji表情转义

微信消息收发与微信内部emoji表情转义 目录 微信内部emoji表情转义与消息收发 一、概述 二、常用标准emoji表情字符、微信内部转义符、unicode对照表 1、比如 2、微信聊天窗口emoji表情字符 2.1、PC端表情选择,01~03排: 2.2、PC端表情选择&#…

记录 | PC端微信无法加载头像和表情包的解决

目录 问题描述解决 问题描述 换了一台新的电脑,登录微信后发现无法加载表情包和头像 解决 参考了如下链接:https://developers.weixin.qq.com/community/develop/doc/0000c680afc4588f409ba61dd5bc00 其中一个回答为: 有两个实测的方法&a…

如何从微信中获取表情包

以前百度的直接获取本地文件,改后缀名,不能用了,自己找了种办法 登录网页版微信(从百度搜索网页版微信)登录之后,打开浏览器的开发者模式,以chrome浏览器为例,打开浏览器开发者模式w…

微信电脑pc端显示不了头像和加载不了表情包,怎么解决该问题

方式一:将配置文件删掉,重新登录加载用户信息。 1.打开微信设置,选择文件管理,打开文件夹进入到微信文件存储区。 2.返回上一级文件夹区域,即WeChatFile文件夹下,进入到All Users文件夹,然后进入…