首个开源中文金融大模型来了!解释授信额度、计算收益率、决策参考样样通,来自度小满|附下载...

允中 发自 凹非寺
量子位 | 公众号 QbitAI

金融行业正迎来大模型时代。

近日,度小满正式发布千亿级中文对话大模型轩辕,集中文、金融、开源特色于一身。

基于BLOOM-176B研发的轩辕大模型,在金融场景中的任务评测中,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

在诸如金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务的评测中,轩辕超越了其他四种开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。

d1364028a582d6cb2a4eb06889aa6f83.png

在通用中文领域,轩辕表现也不亚于ChatGPT。

根据实验结果,轩辕有10.2%的任务表现超越ChatGPT,61.22%的任务表现与之持平。其中涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度,验证了轩辕的通用能力

0dd7187b954978f3f5e29db0926605c0.png

此次发布的千亿级轩辕模型,将成为国内首个开源的中文金融大模型。

度小满表示,轩辕大模型将有力地推动大模型在金融行业的应用,为客户提供更准确、全面的金融咨询与服务。

目前,千亿级的轩辕模型已可以在Huggingface中申请下载(下载地址见文末)。

国内首个开源中文金融大模型

去年11月,ChatGPT滚滚而来,全球互联网用户为之疯狂。

其专业、快速、精准、富有情感的内容表达,无不向大家展示NLP大模型惊人的自然语言理解与生成能力。

ChatGPT的的诞生,掀起了新一轮技术革命,自此各类大模型层出不穷。而度小满也开启了金融大模型的研发之路。

“将ChatGPT的能力迁移到金融领域,会产生怎么样颠覆性的影响?”,为了寻找问题的答案,度小满将轩辕大模型定位在了三个维度:

中文、金融和开源。

轩辕大模型基于1760亿的BLOOM(BigScience Large Open-science Open-access Multilingual Language Model)语言模型训练而来,使用了IDRIS的Jean Zay超级计算机(来自法国,目前在最新全球超算500强榜单上排名第135)。

BLOOM拥有1.61TB文本,包含46种自然语言和13种编程语言。

7eee310745b1c249b974cdae1e31f7d9.png

相比Meta发布的LLaMA(Large Language Model Meta AI)模型,Bloom参数量更有优势。

度小满依托多年行业实践积累,构建了具有金融垂直领域特色的、千亿tokens的中文预训练数据集

度小满数据智能部总经理、技术委员会执行主席杨青表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

值得一提的是,轩辕数据集包含了诸如金融研报、股票、基金、银行、保险等方向的专业知识。

通过在训练过程中加入大量金融对话数据并针对金融领域进行特定的预训练调优,轩辕在金融垂直领域的表现得到了显著提升。

因此,轩辕在金融专有领域内容理解和生成上展现出卓越的能力。

解释授信额度、计算收益率、决策参考……样样通

作为AI新基建,大模型在金融及各个行业有着广泛的应用场景。

轩辕大模型开源后,将会为金融企业带来怎么样的帮助?如何推动产业发展?

度小满CTO许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融场景中会有广泛的应用。

在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有24小时在线的专业客户经理成为可能。

出色的内容生成能力也将引发营销内容生产能力的大幅提升。

在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位的提升金融企业内部运营效率。

在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

智能客服,是AI在金融领域最常见的应用方向之一。

通用语音或文本的交互方式,可以为金融用户提供24小时在线咨询和答疑服务。为了降低人工成本和风险,引入智能客服已成为金融企业的基础配置。

然而实际上,面对用户多样化复杂场景的询问,智能客服常常表现出“智障”。以简单的名词解释为例,可以看到轩辕的表现更为专业。

bd99f8e6c5cb8b7c9b129a8c275ffc0e.png

在回复中,轩辕从个人信用记录、收入水平、负债情况和担保能力四个方面进行了全面的解释,清晰的结构、详细的计算方法以及实用的建议,真正做到以用户视角详解专业概念。

此外,轩辕在股息收益率、股东权益计算等方面也有相当不错的表现。

而这些涉及逻辑推理、数学计算的问题往往是AI的弱点。

现有的AI金融模型也经常会犯一些愚蠢的错误,比如:股息率 = 股息 ÷ 股票价格= 5美元 ÷ 100美元= 0.5。

eb94720fdb382098202a77e2239a0607.png

轩辕对数据和知识的挖掘与理解,不是简单的关键词搜索,而是多语义关联与匹配,更智能地识别出用户的真实意图,进而给出更符合用户需求的答案。

这一点在“智能金融顾问”应用中,尤为明显。

AI技术的优势在于海量信息的搜集、提取和分析能力,这是人类难以企及的。

例如AI大模型可以通过分析金融数据、新闻动态、社交评论等每日信息,为投资者提供市场舆情和风险预测等服务。

度小满认为,轩辕大模型要想无限趋近于人类的思维能力,不能停留在标准答案上,需要能够处理更具开放性、灵活性的复杂问题。

从下面的示例中,可以看到,轩辕会提醒客户结合资产状况、收益目标和风险偏好,以及外部的市场动态,来进行投资决策。

c2c0767fdf4480720a2de52755f934fe.png

轩辕在解释”牛市”和”熊市”含义的同时,还强调了投资者要如何面对两种市场状况,以及可采取的策略。

这一点相比其他模型,不仅交流更充分、信息更有价值,而且更显人性化,更有温度。

轩辕还能针对当下金融时事分析背后的原因,并据此从不同维度对金融市场的未来走势进行预测,给出总体结果评估,为投资者提供明确的决策参考。

8971c20cc04eadd41a387641c009035f.png

AI算法没有护城河,正是开源造就了当下大模型创新的繁荣景象。

历史也证明了,安卓系统的开源不仅使得技术的发展更加快速,也促进了开发者之间的交流与合作,让移动应用和服务得以更快地普及到全球各地,并带来更加多样化的用户体验。

得益于开源,让人人都可参与这个行业,这也使得菜鸟和小众开发者可以通过参与开源项目提高自己的技能和见识,让业界更加平等公正。

秉承这一精神,许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融相关问题的理解比通用大模型更有优势。

我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。

轩辕模型申请下载地址:
https://huggingface.co/xyz-nlp/XuanYuan2.0
GitHub主页:
https://github.com/Duxiaoman-DI/XuanYuan

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/54251.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

缓解精神内耗的“马原疗法”

2022年,内卷的时代到来了,整个社会,尤其是我们这群青年大学生已经深刻感受到了内卷的压力。可殊不知过度的精神内耗是比内卷本身更让人头疼的。 图片来源:https://img1.baidu.com/it/u1199486793,807030278&fm253&fmtauto…

马原

愚公移山-量变到质变 A:灵感是基础地位?,应该是实践吧。 AB是原话 A:抽象劳动形成商品的价值实体,抽象劳动是商品的价值实体 抽象劳动-价值 D:使用价值是具体的 这两个条件不是自古以来就有的 C&#xf…

随手记_思路历程_马原知识体系逻辑图解

// TO-DO: 清晰版 参考:https://wenku.baidu.com/view/fa728773f242336c1eb95e5e.html

澎思科技马原:AI安防竞争还未结束,落地进入后发优势时代

2019-12-15 11:42:18 鱼羊 整理自 MEET2020智能未来大会 量子位 报道 | 公众号 QbitAI 安防,是AI最先触达的领域之一。激烈竞争之后,看似“战争结束”,但亦有后发者,表现出了亮眼实力。 比如中国第一批人工智能专业毕业生&#x…

6.6 Python 实例10-文本词频统计

本文内容为北京理工大学Python慕课课程的课程讲义, 将其整理为OneNote笔记同时添加了本人上课时的课堂笔记, 且主页中的思维导图就是根据课件内容整理而来, 为了方便大家和自己查看,特将此上传到CSDN博文中, 源文件已经上传到我的资源中,有需要的可以去看看, 我主…

【考研政治】徐涛马克思主义基本原理串讲 笔记(更新中)

contents: 写在前面0x01 大纲0x02 哲学基本问题0x03 什么是物质0x04 什么是意识0x05 对立统一规律0x06 认识的本质0x07 认识的过程0x08 唯物史观和唯心史观0x09 社会存在和社会意识的构成0x10 社会存在和社会意识的关系0x11 人民群众0x12 商品?0x13 价值如何衡量0x1…

2.5 数值分析: 平方根法

本文内容为东北大学数值分析国家精品慕课课程的课程讲义, 将其整理为OneNote笔记同时添加了本人上课时的课堂笔记, 且主页中的思维导图就是根据课件内容整理而来, 为了方便大家和自己查看,特将此上传到CSDN博文中, 源文件已经上传到我的资源中,有需要的可以去看看,…

马原刷题工具

要安装的库:pywin32, python-docx 选择题库文件word后,就能开始刷题了。 导入题库时会自动生成一个docx文件和json文件,想要重新导入就删除json文件。 """ author: Bre Athy contact: https://www.zhihu.com/people/you-yi-s…

马克思主义基本原理

文章目录 马克思主义哲学 (ch.1-4)第一章:马克思主义是关于无产阶级和人类解放的科学 (Ch1.导论)1.马哲著作2.马克思主义的鲜明特征 第二章:世界的物质性及其发展规律 (Ch2 唯物论与辩证法)1.哲学的两个基本问题唯物主义唯心主义物…

6.3 Python 实例9-基本统计值计算

本文内容为北京理工大学Python慕课课程的课程讲义, 将其整理为OneNote笔记同时添加了本人上课时的课堂笔记, 且主页中的思维导图就是根据课件内容整理而来, 为了方便大家和自己查看,特将此上传到CSDN博文中, 源文件已经上传到我的资源中,有需要的可以去看看, 我主…

9.1 Python 从数据处理到人工智能(数据分析/数据可视化/文本处理/机器学习)

本文内容为北京理工大学Python慕课课程的课程讲义, 将其整理为OneNote笔记同时添加了本人上课时的课堂笔记, 且主页中的思维导图就是根据课件内容整理而来, 为了方便大家和自己查看,特将此上传到CSDN博文中, 源文件已经上传到我的资源中,有需要的可以去看看, 我主…

马原学习笔记记录

1.分值 马原理:24%;毛中特:30%;近现代史:14%;思修法基:16%;时政和当代:16% 2.马原理命题方式 马原理是考研政治中最难的科目,在试卷中命制4道单选题&#…

python 爬虫抓取网页数据导出excel_python爬虫:利用函数封装爬取多个网页,并将爬取的信息保存在excel中(涉及编码和pandas库的使用)...

在之前的文章中,我们已经爬取了单网页的湖北大学贴吧的信息。我爱小徐子:(python小白必看!)python爬虫详细讲解:静态单网页的内容爬取 爬取对象:百度贴吧湖北大学吧​zhuanlan.zhihu.com 仔细想…

C++中cin读取数据原理解析

在网上看别人的博客关于cin的解读,有感而发!解决了我心头的疑惑,所以在此进行记录。 参考博客源地址:(23条消息) cin、cin.get()、cin.getline()、getline()的区别_cin.getline()函数_啊大1号的博客-CSDN博客(23条消息) C while(…

马原大题知识点整理

B站上的马原大题知识点 在网上没有找到对应的资料,手打了一份(可能会有部分错误) 马原大题 文章目录 一、马哲答题考核规律二、马哲答题书写格式三、马哲大题背诵概念(一)辩证法1、联系观2、发展观3、新事物4、五大基…

研究生复试之专业问答

比较 TCP与 UDP TCP与 UDP都是传输层的协议 , 且都用端口号标识数据所达的进 程。 TCP提供的是面向连接服务 , 提供可靠交付。且具有流量控制 和拥塞控制。可用于可靠要求高的场合如 :SMTP,FTP,HTTP等 。 UDP提供的是无连接服务 , 提供不可靠交付 , 且无确认机制。主要 用于即…

大模型总是「胡说八道」怎么办?手把手教你如何应对!

随着 ChatGPT 的出现,「AI 幻觉」一词被频繁提及。那么,什么是 AI 幻觉?简单来说,就是大模型在一本正经地胡说八道。 不止 ChatGPT,其他大语言模型也经常如此,究其根本是大语言模型在训练的过程中存在数据偏…

美军 AI 无人机 “抗令杀人”?LeCun、吴恩达在线辟谣:假的,是炒作!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 上周三,近 400 名知名专家共同签署的 22 字声明,令人们将目光再次聚焦 AI 可能带来的风险,有关“AI 可能灭绝人类”的讨论更是甚嚣尘上。 在这种氛围中&#xff0c…

谷歌CEO皮查伊暗示要裁员;华为研发投入位居首位;Android 13首个安全更新|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…