大模型在金融AIGC领域的前景与应用

随着大模型技术的火爆,人们在思考如何借助 AI 提高编程效率的同时,也在思考 AI 对各行各业都会带来怎样的影响。在 CSDN 与《新程序员》合作举办的「新程序员大会(NPCon)——AIGC 与大模型技术应用论坛」上,来自文因互联工程 VP 兼首席科学家宋劼带来了《探索新技术之大模型在金融 AIGC 领域的前景与应用》的精彩分享。

直播回放地址:https://live.csdn.net/room/programmer_editor/Nc8cfWuo

宋劼提出可以从构造领域语言模型(DLM)、建立并整合领域 Prompt(提示、指令)集、运用 RLHF 的基本原理和降低对进口硬件的依赖等多个方面入手,以有限预算在领域应用落地类 ChatGPT 应用,最终创建一个 FD-LLM(金融领域大模型)。

在这里插入图片描述
以下是宋劼的演讲全文:

下午大家下午好,很高兴能来到现场,就我们最近在金融 AIGC 领域的一些前景和应用的思考和大家进行一些分享。

文因互联主要是为金融机构提供相应的,基于自然语言处理,还有知识图谱的解决方案。我们所做的事情其实归纳起来,主要为四个部分。

首先就是文档解析,因为我们知道在金融领域其实存在着大量的非结构化数据,包括 PDF 、Word 等等,在里面有海量的知识,我们负责把这些海量知识去给解析出来,进而迸发出这些数据存在的潜力。
第二步,就是知识的抽取,自动采集关键信息,然后将文本进行具体的。结构化处理,以进一步去促进整个的文本的处理流程,还有自动化。
第三,文档的审核,这样可以保证文档的完整性一致性。
最后,底稿的生成,包括定制式和非定制式底稿生成,协同编辑,边写边搜,一键改写等。

下面我通过回顾 AI 历史来理解 ChatGPT 的贡献。在 2022 年 3 月 15 号创新工厂总部的一场会上,李开复老师提到了说我们正迎来了 AI 1.0 到 AI 2.0 的新机遇,AI 1.0 就是以卷积神经网络开启的感知智能时代,那是的瓶颈就是我们需要有大量的标注数据,并且很难行程一个规模化效应。

如今,AI 2.0 时代已经来临,就是 ChatGPT 给大家带来的冲击,就是我们可以基于这样的基础大模型去进行进一步下层下游任务的构建。同时它也可以以一种非常简单的方式让我们所有的人都可以参与进来。

在 2020 年的时候,张博院士曾经发过一个文章,叫做迈向第三代人工智能。当时他提到了人工智能的四要素就是知识,它已经提到了一个非常重点的位置,在这个时候呢,就代表着认知智能的一个开启。但是呢,我们又仔细回顾了一下,我们觉得现在可能已经是 AI 4.0 时代了。
在这里插入图片描述该图是我们 CEO 鲍捷老师经常用的一幅图,在去年的时候呢,AI 整个行业都开始已经面临了一个寒冬,因为在商业化的落地上遇到了一个非常大的瓶颈。

伴随 ChatGPT 的诞生,AI 的春天有来临了。这个对于所有 AI 从业者来说,都是一件非常值得兴奋的事情。在 2022 年的时候,我们发现历史的车轮回到了认知智能的时代,而且甚至出现了智能的涌现。

下面回顾一下 AI 的几个关键时刻:

  • 1997年,IBM 推出了深蓝,让机器可以记住大量的现有策略,并高效运用;
  • 2011年,Watson 诞生,可以让机器在一个特定的任务下去阅读和评估知识的可信度;
  • 2016年,AlphaGo的出现是真正的让人工智能走入了人工大家的一个视野,完全信息博弈机器可以胜任,机器可以发现策略;
  • 2022年,ChatGPT 的出现让我们看到,机器可以阅读、掌握不限领域的知识,进行逻辑推理——开放域知识,不完全信息博弈。

当初GPT诞生时,大家把它称为“Gaint Parrot Talking”,也就是“鹦鹉学舌”,因为它本质上是一个语言模型,通过统计方法学习人类语言的使用方式。然而,今天我们发现,它已经具备了初步的“乌鸦智能”定义。就像这只乌鸦一样,它想要打开一颗核桃,但它无法用自己的力量完成,于是它想到了用一辆车将核桃压碎。然而,如果车流量很大的话,它就有可能被压死。因此,乌鸦经过一系列严密的观察后,决定在红灯亮起时,在人行道上放置核桃。这样,当车经过时,红灯会让车停下来,乌鸦就可以安全地过去了。在这个过程中,乌鸦需要进行推理和融合大量知识,同时需要具备一定的逻辑能力和进行四维链推断的能力。而且,它没有试错的机会。这说明,从AI到AGI的领域,我们正在实现从鹦鹉智能到乌鸦智能的过渡,但是我们还没有完全达到目标。

但 ChatGPT 可以说是一个里程碑和强心剂,让更多的人愿意涌入到这个领域。从 2013 年神经网络的出现,包括到 2017 年的 Transformer 到 2020 年的大型语言模型、2022 年的 LLM+强化学习。

在2022年,我们发现机器越来越能够像人类一样进行思考。而ChatGPT最成功的一点在于,它可以基于人类的反馈进行强化学习。ChatGPT并不仅仅是一种庞大的语言模型,更重要的是,它在每一步走向中都会关注人类的反馈,并融合人类的知识,从而更符合人类的要求。虽然它可能不会给出完全正确的答案,但它给出的答案却是最符合人类需求的。它成为了我们的助手和陪伴者,它的存在扩展了我们的思维能力。在这个过程中,最重要的人是那些提问的人。我们也预见到第三代文字处理的革命即将到来,机器将变得更加人性化。那么,在这件事情发生之后,我们一直在思考如何应对。由于我们一直在金融领域工作,所以我们也有一些特殊要求,比如数据隐私、保密性以及对各种规定的严格遵守。

在 TO B 的场景下呢,其实还会面临以下的四种方面,是目前 ChatGPT 还是有一定的局限性的。

  • 知识层面上,ChatGPT 缺少知识驱动,对领域问题依然有理解瓶颈。

  • 可行层面上,ChatGPT 仍然是一个黑盒模型,不仅计算过程不可解释,产出也不可信。

  • 数据层面上,通用大模型本身在数据适配性、合规性和安全性上,针对 ToB 场景应用依然具有限制。

  • 成本层面上,大模型的稳定训练并实现优异性能需要极高的计算成本和工程实现能力。

在整个金融领域的深度优化中,我们可以聚焦于四个方面。首先是精准训练,这个过程中我们要特别注意避免不合规的内容污染。其次,研报和公告的重要性会被提到前面,而对于金融财经的舆情新闻,其重要性会被降低。在提示方面,我们采用基于场景的提示学习,建立金融场景的promote指令,并将其收集在一起供应用和复用。鉴于我们的模型还比较小,我们可以在企业内部部署并保证私有化。

在现在的场景下,这种方式的原来顺序会要进行一些调整,但最终在给交付给客户的时候,我们一定要保证可溯源,可置控。

现在我将介绍我们在金融领域的实践。在过去五年中,我们已经深入研究了金融业的各个领域和环节,包括决策、知识、知识分析、知识挖掘和知识抽取等。在当前的环境下,我们能够以更广泛、更深入和更快的方式为我们的业务伙伴提供赋能服务。

我们将所有任务归为五大类:知识抽取、知识搜索、知识生成、知识分类和知识问答。我们期望将金融业务知识与 GPT 类的大型模型相结合,以极大地提高监管、合规、客服、运营和营销的效率。在模型训练方面,我们使用业务知识来建立 GPT 模型,并对其进行训练,使其能够理解业务,基于此解决业务问题。在知识建模方面,我们将业务知识与 GPT 模型相结合,以针对银行、证券、保险等复杂的业务知识进行建模,并根据实际业务需求自动生成相应的解决方案的初稿。在智能方案层面使用 GPT 模型,可以自动生成业务报告,并针对业务问题提出建议和解决方案。最终,我们的影响可以概括为三点:真正的智能交互、真正的智能运营和真正的智能撰写。

在监管层面呢,我们肯定会积极地跟进,在过去五年中,我们参与了所有监管环节,了解到上交所从 2017 年开始、北交所从 2020 年开始积极推进基于机器阅读的监管全流程自动化。当我们和上交所合作时,他们的团队每天只能处理九类公告,而现在已经能够处理 200 多类公告和各种招股说明书,全部由机器自动处理。在过去六年中,成本已经降低了不止十倍,而未来几年在新技术的加持下,自动化和智能化的覆盖程度肯定会进一步提升,成本甚至可能降低百倍。

在监管层面,数据的托管和权益分配是至关重要的。我们将在 AIGC 层面的所有工作分为三类:读、写、查。在读取方面,我们使用自然语言处理来建立端到端的任务学习,并提高整体的泛化能力,以服务于复杂金融文档的信息处理和理解。例如,在科创板审核中,我们使用机器自动提取了 7000 多个数据点。在写作方面,我们使用交互式的 AIGC,提供自动生成的知识文档和代码,服务于投顾投研、资产配置、资讯营销等领域。我们正在进行的研发包括自动生成招股说明书、研究报告的观点聚合等内容。

举例来说,在科创板审核过程中,我们可以用机器自动提取7000多个数据点。在写的方面,我们通过交互式的AIGC,提供了知识文档和代码的自动生成功能,服务于投顾、投研、资产配置和资讯营销等场合。例如,我们正在进行招股说明书的自动写作和研报观点聚合等方面的研发。在查的方面,我们实现了对文档目录、全文摘要、研报和速读的解析,以及图表搜索和热点趋势聚合等功能。同时,我们结合了内部私有化的知识库和大型GPT模型,实现了文档智能阅读,以提高企业内部的协同效率。我们也在针对金融领域的私有化解决方案进行研发,以满足更高的安全性和私密性需求。我们期望AIGC能广泛应用于各个场景,特别是在报告生成方面,以提高效率和准确性。最后,我们强调最后一公里的把控需要交给人来完成,以确保整个机制的完整性。

刚才提到的自动生成招股说明书等文档的功能,虽然极大地提高了效率,但最终内容的准确性和合规性仍需要保证。因此,我们为此引入了AI小助手,其主要任务是协助人工对自动生成的文档进行最终的审校和把控。这样的做法既确保了文档内容的正确性和合规性,又充分利用了AI技术的高效性,实现了人机协同,进一步提升了工作效率和效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/50033.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

刘强东终于向自己的兄弟下手了!

作者 | 胡巍巍 出品 | CSDN(ID:CSDNnews) 曾经有这么一位老板,把自己的员工当兄弟,称“不会开除任何一位兄弟”。 图源见水印 曾经这位老板,在某年的老员工授勋仪式上,无比仗义地说&#xff…

互联网大佬们的代码水平如何?网友:刘强东95年一个晚上赚5万

作为京东集团大佬,刘强东备受关注。互联网界的大佬,很多都是程序员出身,或者会写代码,就像雷军、马化腾、李彦宏、周鸿祎等,几乎都是编程高手。有人问刘强东的代码水平如何? 关于这个问题,得到了很多网友的…

刘强东的代码水平到底有多强?30年前就已破万!

在人工智能机器学习的领域中,目前最火的莫过于计算机视觉了,这项技术一直广受关注,而其中的目标检测是计算机视觉领域中最常见的问题之一。 从去年的 YOLOv4 发布后,目标检测框架被问的最多的问题就是:“有没有同学复现…

刘强东个人标签太明显,京东没有二号人物

作者 | 赵陈婷 不管个人形象上是利好还是利空,爱公开发声的刘强东的一举一动经常直接影响着京东的股价。不过这个周一,京东赶上了美国劳动节美股休市。 可以说,作为创始人刘强东很大程度上是和他所创办的企业京东划上等号的。这家1998年成立的…

拼多多面试官没想到ThreadLocal我用得这么溜,人直接傻掉

点赞再看,养成习惯,微信搜一搜【敖丙】关注这个互联网苟且偷生的程序员。 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点、资料以及我的系列文章。 开场白 张三最近天气很热心情不是很好,所以他决定…

大数据面试吹牛草稿V2.0

面试吹牛之前先打个草稿! 本文首发于微信公众号【五分钟学大数据】,公众号上有很多大数据学习方法,学习文档,最全的大数据面试八股文等 各位面试官好! 1. 我叫 xxx,毕业于 xxx,之前在 xxx 公司待了 1 年多&…

抢程序员饭碗?自动写代码的Deep TabNine真如此神奇?

作者 | James Vincent等 编译 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 导读:在过去的一年中,AI 生成书面文字的能力大大提高。通过扫描庞大的文本数据集,机器学习软件可以生成从短篇小说到歌词的各种令人信服的样本…

刘强东的代码水平如何?网友:当年一晚赚5万

作为京东集团大佬,刘强东备受关注。互联网界的大佬,很多都是程序员出身,或者会写代码,就像雷军、马化腾、李彦宏、周鸿祎等,几乎都是编程高手。于是有人问道,刘强东的代码水平如何? 关于这个问题&#xff…

【我惊呆了】Chatgpt比程序员还懂代码

Chatgpt竟然比程序员还懂代码?这个AI让我惊呆了 你有没有遇到过这样的情况:你在写代码的时候,突然发现一个bug,但是你怎么也找不出原因,只能无奈地看着程序崩溃。你想要求助,但是同事都很忙,网上…

刘强东不学编程,今天很可能没有京东......一位码农的发家致富史

公元前216年,16岁的项羽随叔父离开老家宿迁,踏上了西楚霸王之路。2200多年后,“大强子”带着村里人为他凑的500块钱和76个茶叶蛋,离开老家宿迁,来到了中国人民大学社会学院。他跟朋友说:我就是想当官&#…

afl-fuzz.c 源码全分析

afl-fuzz.c 源码全分析 picasso big sb 这是整个 afl 项目的核心,本文根据 clion 调试的执行顺序进行分析。 首先使用 afl-gcc 编译并插桩程序: afl-gcc -g test1.c -o afl-test然后设置 afl-fuzz 的参数,fuzz_in 和 fuzz_out 是新建的&a…

C++高级编程-高级特性

临时总结&#xff1a; <utility> std::move 获得右值引用 奇形怪状的函数 1.传统函数 void f&#xff08;int a&#xff09;{}2.<functional> bind bind( F&& f, Args&&... args ); 参数 f - 可调用 (Callable) 对象&#xff08;函数对象、指向函…

Vue——May(1)

VUE 一、vue基础1.1 引用1.2 基础应用1.3 模板语法1.4 数据处理1.5 el与 .$mount1.6 data的函数式写法1.7 架构模型——MVVM模型1.8 数据代理Object.defineproperty1.9 理解数据代理1.10 事件处理1.10.1 参数1.10.2 this1.10.3 简写1.10.4 传参 1.11 事件修饰符1.12 键盘事件1.…

三次输错密码后,系统是怎么做到不让我继续尝试的?

故事背景&#x1f34a; 忘记密码这件事&#xff0c;相信绝大多数人都遇到过&#xff0c;输一次错一次&#xff0c;错到几次以上&#xff0c;就不允许你继续尝试了。 但当你尝试重置密码&#xff0c;又发现新密码不能和原密码重复&#xff1a; 相信此刻心情只能用一张图形容&a…

chatgpt赋能Python-python_b怎么用

Python在SEO中的应用 介绍 Python是一种高级编程语言&#xff0c;具有清晰简洁的语法和强大的功能。它的应用场景非常广泛&#xff0c;除了在工业、科学、金融等领域中得到广泛应用&#xff0c;还可以在SEO中发挥重要作用。 SEO意为搜索引擎优化&#xff0c;是指通过优化网站…

【AI面试】hard label与soft label,Label Smoothing Loss 和 Smooth L1 Loss

往期文章: AI/CV面试,直达目录汇总【AI面试】NMS 与 Soft NMS 的辨析【AI面试】L1 loss、L2 loss和Smooth L1 Loss,L1正则化和L2正则化在一次询问chatGPT时候,在他的回答中,由smooth L1联想提到了Label Smoothing Loss 。我把问题贴到下面,和chatGPT的回答,供你参考。不…

2023 海外工具站 3 月复盘

3 月的碎碎念&#xff0c;大致总结了商业人生、付费软件、创业方向选择、创业感性还是理性、如何解决复杂问题及如何成长这几个方面的内容。 商业人生 商业人生需要试错能力和快速信息收集与验证校准&#xff1b; 商业逻辑需要试错能力&#xff0c;收集各种渠道信息后整理决…

零入门kubernetes网络实战-33->基于nat+brigde+veth pair形成的跨主机的内网通信方案

《零入门kubernetes网络实战》视频专栏地址 https://www.ixigua.com/7193641905282875942 本篇文章视频地址(稍后上传) 本文主要使用的技术是 nat技术Linux虚拟网桥虚拟网络设备veth pair来实现跨主机网桥的通信 1、测试环境介绍 两台centos虚拟机 # 查看操作系统版本 cat …

ai写作生成器有哪些?试试这几款工具吧

近年来&#xff0c;随着ai技术的飞速发展&#xff0c;越来越多的人开始意识到ai文本生成器的重要性和实用性。这种文本生成器可以帮助我们快速生成各种类型的文章&#xff0c;如报告、评论、新闻、邮件等&#xff0c;它的应用范围已经非常广泛了。不仅如此&#xff0c;随着机器…

公募基金投资者盈利洞察报告

导读&#xff1a; 近一年市场表现不佳&#xff0c;购买成长型风格基金的基民承受一定亏损&#xff0c;但是投资价值型基金的基民逆势取得正收益&#xff0c;均衡型基金基民也有所亏损&#xff0c;但幅度较小。近三年、近五年的时间维度里&#xff0c;成长型及均衡型基金的投资者…