幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM

前言

2023年是当之无愧的“大模型之年”,据瑞银集团的一份报告显示,ChatGPT推出仅仅两个月后,月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。

在炙热的大模型赛道里,基于中文大模型的发布也是层出不穷,相较于通用大模型的“大而全”,幂律联合智谱AI此次联合发布基于中文千亿大模型的法律垂直大模型——PowerLawGLM,聚焦于法律细分领域,针对中文法律场景的应用效果具有独特优势,具备丰富的法律知识和法律语言理解能力。

一、“法律垂直大模型”的诞生

通用大模型是具有强大语言理解能力和生成能力的人工智能模型,但由于专业知识及数据的欠缺,将通用大模型直接应用在法律领域,往往存在着严重的效果问题,例如法律知识错误、专业引用偏差、法律体系差异等问题。比如前段时间美国律师使用ChatGPT来提交法庭简报,结果引用的6个案例都是ChatGPT编造的虚假案例,这种“人工智能幻觉”现象在法律场景屡见不鲜,也说明了目前通用大模型难以保证法律专业层面的真实性、正确性。

幂律智能自2017年成立以来即深耕于法律+AI领域,基于领先的法律AI能力,向企业提供智能合同产品,并且深度参与了清华大学自然语言处理实验室的OpenCLaP、LawFormer等法律大模型的研发及应用。而智谱AI作为领先的通用大模型厂商,法律领域是其大模型迭代及布局的重要方向,基于双方达成的战略合作,在法律大模型上展开深度合作,来加快推动大模型在法律行业应用落地及商业化。

自2023年初双方成立联合项目组,启动法律大模型研发以来,经过千亿规模的基座模型增量训练、对话层监督微调、应用层工程优化,基于中文千亿大模型的法律垂直大模型——PowerLawGLM。

二、“PowerLawGLM”的打造

PowerLawGLM法律大模型,基于智谱目前效果最好的ChatGLM 130B通用千亿对话大模型进行联合研发。在2022年11月斯坦福大学基础模型中心对全球 30 个大模型的评测结果中,GLM-130B 是亚洲唯一入选的Top10大模型。

训练法律垂直大模型第一步——基座层:阅读大量法律文本。

通用大模型在法律场景的应用效果问题,最基础的原因在于基座大模型没有经过大量高质量专业法律文本数据的训练。双方基于ChatGLM130B的基座大模型GLM 130B,经过了多轮多次高质量法律文本数据(裁判文书、法律法规、法律知识问答等)清洗及模型增量训练,得到法律版基座大模型LawGLM 130B。

训练法律垂直大模型第二步——对话层:与法律对话场景对齐,具备法律场景的对话能力。

LawGLM 130B基座模型具备了文本生成能力,但在法律对话能力上存在欠缺,因此需要利用大量的法律领域对话数据进行监督微调。双方利用了近百万对高质量法律知识问题数据,来训练得到PowerLawGLM beta版,此时,它已经初步具备了法律场景的端到端生成式对话能力以及独特的回答习惯。

训练法律垂直大模型第三步——应用层:保证输出结果质量和可靠性。

法律问答的很多场景都有其特殊性,对于结果准确性的要求、可解释性的要求较高,直接大模型来端到端生成回答,会面临很多效果问题,例如引用失效法律、杜撰法条案例、与法律人处理逻辑不一致等等。因此幂律设计了一系列通用型及场景特定型的工程化优化方案,来提升法律问答的有法可依和引用法条内容的准确性,最终提升法律问答的专业性和可靠性。

通过以上三层结构,在基座层、对话层、应用层上提升了大模型对法律专业文本的理解、推理与生成能力:

  • 理解能力:理解复杂的法律文本,包括各种法律条款、判例、合同和其他法律文件。
  • 推理能力:从法律文本中推断出潜在的问题,提供可能的解决方案,或者预测出可能的法律后果。
  • 生成能力:回答法律问题,为用户提供咨询,甚至帮助起草法律文件。它还可以进行法律对话,帮助用户理解复杂的法律问题。

三、“PowerLawGLM”的实际能力

为了测试PowerLawGLM与通用大模型之间的效果对比,幂律的法律团队收集了互联网上法律相关的Top100高频问题,进行了不同模型的效果人工评测,并且从法律专业人员的角度,与ChatGPT等典型的通用大模型进行的效果对比。评测的维度包括:对问题点的把握是否准确、对问题所含信息的分析是否全面准确、答案的操作可行性强弱、答案的法律专业性程度、法律依据有无,以及准确性全面性程度。最终的评测结果显示,100个问题的最优答案中,PowerLawGLM接近70%是最优答案,并且在操作可行性、法律专业性等方面差异显著。

如图所示,以下是部分ChatGPT和PowerLawGLM的回答:

1.针对某一法律问题的咨询:

ChatGPT对于彩礼问题的回答

PowerLawGLM对同一问题给出的回答

在此法律问题上,ChatGPT没有对能否请求对方返还彩礼进行正面解答,也没有对彩礼问题从法律角度进行分析并给出相关法律依据;而PowerLawGLM则对此问题进行了明确回答,对题目进行分析并给出了相关法律依据。

2.关于买卖合同的起草:

ChatGPT对于合同起草的回答

PowerLawGLM关于合同起草的回答

如图所示,ChatGPT起草的合同较为简略,整体合同格式及条款表述与一份真实可用的合同差距较大,经常出现引用失效法律、条款缺失、信息不完备等问题;而PowerLawGLM将用户提问中的主体、标的物、单价、诉讼法院等信息准确无误的体现在合同正文中,并且合同条款的完整性、专业性差异显著。

四、基于PowerLawGLM大模型的对话产品ChatMe正式上线

基于PowerLawGLM大模型的能力,幂律打造了法律对话产品ChatMe,现已正式上线,首批开放50个内测名额,扫码文末二维码即可直接预约报名体验。

ChatMe的功能和特点:

  • 合同咨询:ChatMe拥有丰富的合同知识数据,能够回答诸如“合同租期期限”等合同知识问题。
  • 合同起草:贴近中文合同起草场景,模版起草、条款组合起草、端对端生成起草等多种解决方案,让生成的合同质量更高。
  • 合同信息抽取:能够识别合同中的关键信息进行提取,如主体信息,合同总金额等等。
  • 合同审查:能够针对合同条款的风险点给出相关建议,提示风险。
  • 通用法律咨询:提供具有专业法律依据的法律咨询服务。

未来,幂律智能将持续专注法律垂直大模型的技术提升和落地应用,将法律大模型能力深度融入智能合同管理产品MeFlow及智能合同审查产品MeCheck中。同时,幂律将面向企业客户开放能力接口,企业可以将法律大模型能力快速接入现有业务流与系统中,带来显著效率提升。

幂律也会不断更新和改进模型,面向不断变化的法律知识和应用进行针对性的效果优化,进一步提升PowerLawGLM大模型的进化能力。

立即申请:法律大模型产品ChatMe申请体验

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22150.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三行代码调用大模型裁判PandaLM:保护隐私、可靠、可复现

©作者 | 王晋东 我们训练了一个专门用于评估大模型性能的裁判大模型:PandaLM,并提供了接口,仅需三行代码就可以调用PandaLM大模型进行保护隐私、可靠、可复现及廉价的大模型评估。 背景介绍 “赵老师,我们用不同基座和参数训…

让Ai帮你工作(4)--锁定图片生成角色

背景: Gpt4多模态模型上来后,MJ也是紧接着发布了V5,微软发布自己Ai作图工具,Abode、unity这些传统老牌作图软件工具也是紧跟着发布自己的AI作图插件工具。这已经标志着Ai作图已经成为计算成像的另一条生成链。 各大厂都已经发布了…

【LLM】大模型值得探索的十个研究方向

note 基础理论:大模型的基础理论是什么? 网络架构:Transformer是终极框架吗? 高效计算:如何使大模型更加高效? 高效适配:大模型如何适配到下游任务? 可控生成:如何实…

R语言 星相图和stars函数的用法

星相图是雷达图的多元表达形式,每个变量在图中都占据着一定的位置,想绘制一幅星相图,需要用到Rstudio中自带的graphic包得stars()函数 其用法如下: stars(x,full TRUE,draw.segments FALSE,key.locc(xcoo…

r语言绘制星相图

星相图是雷达图的多元表达形式,每个变量在图中都占据着一定的位置,想绘制一幅星相图,需要用到Rstudio中自带的graphic包得stars()函数 其用法如下: stars(x,full TRUE,draw.segments FALSE,key.locc(xcoo…

r语言中将茎叶图旋转90度_R语言(02)绘图

基本图形的绘制 在R语言(01)中,最后的一个综合训练,我们生成了一部分数据,现在我们就用这些数据为例,来展示R是如何绘制一些图表的。 数据的导入 通过读取数据文件,我们可以导入之前产生的数据。 1 2 3 4 5 6 7 8 9 10…

R语言小总结(基础篇)

🐱‍🐉🐱‍🐉🐱‍🐉一起来干R语言,冲冲冲!!! 🤗🤗🤗欢迎大佬们来指点指点鸭~~~ 参考资料: 1.多元统计分析及R语…

APISpace 生日密码API

APISpace 的 生日密码 API,根据出生日期查询生日密码。每个人的生日都是个迷,星相命理给我们生命的启示,不同的生日都会有不同的命运。生日总有神奇的暗示,凭出生日期的数字测出内在性格和潜在力量。这里帮你揭开【生日密码】的神秘面纱。 返…

R 多元数据可视化

多元数据可视化 1.数据描述2.调入数据3.条图3.1 按行做均值条图3.2 按列做均值条图 4.箱尾图5.星相图5.1具有图例的360度星相图5.2具有图例的180度星相图 6. 脸谱图(需加载aplpack)7. 调和曲线图(需加载mvstats包)8. 案例全部程序…

R(现代统计图形)软件的使用

1.R软件的下载安装 1.R官网地址:https://www.r-project.org/ 2.下载流程: 3.安装: 双击运行,语言简体中文,问题不大,都懂的,能不装C盘就不装: 后面我都默认。 4.安装成功&…

面向IoT的协议选择思考

对于使用传感器和保持连接性的IoT系统而言,如何使用这些元素和多种互联网技术相结合呢? 互联网协议并不陌生, 但是IoT相关的互联网协议可能是有不同, 有些协议被用来辅助塑造系统。TCP/IP协议栈上有多个应用层协议, 每种协议都有自己的优势和…

【多元统计分析与R语言】【详解】使用教材P84页表3-2进行多元数据简单R分析:定量变量的分析(直方图、散点图)、定性变量的分析并绘制绘制均值条图、箱尾图、星相图、调和曲线图

可视化[教材P84页表3-2] 1.题目2.题目详解2.1.多元数据简单R分析:定量变量的分析(直方图、散点图)、定性变量的分析(单因素分析、多维列联表)。参考教材P45-P52页。2.2.绘制均值条图、箱尾图、星相图、调和曲线图。参考…

星相

今天看了一个死于白血病17岁男孩的盘,心情沉重。人逃不过宿命,当这个宿命是死亡的时候,就额外让人无奈。尤其是,你看到命运已经这样写下了。我还是比较喜欢卜卦盘,简单直接。问的问题也比较不关痛痒,跟这个…

R语言实战--R语言数据可视化中各种图形的函数命令及含义(散点图,星相图,箱线图等)

散点图 > plot(x1,x2)直方图 可以用来表示不同值出现的频率 > hist(x$x1)箱线图 > boxplot(x$x1,x$x2,x$x3)箱子中间的黑色粗线为样本的中位数。比如第一个图为90箱子的上下横线分别表示样本的25%分位线以及75%分位线,意思是有25%的样本数在上横线以上。…

R以国民CPI数据为例绘制箱尾/条状/星相/饼图

本博文源于暨南大学的mooc课程《多元数据统计分析》,如果大家没有装R语言的,可以查看此博文,手把手带你装R R语言安装 下面我们就开始今天的学习吧(ps:博主看matlab看哭了,太难了)。 国民CPI数据分析准备 我会把这个数据上传至资…

取代ChatGPT,腾讯的二次元生成器居然成海外网友新宠​

海外爆红,服务器被挤垮,还顺手普及了点中文? —— 文|杜晨 编辑|VickyXiao 图片来源 | 腾讯 还在沉溺于 ChatGPT 无法自拔? 外国网友早就 move on 了! 这两天,另一个AIGC&#…

当 ChatGPT 教我学操作系统

还记得 2021 年 11 月 8 号我开始写 Linux 0.11 的源码解读系列。 当初为了写这个系列,把 Linux 0.11 源码和相关解读的书籍都翻烂了,查阅资料理解代码的过程非常痛苦,有的时候一个小的卡点就要好几天才能整明白。 就比如最开头的位于 boots…

《花雕学AI》你知道人工智能ChatGPT在10秒钟里能写出多少种标题吗?我试了24次,惊呆了!

今天准备测试AI绘画,使用几个不同的AI平台来生成猫娘图片,以此具体学习绘图的AI咒语。这篇博客用什么标题好呢?于是,我开始关心如何优化标题,还是老办法,不懂就问ChatGPT(没有正式账号&#xff…

【固收研究】资金面分析

资金面,参考了一些友商的研究,主要是看货币政策,一般是从两个角度出发,一个是回购市场方面,也就是央行的公开操作;另一个是利率方面,主要是分析同业存单利率,也叫从存单市场方面进行…

建议设计师一定要尝试的副业排名TOP1!

要说这年头最苦逼的职业,我觉得非建筑设计师不可! 每次项目结束,甲方嗨了,领导爽了,只有咱们设计师继续爆肝下一个需求。 毕竟在项目里,甲方爸爸就负责拍拍脑袋,抛个时间,再闭着眼…