大模型中的“罗翔老师”来了!

明敏 发自 凹非寺
量子位 | 公众号 QbitAI

大模型中的“罗翔老师”,出现了!

北大团队打造的法律大模型ChatLaw,发布即冲上知乎热搜第一。

1f2bd26831f19f3e70dc3ee54be66a7f.png

它具备大模型能力和充足法律知识,能给法律小白们答疑解惑、提供法律建议。

比如针对网络热议事件,它能给出应该参考的法条,并针对具体案例进行分析:

a71bd2b1f2dc52772b0e739df05c99d3.jpeg

还可以生成专业的法律文书:

4a5afef249274635e6c406a3885ae880.png

仿佛就像是在和真人律师对话。

如果它察觉到人类需要寻求人工服务时,还会推荐相应的法律援助中心。

9f2155c0c8d6a17f1de80c9bd35112ad.jpeg

同时ChatLaw也能成为专业律师们的小助手,帮他们处理繁琐的基础工作。

49cd2e79b416f90a509789e702891f46.png

这就是北京大学深圳研究生院-兔展智能AIGC联合实验室(主任:北大田永鸿教授)带来的最新工作。

他们在通用大模型基础上,使用大量法律领域结构化文本数据进行训练,并找来资深律师辅助人工标注、进行高质量事实型多轮对话,最后炼成了ChatLaw。

与此同时还开源了3个模型:ChatLaw-13B、ChatLaw-33B和ChatLaw-TextVec。

效果到底如何?我们已经拿到内测资格实际体验了~

而且和主创团队问了问ChatLaw背后更多细节。

大模型中的“罗翔老师”

进入主页后,可以发现ChatLaw提供对话、写作、知识库三种模式。

50d5fc93f3aefc94823bbb43397466d9.png

以对话模式为例,又可分为普通类专业类。对话模型包括快速、均衡和详细三种,可以按照自己的需要来做选择。

18ae0759594e5e5dac4f5d9e4e0f2952.png

然后就可以用最普通的大白话,来向ChatLaw描述自己的遭遇了。

和常见的通用大模型不同,ChatLaw不是一上来就回答问题,而是会先引导你补充更多详细信息

这也符合一般法律咨询的情况,当事人往往很难一次性提供全面的信息,很多表述都不明确。

56c8f3265779a2e264c09f0a69854feb.png

在得到补充信息后,它就能做出相应的分析了。

fed97c45d8da4e765a5d9718e57aa133.png

当然ChatLaw还能处理更加复杂的情况,比如从文件中抽取关键信息做出分析

在下面的场景中,当事人描述了自己突然被公司强制解雇的情况,ChatLaw简单分析后认为,这可能存在劳务纠纷,为了能更准确提供建议,它需要当事人提供劳动合同以及解雇通知等。

可以看到ChatLaw是支持上传文件的。

de98585516115e6206cc8a26d9d09540.png

在拿到对应后,它将信息总结成了一个清晰的树状图,并将事实用法律语言进行描述,和当事人确认情况。

8e6e08acf1b7045cd3c21c34126110b2.gif

而且ChatLaw也能处理多模态信息,比如读取录音文件。

0ca070b0b70f8fbc964369e6c47ebf5e.png

更进一步还可以生成法律文书。

2b4aaddc1295a7dffc8d3fc233c4a99a.gif

而且不光是给普通人提供法律咨询服务,ChatLaw还能充当专业律师的助手。

比如可以基于上下文批量生成文书

4cdebd48b8d51a092af60e9036948d01.png
0af50ba30fefcdb213ac3aca6be29320.png

所以,ChatLaw是如何实现如上效果的?

先验知识约束+模型调度

在构成上,ChatLaw是由1个调度模型和3个子模型组成。

这使得它能更加专业地解决具体问题。

主要创新性工作有两方面:

  • 先验知识约束

  • 模型调度

这两方面工作可以有效降低模型幻觉,并让它能更加灵活智能地解决问题。

先来看先验知识约束方面。

研究团队认为,对于一个垂直领域大模型而言,需要既专业又准确。

尤其是法律这种严肃的行业,一定要尽可能降低模型回答的错误率。

但对于通用大模型来说,训练数据集中往往没有包含非常充足的专业法律知识。比如ChatGPT显然是没有拿国内法条训练过的,乱回答的现象非常严重。

64dbe329854ecd7cdf42dd5855c680b4.png

这也就是常说的“模型幻觉”问题。

想要避免就需要进行大量的专业知识训练,即先验知识约束。

在这方面,研究团队使用大量判例文书、法律法规和司法解释,建立了一个大规模知识库。

同时和北大国际法学院、行业知名律师事务所合作,确保数据专业性。

然后在训练阶段将这些法律数据注入大模型中,专门建立一个微调子模型,可以进行关键词检索,来改善单纯依赖矢量数据库检索时不准确的问题。

同时在推理阶段也引入多个模块,将通识模型、专业模型和知识库融为一体,在推理中进行约束,以保证ChatLaw生成正确的法律建议,尽可能减少模型幻觉。

具体模型架构如下:

294f845c7d76397faa3cb02ea3c46a34.png

目前这一方法也同步在arXiv上发表。

b62f4fd084bb021ad278334679e423fb.png

据了解,团队还特地整理了过去十年的法考考试题,建立了一个包含2000个问题的司法考试测试集。

通过ELO机制进行检验,ChatLaw模型在测试集上成功击败GPT4,获得最高分

同时也论证了在专业领域,百亿参数量的模型可以保持卓越的准确性。

而在实际应用场景中,仅仅有强大的专业能力还不够,还需要能够灵活应对各种提问。

在这方面,ChatLaw提出了一个“调度模型”的概念。

研究团队使用针对性微调训练了一个专用调度模型,它能够对问题进行分析,然后对子模型和插件进行调度重组,最终呈现出多个模态的输入和输出。

这样一来,ChatLaw就能将文件、音频、文字整合在一起分析,同时支持法律文书、思维导图等输出,还能推荐专业的法律援助。

值得一提的是,除了发布ChatLaw,团队还一并开源了三个模型。

  • ChatLaw-13B,此版本为学术demo版,基于姜子牙Ziya-LLaMA-13B-v1训练而来,中文各项表现很好,但是逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。

  • ChatLaw-33B,此版本为学术demo版,基于Anima-33B训练而来,逻辑推理能力大幅提升,但是因为Anima的中文语料过少,导致问答时常会出现英文数据。

  • ChatLaw-Text2Vec,使用93w条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配,例如:

“请问如果借款没还怎么办?”

“合同法(1999-03-15): 第二百零六条 借款人应当按照约定的期限返还借款。对借款期限没有约定或者约定不明确,依照本法第六十一条的规定仍不能确定的,借款人可以随时返还;贷款人可以催告借款人在合理期限内返还。”

两段文本的相似度计算为0.9960.

在官方展示的测试中,ChatLaw还可以具备联网能力,效果可以更好。

不过由于目前服务器资源不足,暂时关闭了法条检索模块。

47891f79e7a2ddf938b46885f08531ac.png

以及在用户隐私保护方面,ChatLaw会对上传的文件数据进行脱敏处理。

和ChatExcel团队师出同门

不过为啥研究团队想要做一个法律领域的专业大模型呢?

这就还得从一家跑路的雅思机构说起了……

主创团队小哥表示,2018年他报名的雅思课,才开课一星期机构就卷钱跑路了。他想要通过法律途径维权,结果发现这还真不是一件容易的事

请一个律师至少要3000块,包括法律咨询、写诉讼状等……成本太高了。

但普通人自己来搞定这些,又确实很难。比如需要使用“法言法语”描述问题等……

结合今年的趋势他就想到,能不能让大模型来给普通人提供法律咨询服务。

毕竟大数据也显示,2022年,全国法院共受理案件3372.3万件,其中由律师办理诉讼案件仅有824.4万件。74%的案件没有律师参与,当事人只能自己写材料、诉讼、协商。

而且主创团队还从专业法律人士方面了解到,律师们也很希望有一个AI工具能够帮自己提升工作效率,辅助完成一些基本工作。

f5a3c04e1b778246fb3713e61cfbd87e.png

(工作发表后马上有专业人士留言希望AI能提供更强大的功能)

ChatLaw的幕后团队是北京大学深圳研究生学院-兔展智能AIGC联合实验室

值得一提的是,他们和之前爆火过的ChatExcel团队师出同门。

都是来自北京大学信息工程学院袁粒老师课题组

袁粒是北京大学信息工程学院助理教授、博士生导师。

团队主创成员有三位,分别是课题组内的准博士生伯华、家熙,以及研究生晏阳。

此外他们也联合了北京大学国际法学院、阿尔法律师事务所提供法律专业建议和指导。

对于法律领域大模型,团队表示他们认为这在国内有着巨大的发展空间。

只有中国,拥有如此巨大规模的人口,统一的法律服务市场,规范的法律判例。

因此,我们坚定的向这个项目投入算力、资源、人力。也许我们的产品现在还有诸多未完善的地方,但技术的发展是非线性的。也许在未来某个时间点,我们能够超越GPT,为这片土地的普通人带来普惠的法律服务。

据了解,目前ChatLaw已经有一些落地合作,而法律领域还只是北大-兔展智能AIGC实验室的第一步。

未来两个月内,他们预计会陆续推出政务、金融等领域的大模型。

并且已经有了商业计划,“想做中国版Cohere”。专注于企业服务。基于法律、政务、金融3个领域,不断完善行业级大模型。

cb6fbeadaf94f78c8cf8b2973247d133.png

但同时这些能力也会继续向普通人开放。

感兴趣的童鞋,可戳下方体验链接申请内测~

官方地址:https://www.chatlaw.cloud/?

GitHub地址:
https://github.com/PKU-YuanGroup/ChatLaw

论文地址:
https://arxiv.org/abs/2306.16092

 

3a037b43ba06dd81c47246946eb4873c.jpeg

 
 
 
 
往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑机器学习交流qq群955171419,加入微信群请扫码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47987.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大模型中的「罗翔老师」!北大兔展联合团队搞出ChatLaw,发布即登顶热榜,可提供法律咨询...

明敏 发自 凹非寺量子位 | 公众号 QbitAI 大模型中的“罗翔老师”,出现了! 北大团队打造的法律大模型ChatLaw,发布即冲上知乎热搜第一。 它具备大模型能力和充足法律知识,能给法律小白们答疑解惑、提供法律建议。 比如针对网络热议…

chatgpt赋能python:Python入门:实现一个简单小游戏

Python入门:实现一个简单小游戏 Python是一种强大而又易于学习的编程语言,常用于开发网络应用、游戏和数据处理。如果你想尝试Python编程,实现一个简单的小游戏是一个不错的开始。在这篇文章中,我们将介绍如何实现一个猜数字游戏…

chatgpt赋能Python-python_hangman游戏

Python Hangman游戏:玩游戏学编程 Python是一种高级编程语言,它简单易学,具有强大的功能和广泛的应用领域。要成为一名Python开发工程师,除了理论知识之外,还需要实践知识,因此,我们介绍一个有…

excel在线_图片转Excel表格在线工具,分享几款不错的工具

你是否遇到这种情况,工作中需要将纸张或图片上的表格,在Excel中照着做出来?照着做太麻烦,今天,易老师给大家分享几款,可以将图片表格识别到Excel表格工具,可以大大的提升我们办公效率。 白描网页…

图片转表格怎么转?这篇文章告诉你

在日常的工作中,不知道你们是否会遇到这样的情况:你收到了一张表格图片,需要对它进行数据统计和分析,但你却无法直接对图片上的数据进行分析,所以大多数的人都会直接手动输入,这样子不仅耗时耗力&#xff0…

Excel转TXT怎么转?介绍两个办法

出于工作需要我们经常会用到excel,其统计分析、图表等功能十分便利。有时为了便于分享或其他需求也会将Excel转为其他格式,其中Excel转TXT怎么转你知道吗?这里给大家推荐两种方法~ 使用格式转换软件 具体转换步骤如下: 步骤一、先…

好用的excel图片转表格的方法都在这了

在日常生活中,我们经常会在工作群中收到领导或者同事发来的表格,不过这种表格往往都是以截图的方式传送过来,如果我们要重新编辑的话,再新建一个表格就比较浪费时间。如果可以有转换工具可以把Excel图片直接转成表格编辑&#xff…

图片转Excel表格在线工具,分享几款不错的工具!

你是否遇到这种情况,工作中需要将纸张或图片上的表格,在Excel中照着做出来?照着做太麻烦,今天,易老师给大家分享几款,可以将图片表格识别到Excel表格工具,可以大大的提升我们办公效率。 白描网页版 入口 :https://web.baimiaoapp.com/image-to-excel 白描支持图片转文…

图片转表格怎么转?看完这篇你就会了

在日常的办公中,我们有时会收到领导或者是同事发来的表格,不过这些表格往往都是以截图的形式发送过来的。如果我们想要编辑的话,就需要新做一个表格,可是根据图片的数据重新制作的话,就得花费很多时间。其实我们可以使…

将长表格图片转Excel表格

大家好,我是小小明。 最近很多朋友和同事问我如何将图片转Excel表格,老实说这方面现成的工具基本都不好使,不过百度AI有支持进行表格图片识别的接口,我们只要按照百度AI的要求传入相应的数据进行识别即可。 需求与技术点 需求,有两张超长的表格图片: 现在希望将其识别…

浪潮信息AS13000G6高密分布式存储加速测序进程

基因测试作为生命科学领域内的重要一环,在实施的过程中面临重重挑战,如何满足数据存储量及数据可靠性的需求?浪潮信息提供了一个新的解决方案。 此前,针对求臻医学信息化平台的相关需求及基因测序的业务特点,浪潮信息携…

一场VR大赛引发的元宇宙“狂飙”

319个团队、480人参赛,第三届华为云VR开发应用大赛盛况空前,而新设立的“人气数字人形象奖”“人气虚拟偶像奖”等,让大赛又一次“破圈”,人气直升。通过大赛,我们看到虚拟现实、数字人、元宇宙等正“脱虚向实”&#…

提高效率:使用这些工具,让你开发和学习更简单

🍎道阻且长,行则将至。🍓 目录 零、ChatGPT一、代码1.代码备忘清单2.菜鸟教程3.代码转图片4.代码在线运行5.LaTeX 公式编辑器6.GitCode、GitHub 等代码仓库平台 二、绘图1.Canva 可画2.Echarts Js画图3.算法可视化4.函数绘图5.遇到 Alt 截不…

Photoshop-Beta智能版ps安装教程

Photoshop-Beta智能版ps安装教程 获取方式 安装包工具,关注公众号搜索 荷逸云,发送关键词:ps,即可获得 安装教程 0:注意事项 注意:安装此工具需要魔法上网,获取魔法方式: http…

手机上如何给图片加水印?

我们都知道,手机的抠图软件确实不太好找,不过我还是找到一款效果还不错的软件。 具体的操作步凑: 1、用手机打开多御浏览器软件,在软件首页找到实用工具,如图: 2、进入实用工具后,点击左侧办公…

从ChatGPT谈人工智能对留学之路和教育是挑战还是机遇

ChatGPT叩响技术革命之门 铺天盖地的讨论中,我们已意识到人工智能将是未来世界的钥匙,是否将它握在手中成为了当下教育的关键之问。 留学的道路上,学子们该如何顺势而为掌握主动呢 目录 Q1.好奇之问,AI究竟是什么?…

钉钉获取chatId的坑

需求是给钉钉群组推送消息,研究了很久钉钉 服务端API文档 也没有找到直接获取已存在群组的chatId方式。经过各种尝试终于找到方法,下面直接说步骤: 1.打开jsAPI调试页面 2.使用钉钉扫描页面中的二维码 3.在调试页面最下方找到这个接口 biz.c…

电脑钉钉如何发起群内抽签?

工作中常使用的办公工具电脑钉钉可以为大家进行任务的分配,促进工作方面的交流等,但是在进行任务分配时,很多人觉得任务分配不均匀,有些人反而更喜欢做某一项工作,可却被领导安排去做另一项工作。 为公平起见&#xf…

钉钉小程序生态3—钉钉扫码登录PC端网站

文章导航 钉钉小程序生态1—区分企业内部应用、第三方企业应用、第三方个人应用 钉钉小程序生态2—区分小程序和H5微应用 钉钉小程序生态3—钉钉扫码登录PC端网站 钉钉小程序生态4—钉钉小程序三方企业应用事件与回调 钉钉小程序生态5—钉钉群机器人消息通知和钉钉工作通知 第…

钉钉dingtalk=6.3.5版本RCE复现

看到网上公开了钉钉RCE的利用方式,第一时间来复现一下。 钉钉dingtalk6.3.5版本RCE复现 免责声明: 影响版本:漏洞POC:漏洞复现:存在漏洞版本下载地址: 免责声明: 本文章仅供学习和研究使用&am…