律师也要职业危机?ChatLaw帮助普通人拥有自己的法律顾问

ChatLaw法律大模型近期出圈,发布上线当日即登顶知乎热搜榜第一,在Github已有近3k的star,被网友戏称之为大型模型中的“罗翔老师”。

dfb52bd6bec62a911d8c9d027b85647e.jpeg

ChatLaw法律大模型介绍

ChatLaw开源法律大模型来自北京大学ChatExcel课题组,目前仅提供学术参考的版本,其底座为姜子牙-13B、Anima-33B,模型使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据,致力于给大众提供普惠的法律服务

8353c5d146d23bea9d28b4e52faf110b.jpeg

目前ChatLaw系列有三个版本:

- ChatLaw-13B:这是基于姜子牙Ziya-LLaMA-13B-v1(一个基于LLaMA 13B针对中文优化的微调的版本 huggingface.co/IDEA-CCNL/Ziya…)训练,这个版本中文支持很好,但是受模型参数大小的限制,逻辑能力相对较弱。

- ChatLaw-33B:这是基于Anima(一个开源的基于QLoRA的33B中文大语言模型)训练的版本,逻辑推理能力比较强,但是由于Anima中文语料不足,问答时经常会出现英文数据。

- ChatLaw-Text2Vec:使用了93万条判决案例做成的向量数据集,基于BERT训练的相似度匹配模型,可以根据用户提问的内容检索到最相关的法律条文。

模型架构:

总体架构需要涉及到三个模型,Keyword LLM,Law LLM(Embedding Model),ChatLaw LLM。

- Keyword LLM:用于将用户口语化的诉求转化为法律行业关键词,并用于检索知识库中的法律知识,作者专门加了这个步骤,改善因纯向量检索得到的知识效果可能不太好的问题。

- Law LLM:是作者专门训练的法律领域的BERT embedding模型,用于直接根据用户口语化表达检索相关法律知识,这个和关键词检索是结合使用。

- ChatLaw LLM:是最终的融合大模型,可以对检索出来的结果进行分析,提取关键内容,过滤不相关内容,最终生成相关回复。

74713dbae3999f9424eb8995a618d4b1.jpeg

训练数据:

训练数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。

官方地址:https://www.chatlaw.cloud

GitHub地址:https://github.com/PKU-YuanGroup/ChatLaw


ChatLaw Demo测试体验

ChatLaw 的学术 Demo 版本目前可以试用,遗憾的是没有接入法律咨询功能,只提供了简单的对话咨询服务。这里尝试问了几个问题,来测试ChatLaw与ChatGPT的对比效果。

问题一:在中国,音乐作品有哪些著作权权利?

ChatLaw

4ad21bb4fe9b82a0a517fdfefe0c5fd7.jpeg

ChatGPT

7c8f5beb66c5fba3b3fb2e25fa0d87d2.jpeg

问题二:另一半婚前贷款买的房子,婚后房子涨价了,如果离婚我有份额吗?

ChatLaw

c4c99242eb04237231154108c608658e.jpeg

ChatGPT

7faf0e1a4a15c0b19bbb14b1db69e909.jpeg

问题三:提出执行异议被驳回,但不提出执行异议之诉,而是另行提出所有权确认之诉,所有权确认之诉的审理能否阻却拍卖的执行程序?

ChatLaw

27987f29ef82663b53a7e0c4c19b2fea.jpeg

ChatGPT

6a03955585a947ba4eb206e699f1a3b3.jpeg

通过对上述对比结果,我们发现相同问题下ChatLaw的回答更加专业,极大的解决了GPT的幻觉问题,同时得出以下观察结果:

- 引入与法律相关的问答和法规条文的数据,可以在一定程度上提高模型在问答上的表现。

- 加入特定类型任务的数据进行训练,模型在该类任务上的表现会明显提升。例如,ChatLaw 模型优于 ChatGPT 的原因是文中使用了大量的国内法律训练数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25310.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

同行涉嫌数据抄袭、商业诋毁和人身攻击,甚至向我们的法人推销,你会怎么办?...

补充说明一下,上一篇发表之后,已经有阿里云以及阿里巴巴的人联系到我,说内部正在彻查此事,一定会给我一个结果。我的态度是当然欢迎,但希望不要把彻查变成一个公关用语,必要的情况下,我们也可以…

违反GPL协议,法院判罚了!国内首例

整理 | 一君 出品 | OSC开源社区(ID:oschina2013) 近日,一起关于 GPL 版权纠纷案裁判文书公示。一审判决书显示,GPL3.0 协议是一种民事法律行为,具有合同性质,可认定为授权人与用户间订立的著作…

自然人如何在浙江法院网上完成诉讼——具体流程

起诉状模版下载链接:https://download.csdn.net/download/weixin_42574872/86264435 一、进入浙江法院官网注册与登录 1.浙江法院官网:http://www.zjsfgkw.cn/,点击进入后进入图1-1。 图 1-1 2.在图1-1点击登录后进入,进入图1-2…

区块链赋能律所非诉业务研究报告 | TokenInsight金杜律师事务所

近年来,围绕提高司法效率,改良司法程序,增强司法手段透明度和公信力开展的区块链项目研究越来越多,国内外应用落地情况良好。 2018年9月7日,最高人民法院公布了《最高人民法院关于互联网法院审理案件若干问题的规定》&…

用了一下AI代码补全工具,真爽!

前言 ChatGPT把AI带火了,我就在想,能用它做点什么呢,总不能只让它给我们带来焦虑,也要让我们从科技浪潮中分得一点红利吧。一番查找下来,有个功能对我们程序员来说比较实用,就是AI的代码提示补全功能。最先…

「料见」vol25.回顾 | PKU-Beaver开源项目团队:一起来聊首个可复现的RLHF基准

为了解决复现RLHF技术和基于RLHF技术的大预言模型的不安全问题,北京大学团队开源了名为PKU-Beaver(海狸)开源项目。 第25期料见闭门分享会,我“门”非常开心邀请到PKU-Beaver开源项目团队成员——北京大学人工智能研究院助理教授…

聊一下计算机程序员转行情感博主

(点击即可收听) 不知不觉,已经入行这行业第7个年头 现在身边一些00后也步入职场,看到他们那种初生牛犊不怕虎,想到了当年的自己职场当中的人来人往,铁打的营盘,流水的兵 早就已经习惯了,毕竟天下没有不散宴…

Reactive响应式编程系列:解密Lettuce如何实现响应式

响应式编程历史悠久,早在2005年,Microsoft Cloud Programmability Team 开始探索一种简单的编程模型,以构建大规模的异步和数据密集型互联网服务架构,响应式编程的理念逐步诞生。这本是为了解决服务端系统而提出的理念&#xff0c…

深度学习入门学习小记录5——【Pytorch】,模型推理间隔较大时,推理耗时增加且存在波动

目录 前言 ChatGPT的回答: 实际测试 解决方法: 来自chatGPT的解答: 前言 最近在进行模型部署的工作,比较关注模型的推理耗时,发现相同的模型在推理时存在耗时波动。所以做了一些小测试,并做一下经验记…

【chatgpt提效工具——cursor】

一、cursor: 地址:https://www.cursor.so/ 使用方法 ctrlk:需求 ctrlL:对话 二、vscode插件 cursorcode: 界面 快捷键一:在代码框中按下CtrlAltY弹出代码生成/优化命令框 快捷键二:在代码框中按下CtrlAltU弹出…

在Apple Watch上使用Siri发送消息的方法

1.抬起手腕唤醒Apple Watch后,说Hey Siri。或者,按住“ Digital Crown ”(数字表冠)或简单地举起您的手腕,然后在“ 提高说话能力”已启用的情况下开始讲话。说向[联系人/电话号码]发送消息。也可以说类似“告诉[联系]…

为什么每次和 Siri 聊天我都一肚子火

硅谷Live / 实地探访 / 热点探秘 / 深度探讨 全世界最痛苦的事,就是和一个跟你不在同一频道的人尬聊。 相反,和自己的亲朋好友另一半说话就轻松多了,比如你说 “今天上班好累啊”,你的家人、朋友就会说,“那今晚别做饭…

苹果“Enhanced Siri”,你知道多少?

小编发现从2015年2月,中国大陆开发CarPlay认证窗口后, CarPlay在市场上的普及度越来越高, 说到CarPlay认证,圈子内的人都能说出几个专业词语,而其中"Siri"就是最耳熟能详的。专业词语说大家都会能提两个词&a…

Logoist - 适用于设计师以及初次使用者,快速制作精美 logo

Logoist - 适用于设计师以及初次使用者的快速制作精美 logo 工具 从简单的标识到设计开发。它只需要一点时间来创建令人印象深刻的图像和矢量图形与Logoist。 我们的一体化应用程序为您提供了您需要的一切,将您的创意付诸实践或寻找新的灵感!它适合专业设计师和插画…

chatgpt赋能Python-python照片处理

介绍 Python是一种高级编程语言,它被广泛用于图像和照片处理。Python的大量第三方库和框架使得它成为处理照片的理想工具。本文将介绍如何用Python处理照片,并展示Python在照片处理领域的强大功能。 用Python处理照片 Python中最常用的照片处理库是Pi…

Midjourney词典秘籍,你真的不来看看吗?

引言: 今日有幸得到Midjourney秘籍,在此分享给各位伙伴,因篇幅限制,可以私我免费分享完整版,快来看看吧。

解密亚洲一号巨型仓储管理

解密亚洲一号巨型仓储管理 由京东商城运营研发部仓储研发部分享的有关京东一号巨型仓储管理经验... 详细解读 和小伙伴们一起来吐槽

【麒麟操作系统】查看和关闭139、445端口的方法

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、查看139、445端口的方法二、关闭139、445端口的方法 三、139、445端口的作用 前言 作为国产操作系统,无论是银河麒麟,还是中标麒麟…

Apache 首次亚洲在线峰会: Workflow 数据治理专场

背景 大数据发展到今天已有 10 年时间,早已渗透到各个行业,数据需 求越来越多,这使得大数据 业务间的依赖关系也越来越复杂,另外也相信做数据的伙伴肯定对如何治理数据也是痛苦之至,再加上现今云原生时代的要求&#x…

2021十大亚洲现货黄金交易APP平台排名榜单

对于国内投资者而言,贵金属投资有内、外盘之分,因此在选择平台时,投资者应该从市场成熟度和产品优势出发,先明确自己在哪一个市场进行投资,再挑选那些信誉度极高、以客户利益为大前提、在行业内排名较前平台。 至于外…