Java搭建法律AI助手,快速实现RAG应用

使用AI4J快速接入RAG应用 | 结合Pinecone实现法律AI助手RAG应用

本博文给大家介绍一下如何使用AI4J快速接入OpenAI大模型,并且结合Pinecone向量数据库实现一个刑法AI助手的RAG应用。

介绍

由于SpringAI需要使用JDK17和Spring Boot3,但是目前很多应用依旧使用的JDK8版本,所以使用可以支持JDK8的AI4J来接入OpenAI大模型。

AI4J是一款JavaSDK用于快速接入AI大模型应用,整合多平台大模型,如OpenAi、Ollama、智谱Zhipu(ChatGLM)、深度求索DeepSeek、月之暗面Moonshot(Kimi)、腾讯混元Hunyuan、零一万物(01)等等,提供统一的输入输出(对齐OpenAi)消除差异化,优化函数调用(Tool Call),优化RAG调用、支持向量数据库(Pinecone),并且支持JDK1.8,为用户提供快速整合AI的能力。

AI4J-GitHub

Pinecone

Pinecone向量数据库是一个云原生的向量数据库,具有简单的API和无需基础架构的优势。它可以快速处理数十亿条向量数据,并实时更新索引。同时,它还可以与元数据过滤器相结合,以获得更相关、更快速的结果。

Pinecone是完全云托管的,容易上手、扩展轻松,用户可以放心使用。

注册与使用

大家可以进入Pinecone官网进行注册和登录,至于注册账号,这里不在演示,相信大家都会。

选择Database->Indexes->Create Index来创建索引
20240926160552

在这里可以输入你的维度,或者点击Setup by model,根据模型来选择向量维度。这里我以text-embedding-3-large模型为例子
20240926160742
20240926160633

创建完成后,记录自己的Host,我们后面要用到
20240926163211

创建自己的API Key
20240926163332

快速使用

之前已经为大家提供了两篇文档,可供大家参考:

  • 快速接入SpringBoot、接入流式与非流式以及函数调用
  • Java快速接入qwen2.5、llama3.1等Ollama平台开源大模型

引入AI4J依赖

<!-- Spring应用 -->
<dependency><groupId>io.github.lnyo-cly</groupId><artifactId>ai4j-spring-boot-stater</artifactId><version>0.6.3</version>
</dependency>

注意版本,尽量选择最新的版本。0.6.3之前的版本对RAG的实现有一些bug

如果你使用阿里源无法引入,可能是阿里云镜像还没有同步。

配置application.yml

20240926174959

注意:

你需要填写上文Pinecone提供的HostAPI Key

由于目前版本的AI4J只实现了OpenAiEmbedding服务,所以这里也需要配置OpenAi的信息。

Chat服务可以使用OpenAi的也可以使用其它的平台如OllamaZhipu等等。

如果没有OpenAi的官方key,大家可以使用中转API
[低价中转平台] 低价ApiKey

搭建RAG服务Test类

这里以一个简单的Test类来演示,大家可以比葫芦画瓢自己搭建Controller

建立RAG知识库

既然要建立RAG应用,那肯定少不了知识库。

本文搭建的是一个简单的法律AI助手,所以我们需要一个法律知识库。

接下来我以刑法知识库为例为大家讲解

可以将所需要的知识库,存入一个文本文档当中:
20240926180216

存储至Pinecone向量数据库中
@SpringBootTest
public class RagTest {// 1. 注入Pinecone服务@Autowiredprivate PineconeService pineconeService;// 2. 注入AI服务@Autowiredprivate AiService aiService;@Testpublic void test_rag_store() throws Exception {// 3. 获取Embedding服务IEmbeddingService embeddingService = aiService.getEmbeddingService(PlatformType.OPENAI);// 4. Tika读取file文件内容String fileContent = TikaUtil.parseFile(new File("D:\\data\\test.txt"));System.out.println(fileContent);// 5. 分割文本内容RecursiveCharacterTextSplitter recursiveCharacterTextSplitter = new RecursiveCharacterTextSplitter(1000, 200);List<String> contentList = recursiveCharacterTextSplitter.splitText(fileContent);System.out.println(contentList.size());// 6. 转为向量Embedding build = Embedding.builder().input(contentList).model("text-embedding-3-large").build();EmbeddingResponse embedding = embeddingService.embedding(build);List<List<Float>> vectors = embedding.getData().stream().map(EmbeddingObject::getEmbedding).collect(Collectors.toList());VertorDataEntity vertorDataEntity = new VertorDataEntity();vertorDataEntity.setVector(vectors);vertorDataEntity.setContent(contentList);System.out.println(vertorDataEntity);// 7. 向量存储至pineconeInteger count = pineconeService.insert(vertorDataEntity, "abc-123-abc");System.out.println(count > 0 ? "存储成功" : "存储失败");}}

下图是插入成功的数据
20240926175841

RAG查询
    @Testpublic void test_rag_query() throws Exception {// 8. 获取Embedding服务IEmbeddingService embeddingService = aiService.getEmbeddingService(PlatformType.OPENAI);// 9. 构建要查询的问题,转为向量String question = "如何挑选最甜的西瓜?";Embedding build = Embedding.builder().input(question).model("text-embedding-3-large").build();EmbeddingResponse embedding = embeddingService.embedding(build);List<Float> questionEmbedding = embedding.getData().get(0).getEmbedding();// 10. 构建向量数据库的查询对象PineconeQuery pineconeQueryReq = PineconeQuery.builder().namespace("abc-123-abc").topK(5).vector(questionEmbedding).build();// 11. 查询// PineconeQueryResponse queryResponse = pineconeService.query(pineconeQueryReq);// delimiter为想用什么字符拼接查询出来的内容String retrievalContent = pineconeService.query(pineconeQueryReq, " ");String contentFormat = "你是一个善于回答中华人民共和国刑法相关问题的助手。请使用以下提供的检索内容和自身知识来回答问题。如果你不知道答案,请直接说不知道,不要杜撰答案。请用三句话以内回答,保持简洁。\n" +"\n" +"问题:%s\n" +"\n" +"检索内容:%s";String content = String.format(contentFormat, question, retrievalContent);// 12. 获取Chat服务IChatService chatService = aiService.getChatService(PlatformType.OPENAI);// 13. 构建Chat请求ChatCompletion chatCompletion = ChatCompletion.builder().model("gpt-4o").message(ChatMessage.withUser(content)).build();// 14. 发送Chat请求ChatCompletionResponse chatCompletionResponse = chatService.chatCompletion(chatCompletion);System.out.println("问题:" + question);System.out.println("回答:" + chatCompletionResponse.getChoices().get(0).getMessage().getContent());System.out.println("花费tokens:" + chatCompletionResponse.getUsage().getTotalTokens());}

下图是测试的结果:

4c591c25daebbe54b97d928b613ff1e

9edd6bd6f688b87068959b9c1b04e7f

至此我们已经完成了一个RAG应用的搭建,大家可以根据自己的需求搭建自己的RAG应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/433191.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea中.git文件夹存在但是没有git功能列表

1.问题&#xff1a; 该项目中已经将.git文件夹置入了&#xff0c;但是idea中却没有git相关的功能列表&#xff0c;如图&#xff1a; 2.解决办法&#xff1a; 在【文件】-【设置】-【版本控制】-【目录映射】中添加目录映射应用就好了 &#xff08;【File】 -> 【S…

为家增添幸福气息:八卦福·门牌的吉祥寓意

八卦福门牌作为一种独特的家居装饰&#xff0c;不仅美观&#xff0c;还蕴含着丰富的文化内涵和吉祥寓意。它通过融合八卦与“福”字的象征&#xff0c;提升家庭的幸福气息。以下将详细探讨八卦福门牌的吉祥寓意以及如何为家庭增添幸福。 八卦福门牌的吉祥寓意 八卦的象征&…

HTML、CSS

初识web前端 web标准 Web标准也称为网页标准&#xff0c;由一系列的标准组成&#xff0c;大部分由W3C (World Wide Web Consortium&#xff0c;万维网联盟) 负责制定。三个组成部分: HTML: 负责网页的结构(页面元素和内容)。CSS: 负责网页的表现(页面元素的外观、位置等页面样…

使用AT command 修改手机APN

文章目录 使用AT command 修改手机APN其他AT command 使用AT command 修改手机APN 首先通过设备管理器查找到手机所使用的串口号。 然后通过putty 等串口连接软件&#xff0c;以telnet的方式连接手机。 连接成功后先&#xff0c;查看手机的 APN&#xff1a; ATCGDCONT可以用于…

多维时序 | GWO-VMD-SSA-LSTM灰狼优化变分模态分解联合麻雀优化长短期记忆网络多变量时间序列光伏功率预测(Matlab)

多维时序 | GWO-VMD-SSA-LSTM灰狼优化变分模态分解联合麻雀优化长短期记忆网络多变量时间序列光伏功率预测 目录 多维时序 | GWO-VMD-SSA-LSTM灰狼优化变分模态分解联合麻雀优化长短期记忆网络多变量时间序列光伏功率预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 …

runwayML启动500万美元基金资助AI生成影视

runwayML公司近日宣布启动一项大胆的计划&#xff0c;旨在推动人工智能在电影制作中的应用。该公司已设立一个基金&#xff0c;投入500万美元的现金以及额外的服务积分&#xff0c;支持多达100部使用其人工智能视频生成器的原创电影。这一举措不仅为电影制作人提供了一个前所未…

护眼台灯哪个品牌更好?五款由专业眼科医生推荐的护眼台灯

台灯是每个家庭中不可或缺的照明设备&#xff0c;尤其是对于有学龄儿童的家庭来说&#xff0c;孩子们每天在家学习和做作业时&#xff0c;一款优秀的护眼台灯显得尤为重要。如果长期使用的台灯是不合格&#xff0c;不能给孩子提供一个好的光照环境&#xff0c;那么孩子们的视力…

【C/C++】【基础数论】33、算数基本定理

算术基本定理&#xff0c;又称正整数的唯一分解定理。 说起来比较复杂&#xff0c;但是看一下案例就非常清楚了 任何一个大于 1 的正整数都可以唯一地分解成有限个质数的乘积形式&#xff0c;且这些质数按照从小到大的顺序排列&#xff0c;其指数也是唯一确定的。 例如&#…

mobaxterm、vscode通过跳板机连接服务器

目标服务器&#xff1a;111.111.11.11 跳板机&#xff1a;100.100.10.10 1. mobaxterm通过跳板机连接服务器 1.1 目标服务器信息 1.2 跳板机信息 1.3 登录 点击登录&#xff0c;会输入密码&#xff0c;成功 参考&#xff1a;https://blog.csdn.net/qq_40636486/article/det…

Cocos 3.8.3 实现外描边效果(逃课玩法)

本来想着用Cocos 的Shader Graph照搬Unity的思路来加外描边&#xff0c;发现不行&#xff0c;然后我就想弄两个物体不就行了吗&#xff0c;一个是放大的版本&#xff0c;再放大的版本上加一个材质&#xff0c;这个材质面剔除选择前面的面剔除就行了&#xff0c;果不其然还真行。…

冒泡排序-C语言

1.问题&#xff1a; 从小到大对10个数进行排序&#xff0c;要求使用冒泡排序实现。 2.解答&#xff1a; 排序规律有两种&#xff1a;一种是“升序”&#xff0c;从小到大&#xff1b;另一种是“降序”&#xff0c;从大到小。 3.代码&#xff1a; #include<stdio.h>//头…

展锐平台的手机camera 系统isptool 架构

展锐平台的isptool 主要用于支持展锐各代芯片isp的各效果模块快速tuning和参数生成打包。 具体需要&#xff1a; 一、工具段能在线实时预览到调试sensor经过isp 处理后的图像&#xff0c;也就是各模块的参数在当下实时生效&#xff0c;通过工具能在PC 上在线观看到修改的效果。…

Python中的数据处理与分析:从基础到高级

在数据科学和数据分析领域&#xff0c;Python凭借其丰富的库和强大的生态系统&#xff0c;成为了最受欢迎的语言之一。本文将从基础到高级&#xff0c;详细介绍如何使用Python进行数据处理和分析&#xff0c;涵盖数据清洗、数据转换、数据可视化等多个方面。 1. 数据导入与导出…

【07】纯血鸿蒙HarmonyOS NEXT星河版开发0基础学习笔记-Swiper轮播组件与样式结构重用

序言&#xff1a; 本文详细讲解了关于我们在页面上经常看到的轮播图在鸿蒙开发中如何用Swiper实现&#xff0c;介绍了Swiper的基本用法与属性&#xff0c;及如何面对大段的重复代码进行封装和重用&#xff08;Extend、Styles、Builder&#xff09;&#xff0c;使代码更加简洁易…

WPF项目中使用Caliburn.Micro框架实现日志和主题切换

目录 一、添加Caliburn.Micro框架 二、配置Serilog日志 三、实现主题切换 Caliburn.Micro是MVVM模式的轻量级WPF框架&#xff0c;简化了WPF中的不少用法。这个框架中所有的页面控制都是通过ViewModel去实现的。 以下内容是自己在进行项目实战的同时进行记录的&#xff0c;对于…

局域网广域网,IP地址和端口号,TCP/IP 4层协议,协议的封装和分用

前言 在古老的年代&#xff0c;如果我们要实现两台机器进行数据传输&#xff0c; A员工就得去B员工的办公电脑传数据&#xff08;B休息&#xff0c;等A传完&#xff09;&#xff0c;这样就很浪费时间 所以能不能不去B的工位的同时&#xff0c;还能传数据。这时候网络通信就出来…

智能抠图怎么操作?4款不动手自动抠图的智能神器分享

对于资深的图片设计师们来说&#xff0c;抠图是他们必备的基础技能&#xff0c;没几下功夫就能在PS中操作完成。 然而对于小编这种修图小白来讲&#xff0c;拥有一款傻瓜式智能抠图免费软件&#xff0c;才是硬道理&#xff01; 小到简单的图形文字、大到飞扬细碎的毛发&#…

贴片式TF卡(SD NAND)参考设计

【MK 方德】贴片 TF 卡参考设计 一、电路设计 1、 参考电路&#xff1a; R1~R5 (10K-100 kΩ)是上拉电阻&#xff0c;当 SD NAND 处于高阻抗模式时&#xff0c;保护 CMD 和 DAT 线免受总线浮动。 即使主机使用 SD NAND SD 模式下的 1 位模式&#xff0c;主机也应通过上拉电阻…

传奇微端黑屏不更新地图?传奇微端架设教程——GOM引擎

登录器和网站配置好后&#xff0c;我们进入游戏后会发现是黑屏的&#xff0c;更新不了地图和NPC这些&#xff0c;因为还没有做微端&#xff0c;会黑屏也是正常的。有些老G做了微端但是还是黑屏&#xff0c;就可能是你的微端架设出现了问题&#xff0c;可以参考以下教程。 gom引…

MQTT--快速入门

目录 1、什么是MQTT2、MQTT协议特性3、MQTT协议原理3.1 发布/订阅、主题、会话3.2 MQTT协议中的方法3.3 MQTT协议数据包结构 4、MQTT工作流程总结PS: 1、什么是MQTT MQTT&#xff08;Message Queuing Telemetry Transport&#xff0c;消息队列遥测传输协议&#xff09; &#…