DB-GPT:强强联合Langchain-Vicuna的应用实战开源项目,彻底改变与数据库的交互方式

今天看到 蚂蚁科技 Magic 开源的DB-GPT项目,觉得创意很好,集成了当前LLM的主流技术,主要如下

  • Langchain: 构建在LLM之上的应用开发框架
  • HuggingFace: 模型标准,提供大模型管理功能
  • Vicuna: 一个令GPT-4惊艳的开源聊天机器人,基于LLaMA模型和ShareGPT数据集训练的,能够达到接近ChatGPT/Bard的质量,而且明显优于其它基准模型

本文针对DB-GPT详细了解下的笔记

什么是DB-GPT

DB-GPT : Revolutionizing Database Interactions with Private LLM Technology

DB-GPT是一个实验性的开源项目,它使用本地化的GPT大型模型与数据和环境进行交互。使用此解决方案,没有数据泄露的风险,数据是100%私密和安全的。

DB-GPT使用FastChat创建了一个庞大的模型操作系统,并提供了一个由Vicuna驱动的大型语言模型。此外,还提供了私有领域知识库问答功能、对其他插件的支持、支持Auto-GPT插件。

DB-GPT愿景是使围绕数据库和llm构建应用程序变得更容易、更方便。

GPT项目可以直接本地部署连接到私有数据库, 进行私有数据处理, 目前已支持SQL生成、SQL诊断、数据库知识问答、数据处理等一系列的工作

关键特性

  • SQL语言功能
    • SQL生成
    • SQL诊断
  • 私人领域的问答和数据处理
    • 知识管理(目前支持多种文档格式:txt, pdf, md, html, doc, ppt和url)
    • 数据库知识问答
    • 知识嵌入(knowledge Embedding)
  • 插件
    • 支持自定义插件执行任务,并原生支持Auto-GPT插件,例如:
      • 自动执行SQL和检索查询结果
      • 自动爬取和学习知识(crawling and learning of knowledge)
  • 知识库的统一矢量存储/索引
    • 支持PDF、TXT、Markdown、CSV、DOC、PPT、webl等非结构化数据
  • 支持多个LLMs
    • 支持多种大型语言模型,目前支持Vicuna (7b,13b), ChatGLM-6b (int4, int8), guanaco(7b,13b,33b), Gorilla(7b,13b),🔥llama-2(7b, 13b, 70b)
    • TODO: baichuan(7b, 13b)

架构图

具备的能力如下

  • 知识库能力:支持私有领域知识库问答能力
  • 大规模模型管理能力:提供基于FastChat的大型模型操作环境。
  • 统一的数据矢量存储和索引:提供统一的方式来存储和索引各种数据类型
  • 连接模块:用于连接不同模块和数据源,实现数据流和交互
  • 代理和插件:提供代理和插件机制,允许用户自定义和增强系统的行为
  • 提示生成和优化:自动生成高质量的提示并进行优化,提高系统响应效率
  • 多平台产品接口:支持web、移动、桌面等多种客户端产品。
    在这里插入图片描述

子模块

  • DB-GPT-Hub Text-to-SQL parsing with LLMs
  • DB-GPT-Plugins DB-GPT Plugins, Can run autogpt plugin directly
  • DB-GPT-Web ChatUI for DB-GPT

整个知识库的处理过程,可参考如下:
在这里插入图片描述

使用到的开源项目

这个项目是站在巨人的肩膀上,没有开源社区是无法工作的。

  • FastChat for providing chat services
  • vicuna-13b as the base model
  • langchain tool chain
  • Auto-GPT universal plugin template
  • Hugging Face for big model management
  • Chroma for vector storage
  • Milvus for distributed vector storage
  • ChatGLM as the base model
  • llama_index for enhancing database-related knowledge using in-context learning based on existing knowledge bases.

部署硬件说明

DB-GPT在消费级GPU即可完成部署, 具体部署的硬件说明如下:

GPU型号显存大小性能
TRX409024G可以流畅的进行对话推理,无卡顿
TRX309024G可以流畅进行对话推理,有卡顿感,但好与V100
V10016G可以进行对话推理,有明显卡顿

Roadmap

参考

LLM实战系列(1)—强强联合Langchain-Vicuna应用实战
LLM实战系列(2) —— DB-GPT阿里云部署指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65432.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试官:从 MySQL 读取 100w 数据进行处理,应该怎么做?

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享 点击关注#互联网架构师公众号,领取架构师全套资料 都在这里 0、2T架构师学习资料干货分 上一篇:ChatGPT研究框架(80页PPT,附下载)…

Spring Boot 实现日志链路追踪,无需引入组件,让日志定位更方便!

因公众号更改推送规则,请点“在看”并加“星标”第一时间获取精彩技术分享 点击关注#互联网架构师公众号,领取架构师全套资料 都在这里 0、2T架构师学习资料干货分 上一篇:ChatGPT研究框架(80页PPT,附下载)…

chatgpt赋能python:Python如何将PDF转换为Word文档

Python如何将PDF转换为Word文档 在现代电脑使用的日常工作中,PDF格式的文档已经变得很普遍。这种文件格式十分方便,但是有时候可能需要将PDF文件转换为Word文档。幸运的是,Python提供了多种方法来实现这个目标。 为什么要将PDF转换为Word&a…

chatgpt赋能python:Python基础教程:如何利用Python进行地区查询

Python基础教程:如何利用Python进行地区查询 在现代社会,人们越来越关注自己所处的地理位置和周边环境。这就导致了地区查询变得越来越流行,因为它可以让人们更加方便地获取自己想要的信息。 Python作为一门强大的编程语言,不仅…

很多人都去考了计算机二级证书,它真的有用吗?来看看吧

我相信在大学期间,很多人都会选择自考计算机二级的证书,那么就有不少人提出疑问:计算机二级证书真的有用吗? 其实我觉得不应该去凭借一个观点去认为他是否有用,主要还是你掌握了多少知识。我认为大学本身就是一个去不断积累知识的过程,重要的不是你拿的这个证书的结果,…

Tsai库---分享一个好用的时间序列库

分享一个好用的时间序列库 tsai库github地址:https://github.com/timeseriesAI/tsai 使用手册:https://timeseriesai.github.io/tsai/ 描述 tsai是一个先进的时间序列和序列深度学习库。是建立在Pytorch &fastai之上的开源深度学习包,可…

计算机信息处理技术员初级难不难,考信息处理技术员之前,这些问题你要知道!...

信息处理技术员具有计算机与信息处理的基础知识,能根据应用部门的要求,熟练使用计算机有效地、安全地进行信息处理操作,能对个人计算机系统进行日常维护,具有助理工程师(或技术员)的实际工作能力和业务水平。 01信息处理技术员是职…

charles证书过期-mac

手机已安装证书并且信任还是抓不到包,大概率是charles证书过期了 1.重置证书 help > SSL Proxying >Reset Charles Root Certificate... 2.点击Reset 3.在启动台打开「钥匙串访问」 找到对应证书 设置为「始终信任」

计算机考证可以退钱吗?

可以!计算机考试在报名期间可以登录报名系统进行退费申请,申请成功后,考试费用将按原支付渠道退回考点;通过集体考点报考的考生,将按原支付渠道退回考点,再由考点退还给考生。由于疫情原因,2020…

中级通信工程师证书会过期吗

通信行业中一般的证书都是有有效期的,比如的华为认证,有效期是3年,到证书持有者在证书超过有效期之前,可以通过再次通过考试或者通过本技术领域的更高级别认证的任意一门考试来延期证书的有效期。那么中级通信工程师证书有有效期吗…

图灵测试是什么?为什么AlphaGo那么牛却过不了?

导读:本文将介绍人工智能的检测手段——图灵测试。 作者:杜振东 涂铭 来源:大数据DT(ID:hzdashuju) 01 图灵测试相关背景 1946年,冯诺依曼发明了第一台计算机,这被后人称为20世纪最先…

python贪吃蛇游戏源码

python贪吃蛇游戏源码 源码如下: 如果没有安装pygame游戏库,需要安装后才能正常使用 pygame游戏库获取如下: https://pypi.org/project/pygame/ 源码如下: import random import sys import time import pygame from pygame.l…

Android贪吃蛇游戏实现

说明:贪吃蛇游戏是一款比较经典的休闲游戏,这是我做的第一个Android项目,会存在一些问题,文章包括项目的部分源码以及运行界面的一些图片,项目也参考学习了许多大佬的文章,会在文章最后面贴出参考文章&…

VC版的贪吃蛇游戏

学C的时候,课程设计编写了C版的贪吃蛇游戏,当时,将很多的东西都分装在了Snake类中,所以,将其移植到VC中,只需将Snake类稍作修改,然后添加到VC中即可。 此处,我感受到复用性的好处&am…

微信小程序:贪吃蛇

微信小程序:贪吃蛇 wx.js var startX 0; var startY 0; var moveX 0; var moveY 0; //移动位置和开始位置的坐标差值 var X 0; var Y 0; //蛇的对象 var snake {x: 0,y: 0,color: "#ff0000", w: 20,h: 20, } //食物对象 var food {x: 0,y: 0,co…

贪吃蛇的小程序

1 创建项目 1.打开微信开发者工具如图所示的界面&#xff0c;点击“ 2.填写项目以后&#xff0c;点击确定即可。如图所示&#xff1a; 2 编程 1.编写index.wxml的代码如下&#xff1a; <view class"container"><canvas style"width:100%;height:1…

【Python游戏】贪吃蛇升级版——双人贪吃蛇小游戏 | 附带源码

前言 之前做过一个单人版的贪吃蛇&#xff0c;所以常常就是我只能看着别人玩&#xff0c;或者别人看着我玩&#xff0c;却没法两个人一起愉快地玩耍。 由此产生了做一个可以双人玩的贪吃蛇想法&#xff0c;并且从小时候一直到现在&#xff0c;之前python还没有那么火的时候&am…

html版贪吃蛇

<!doctype html><html><head></head><body> <div id"box" style"width:256px;font:25px/25px 宋体;background:#000;color:#9f9;"></div><script> var arr[15]; var next10;//最好判断一下arr[1]!arr[0]x…

贪吃蛇智能版(高级)

说明&#xff1a; 在贪吃蛇智能版&#xff08;中级&#xff09;的基础之上&#xff0c;增加了判断小食物是否安全的方法&#xff0c;并且增加了在寻找食物路径失败和寻找尾巴失败之后&#xff0c;会进行一小段的随机溜达&#xff0c;直到重新找到路径为止&#xff0c;当然这段…

贪吃蛇微信小程序源码

每日分享两个小程序源码 下载地址&#xff1a;无极低码&#xff1a;wheart.cnhttps://wheart.cn/so/home?mdw&ridf6d836c8-d54a-11ed-96fa-52540016e6ac <!--snake.wxml--> <view class"control" bindtouchstart"tapStart" bindtouchmove&qu…