开源大语言模型LLMs汇总

ce75b8be3d34e0cb41491ccee4e0ea05.gif

向AI转型的程序员都关注了这个号👇👇👇

大语言模型

大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。

发展历史

2020年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个享用GPT-3能力的公司。2022年,Open AI发布ChatGPT模型用于生成自然语言文本。2023年3月15日,Open AI发布了多模态预训练大模型GPT4.0。

2023年2月,谷歌发布会公布了聊天机器人Bard,它由谷歌的大语言模型LaMDA驱动。2023年3月22日,谷歌开放Bard的公测,首先面向美国和英国地区启动,未来逐步在其它地区上线。

2023年2月7日,百度正式宣布将推出文心一言,3月16日正式上线。文心一言的底层技术基础为文心大模型,底层逻辑是通过百度智能云提供服务,吸引企业和机构客户使用API和基础设施,共同搭建AI模型、开发应用,实现产业AI普惠。

开源大语言模型

本文列举了截止到 2023 年 6 月 8 日开源的大语言模型

1、LLaMA

简介

meta 开源的 LLaMA

LLaMA完全是在公共开源预训练数据上训练。并且取得相当不错的效果,LaMA-13B在绝大部分的benchmarks上超越了GPT-3(175 B),并且LLaMA-65B的效果能够和最好的大模型,Chinchilla-70B以及PaLM-540B相比。

Meta宣称会将LLaMA开源出来

论文及代码

论文:https://arxiv.org/abs/2302.13971v1

代码:https://github.com/facebookresearch/llama

2、ChatGLM - 6B

简介

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

论文及代码

代码:https://github.com/THUDM/ChatGLM-6B

官网:https://chatglm.cn/blog

3、Alpaca

简介

Stanford Alpaca: An Instruction-following LLaMA Model

This is the repo for the Stanford Alpaca project, which aims to build and share an instruction-following LLaMA model. The repo contains:

The 52K data used for fine-tuning the model.

The code for generating the data.

The code for fine-tuning the model.

The code for recovering Alpaca-7B weights from our released weight diff.

Note: We thank the community for feedback on Stanford-Alpaca and supporting our research. Our live demo is suspended until further notice.

Usage and License Notices: Alpaca is intended and licensed for research use only. The dataset is CC BY NC 4.0 (allowing only non-commercial use) and models trained using the dataset should not be used outside of research purposes. The weight diff is also CC BY NC 4.0 (allowing only non-commercial use).

论文及代码

论文:https://arxiv.org/abs/2212.10560

代码:https://github.com/tatsu-lab/stanford_alpaca

4、PandaLLM

简介

Panda: 海外中文开源大语言模型

Panda 系列语言模型目前基于 Llama-7B, -13B, -33B, -65B 进行中文领域上的持续预训练, 使用了接近 15M 条数据, 并针对推理能力在中文 benchmark 上进行了评测, 希望能够为中文自然语言处理领域提供具有泛用性的通用基础工具.

我们的 Panda 模型以及训练涉及的中文数据集将以开源形式发布,任何人都可以免费使用并参与开发。我们欢迎来自全球的开发者一起参与到该项目中,共同推动中文自然语言处理技术的发展。我们后续会进一步完善针对中文语言模型基础能力的评测,同时开放更大规模的模型。

论文及代码

论文:https://arxiv.org/pdf/2305.03025v1.pdf

代码:https://github.com/dandelionsllm/pandallm

5、GTP4ALL

简介

Open-source assistant-style large language models that run locally on your CPU.

GPT4All is made possible by our compute partner Paperspace.

GPT4All is an ecosystem to train and deploy powerful and customized large language models that run locally on consumer grade CPUs.

A GPT4All model is a 3GB - 8GB file that you can download and plug into the GPT4All open-source ecosystem software. Nomic AI supports and maintains this software ecosystem to enforce quality and security alongside spearheading the effort to allow any person or enterprise to easily train and deploy their own on-edge large language models.

论文及代码

代码:https://github.com/nomic-ai/gpt4all

6、DoctorGLM (MedicalGPT-zh v2)

简介

基于 ChatGLM-6B的中文问诊模

论文及代码

论文:https://arxiv.org/pdf/2304.01097.pdf

代码:https://github.com/xionghonglin/DoctorGLM

huggingface:https://huggingface.co/zhaozh/medical_chat-en-zh

7、MedicalGPT-zh v1

简介

本项目开源了基于ChatGLM-6B LoRA 16-bit指令微调的中文医疗通用模型。基于共计28科室的中文医疗共识与临床指南文本,我们生成医疗知识覆盖面更全,回答内容更加精准的高质量指令数据集。以此提高模型在医疗领域的知识与对话能力。

论文及代码

论文:https://arxiv.org/pdf/2304.01097.pdf

代码:https://github.com/MediaBrain-SJTU/MedicalGPT-zh

8、Cornucopia-LLaMA-Fin-Chinese

简介

聚宝盆(Cornucopia): 基于中文金融知识的LLaMA微调模型

本项目开源了经过中文金融知识指令精调/指令微调(Instruct-tuning) 的LLaMA-7B模型。通过中文金融公开数据+爬取的金融数据构建指令数据集,并在此基础上对LLaMA进行了指令微调,提高了 LLaMA 在金融领域的问答效果。

基于相同的数据,后期还会利用GPT3.5 API构建高质量的数据集,另在中文知识图谱-金融上进一步扩充高质量的指令数据集。

论文和代码

代码:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese/tree/main

数据集构建

目前采用了公开和爬取的中文金融领域问答数据,涉及到保险、理财、股票、基金、贷款、信用卡、社保等

指令微调的训练集数据示例如下:

  问题:办理商业汇票应遵守哪些原则和规定?

  回答: 办理商业汇票应遵守下列原则和规定:1.使用商业汇票的单位,必须是在银行开立帐户的法人;2.商业汇票在同城和异地均可使用;3.签发商业汇票必须以合法的商品交易为基础;4.经承兑的商业汇票,可向银行贴现;5.商业汇票一律记名,允许背书转让;6.商业汇票的付款期限由交易双方商定,最长不得超过6个月;7.商业汇票经承兑后,承兑人即付款人负有到期无条件交付票款的责任;8.商业汇票由银行印制和发售。

针对现有数据仍存在不准确和不完善的地方,后续我们会利用GPT3.5接口围绕中文金融知识库进一步构建与拓展问答数据,设置多种Prompt形式来充分利用知识迭代更新数据集。

9、minGPT

简介

A PyTorch re-implementation of GPT, both training and inference. minGPT tries to be small, clean, interpretable and educational, as most of the currently available GPT model implementations can a bit sprawling. GPT is not a complicated model and this implementation is appropriately about 300 lines of code (see mingpt/model.py). All that’s going on is that a sequence of indices feeds into a Transformer, and a probability distribution over the next index in the sequence comes out. The majority of the complexity is just being clever with batching (both across examples and over sequence length) for efficiency.

论文及代码

代码:https://github.com/karpathy/minGPT

10、InstructGLM

简介

基于ChatGLM-6B+LoRA在指令数据集上进行微调。

论文及代码

代码:https://github.com/yanqiangmiffy/InstructGLM

11、FastChat

简介

FastChat is an open platform for training, serving, and evaluating large language model based chatbots. The core features include:

The weights, training code, and evaluation code for state-of-the-art models (e.g., Vicuna, FastChat-T5).

A distributed multi-model serving system with Web UI and OpenAI-compatible RESTful APIs.

论文及代码

代码:https://github.com/lm-sys/FastChat

Model Weights

Vicuna Weights

We release Vicuna weights as delta weights to comply with the LLaMA model license. You can add our delta to the original LLaMA weights to obtain the Vicuna weights. Instructions:

Get the original LLaMA weights in the Hugging Face format by following the instructions here.

Use the following scripts to get Vicuna weights by applying our delta. They will automatically download delta weights from our Hugging Face account.

12、Luotuo-Chinese-LLM

简介

骆驼(Luotuo): 开源中文大语言模型

骆驼(Luotuo)项目是由冷子昂 @ 商汤科技, 陈启源 @ 华中师范大学 以及 李鲁鲁 @ 商汤科技 发起的中文大语言模型开源项目,包含了一系列语言模型。

代码:https://github.com/LC1332/Luotuo-Chinese-LLM

13、CamelBell-Chinese-LoRA

简介

同【 12、Luotuo-Chinese-LLM】

代码:https://github.com/LC1332/CamelBell-Chinese-LoRA

14、alpaca-lora

简介

This repository contains code for reproducing the Stanford Alpaca results using low-rank adaptation (LoRA). We provide an Instruct model of similar quality to text-davinci-003 that can run on a Raspberry Pi (for research), and the code is easily extended to the 13b, 30b, and 65b models

In addition to the training code, which runs within hours on a single RTX 4090, we publish a script for downloading and inference on the foundation model and LoRA, as well as the resulting LoRA weights themselves. To fine-tune cheaply and efficiently, we use Hugging Face’s PEFT as well as Tim Dettmers’ bitsandbytes.

Without hyperparameter tuning, the LoRA model produces outputs comparable to the Stanford Alpaca model. (Please see the outputs included below.) Further tuning might be able to achieve better performance; I invite interested users to give it a try and report their results.

代码:https://github.com/tloen/alpaca-lora

其他开源项目,待补充。。。

参考

https://github.com/mymusise/ChatGLM-Tuning

https://huggingface.co/BelleGroup/BELLE-7B-2M

https://github.com/LianjiaTech/BELLE

https://huggingface.co/datasets/BelleGroup/generated_train_0.5M_CN

https://huggingface.co/datasets/JosephusCheung/GuanacoDataset

https://guanaco-model.github.io/

https://github.com/carbonz0/alpaca-chinese-dataset

https://github.com/THUDM/ChatGLM-6B

https://huggingface.co/THUDM/chatglm-6b

https://github.com/lich99/ChatGLM-finetune-LoRA

机器学习算法AI大数据技术

 搜索公众号添加: datanlp

b4f81257785b9b91058872252bd88bd4.jpeg

长按图片,识别二维码


阅读过本文的人还看了以下文章:

TensorFlow 2.0深度学习案例实战

基于40万表格数据集TableBank,用MaskRCNN做表格检测

《基于深度学习的自然语言处理》中/英PDF

Deep Learning 中文版初版-周志华团队

【全套视频课】最全的目标检测算法系列讲解,通俗易懂!

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门:基于Python的理论与实现》高清中文PDF+源码

《深度学习:基于Keras的Python实践》PDF和代码

特征提取与图像处理(第二版).pdf

python就业班学习视频,从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材

笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源!CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师,你的面试为什么过不了?

前海征信大数据算法:风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类

VGG16迁移学习,实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七):图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分?

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师(共四面)通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

6eb9de1818c6e2ac049be080871a6d48.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39069.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

黑群辉DSM 6.2.3 系统安装

修改引导程序配置文件 首先我们可以使用ChipEasy芯片无忧查找U盘的VID和PID。 以下图为例,这个U盘的VID是0930,PID是6544。 请记录好这两个值。下面修改配置文件需要用到。 逻辑盘符 : E:\ 此分区容量: 7.2G 设备ID : VID 090C PID 2000 设备序列号: …

群晖外网访问之安装神卓互联NAS插件的方法(保证成功)

PS:本教程适合x86架构也适合ARM架构的群晖系统,白群晖和小猫盘均可以。 最近买了一台群晖DS218play,家里还有一台DS918,总共算是有两台NAS了,但是苦于只能在家里的局域网访问,想实现在外面比如公司访问家里…

玩转群晖NAS套件系列五:Moments的安装与使用保姆级教程!

本章总结: 上一章节我们讲解《玩转群晖NAS套件系列四:Audio Station安装使用保姆级教程!》,此教程堪称史上手把手的保姆教程,受到广大网友的一致好评。 Moments是群晖专为多媒体文件量身定做的,它可以识别你…

2022年10月 cpolar软件实现内网穿透连接群晖NAS

前言 1.cpolar简介 cpolar是一款拥有远程控制和内网穿透功能的软件。而且还可以监控端口的HTTP请求,利用实时的cpolar Web UI开发者工具,让您调试代码更容易。您可以监听所有隧道上的HTTP消息包,分析消息包的结构内容,找出问题点…

黑群晖6.1.4-DS3615xs_65217安装使用教程、含下载资源、亲测有效

安装所需硬件条件 黑群晖号称无硬件要求,就像java号称一次编译到处执行一样,打广告骗新手而已,别太当真。 首先,正版的群晖,你肯定就得用他们自己的硬件,该硬件有绝对合适的硬件环境,还有产品识…

玩转群晖NAS套件系列六:Web Station的安装与使用保姆级教程!

本章总结: 上一章节我们讲解《玩转群晖NAS套件系列五:Moments的安装与使用保姆级教程!》,此教程堪称史上手把手的保姆教程,受到广大网友的一致好评。 Web Station这个套件是群晖的http/https服务器,也就是W…

威联通NAS与群晖NAS通过Cloud Sync与webDAV实现文件同步的详细图文操作

威联通T453Dmini和群晖DS920,想实现两台NAS中的某个文件夹同步功能,如何实现,具体操作如下: 1.假如想把威联通NAS中的“软件”文件夹与群辉NAS中的“软件”文件夹进行同步,首先这两个NAS中要有这个文件夹,…

群晖DS920+ NAS操作手册(个人原创编写)

一、 NAS基本信息 二、访问方式 2.1 通过域名连接 1)在浏览器中输入NAS域名(QC ID或公网域名):quickconnect.cn/XXX。 2)输入账户密码,NAS连接成功。 2.2 通过IP直接连接 2.2.1 通过局域网IP直接连接…

玩转群晖NAS套件系列一:cloud sync套件的安装与使用保姆级教程!

玩转群晖NAS套件系列一:cloud sync套件的安装与使用保姆级教程! 本章前言: 关于群晖NAS本章系列文章就不做详细讲解,伴随近几年私有云的兴起,群晖NAS已经是人人皆知,群晖NAS是图形化的nas,是一款…

手把手教你创建群晖nas「共享文件夹」,从此告别 U 盘和低效传输

现如今,线上办公已经成为形势所趋,如何高效协作也成了职场人共同追求的目标📁 为了便于线上的文件管理与分发,我们可以在群晖nas上创建共享文件夹。将成员邀请到共享文件夹内,各成员可上传文件到在线文件夹中&#xff…

玩转群晖NAS套件系列四:Audio Station安装使用保姆级教程!

本章总结: 上一章节我们讲解《玩转群晖NAS套件系列三:Video Station安装使用保姆级教程!》,此教程堪称史上手把手的保姆教程,受到广大网友的一致好评。 很多人喜欢听音乐,但苦于手机容量有限,需…

黑群晖折腾之安装Transmission并替换TWC增强中文界面

Transmission一款好的下载工具,但是默认的界面,管理功能太少了而且丑 一、首先安装Transmission这个BT下载程序。 1、进入群晖点击套件中心–设置–套件来源,点新增添加一个源:http://packages.synocommunity.com/ 后保存。 2.安…

玩转群晖NAS套件系列七:File Station的安装与使用保姆级教程!

本章概述: 上一章节我们讲解《玩转群晖NAS套件系列六:Web Station的安装与使用保姆级教程!》,此教程堪称史上手把手的保姆教程,受到广大网友的一致好评。 File station这个是群晖系统预装的套件,非常重要并…

黑群晖nas安装保姆级教程

前言: 本人适合许多新手入门有硬件用途和许多东西反正自我感觉是保姆级的教程。 第1次发帖,有些问题请多多指教。 以前踩过的坑一一的说出来,100%适合小白,一站式服务也可以在评论区交流。 本文会从 用途→ 硬件→ 系统 首先介绍用途 有些…

群晖DS Video(Station)自动同步视频简介和海报(最新官方解决方案)

目录 一、前言 二、前提 三、实现 1、注册The Movie Database账号 2、创建API 3、修改群辉Hosts A、在群辉中开启SSH的访问 B、然后通过ssh命令登录到群辉后台 C、通过sudo -i指令切换到root用户指令:sudo -i D、通过vi指令修改hosts文件内容 E、保存hos…

黑群晖安装Transmission和emby搭建家庭影音娱乐中心服务器(下)

原文网址:https://www.toutiao.com/i6670307858770297348/ 原文作者:无敌稻草人 教你怎么组建自己的NAS之第六篇:黑群晖安装Transmission和emby搭建家庭影音娱乐中心服务器(下) 【背景介绍】:在《与时俱…

【产品工具使用】黑群晖史上最强安装教程

黑群晖 文章链接 https://blog.csdn.net/was172/article/details/106176930/https://www.openos.org/threads/dsm-6-2-3-2020-12-27.29/https://post.smzdm.com/p/aqx07xmk/https://www.huakings.cn/post/130.html 视频链接: https://www.bilibili.com/video/BV…

废旧笔记本改造安装黑群晖打造私人NAS超级详细图文教程

事情是这样的 在我们楼下居住了10年的租客搬走了,我感到十分的悲伤!怀着沉重的心情到楼下去收拾空荡荡的房子。 然后…在一个不起眼的柜子里发现了一台被丢弃的废旧联想笔记本!作为一个合格的垃圾佬,怎么可能放过如此良机呢&…

【宇麦科技】群晖NAS套件之Drive的客户端安装与配置(二),新手必读!

Synology Drvie 随时存取,不限平台 可从浏览器、桌面客户端,和移动设备上随时存取数据。 同步和备份 通过实时同步、备份和计划备份重要文件夹,保护您的数据,并避免数据因误删或勒索软件威胁而无法挽回。 轻松、顺畅的协作 使用…

第一届法律科技创新设计竞赛启动报名

1 赛事概况 随着新一代信息技术的发展,智能软件和工具市场快速增长,法律科技逐渐成为企业法务、律师服务、司法工作信息化创新发展的重点领域。同时,法律科技创新也成为解决法律服务领域中短板问题的重要途径。目前,推动算法模型指…