对标ChatGPT的开源中文方案

目录

前言

一、Meta发布大语言模型LLaMA

二、斯坦福基于 Meta 的 LLaMA 7B 模型微调出Alpaca

三、基于TencentPretrain训练中文LLaMA大规模语言模型

四、基于斯坦福Alpaca训练中文对话大模型BELLE

五、 清华开源项目ChatGLM中文对话模型

六、基于LLaMA的开源中文语言模型“骆驼”

总结


前言

新年伊始,火爆全网的 ChatGPT,仿佛开启了第四次工业革命,它像个无所不能的六边形战士,可以聊天、写代码、修改 bug、做表格、写论文、写作业、做翻译、搜索答案等……
自发布以来,ChatGPT 便已摧枯拉朽之势席卷各个行业,不仅 5 天时间便突破百万用户,月活用户更是仅用时 2 个月便突破 1 亿,成为史上增速最快的消费级应用,远超其他知名应用。



然而由于 OpenAI 没有开源 ChatGPT,如何有效的复现针对中文的 ChatGPT 已成为摆在大家面前的头号难题。
下面我会介绍一些对标ChatGPT的中文开源方案,代码地址也列在每个项目的介绍最上面,希望这些方案能够对大家有所帮助!

一、Meta发布大语言模型LLaMA

项目地址:GitHub - facebookresearch/llama: Inference code for LLaMA models

Meta一次性发布四种尺寸的大语言模型 LLaMA:7B、13B、33B和65B。还声称, 效果好过GPT,偏向性更低,更重要的是所有尺寸均开源,甚至13B的LLaMA在 单个GPU上就能运行。
Meta发布的LLaMA是 通用大语言模型,原理就不多赘述,和以往的大语言模型一样:将一系列单词作为输入,并预测下一个单词以递归生成文本。

这次,Meta之所以一次给出不同大小的LLaMA模型,论文中给出了这样的解释:

近来的研究表明,对于给定的计算预算,最佳性能不是由最大的模型实现的,而是由 基于更多数据训练的 更小的模型实现的。也就是说,较小的模型规模加上比较大的数据集,获得的性能可能会比更大规模模型的要好很多。一方面,小规模模型需要的计算能力和资源相对来说都会少很多,另一方面,它还能基于更多数据集 训练更多token,更容易针对特定的潜在产品用例进行重新训练和微调。

除了一次性给出四种尺寸的LLaMA,Meta这次还直接开源了这个大语言模型。更重要的是,Meta为了让自己的工作与开源兼容,使用的都是公开的数据。

二、斯坦福基于 Meta 的 LLaMA 7B 模型微调出Alpaca

项目地址:https://github.com/tatsu-lab/stanford_alpaca

三月初,斯坦福基于 Meta 的 LLaMA 7B 模型微调出一个新模型 Alpaca。该研究让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循(instruction-following)样本,以此作为 Alpaca 的训练数据。研究团队已将训练数据、生成训练数据的代码和超参数开源,后续还将发布模型权重和训练代码。
实验结果表明,Alpaca 的很多行为都与 text-davinci-003 类似。也就是说,只有 7B 参数的轻量级模型 Alpaca 性能可媲美 GPT-3.5 这样的超大规模语言模型。

三、基于TencentPretrain训练中文LLaMA大规模语言模型

项目地址:https://github.com/Tencent/TencentPretrain

TencentPretrain 是 UER-py 预训练框架的多模态版本,支持 BERT、GPT、T5、ViT、Dall-E、Speech2Text 等模型,支持文本、图像和语音模态预训练及下游任务。TencentPretrain 基于模块化设计,用户可以通过模块组合的方式构成各种模型,也可以通过复用已有的模块进行少量修改来实现新的模型。例如,LLaMA 的模型架构基于 Transformer 有三项改动:前置 normalization [GPT3]、SwiGLU 激活函数[PaLM]、旋转位置编码[GPTNeo]。
得益于模块化特性,该项目在 TencentPretrain 中基于 GPT2 模型的已有模块,仅添加约 100 行代码就能实现以上三个改动从而训练 LLaMA 模型。

效果如下所示:

HumanComputer
中国的首都在哪里中国首都是北京。
北京9月的平均气温是多少秋分,中国北京的平均气温为25.5℃。
列出一些能用于登山的装备To climb mountains, you should bring a lot of
> climbing equipment, including a compass, a climbing harness, a helmet,
> gloves, good shoes with plenty of ankle support, and a backpack.
介绍一下自然语言处理技术Natural language processing (NLP) is the study and design of algorithms that are able to understand and manipulate human language. 
帮我解答这个数学题: 6+3*26+3*2=11
生成一段代码来创建一个从1到100的列表def gen_list(n):
      """Generate a list from 1 to n""" 
          return [i for i in range(1, n+1)]

四、基于斯坦福Alpaca训练中文对话大模型BELLE

项目地址:https://github.com/LianjiaTech/BELLE

为了提升在中文上的效果,本项目基于Stanford Alpaca优化了中文种子任务,对生成代码进行了一些修改,同时选用BLOOMZ-7B作为基础模型训练得到了一个可以更好支持中文指令的开源模型 - BELLE。同时基于Alpaca的数据收集代码,基于这段代码生成了约100万条中文数据,结合Alpaca的5万条英文数据,在BLOOMZ-7B模型训练得到的checkpoint上传在Hugging Face。

项目包含以下内容:

  • 175个中文种子任务
  • 生成数据的代码
  • 1M + 0.5M生成的中文数据集
  • 基于BLOOMZ-7B1-mt优化后的模型

效果如下所示:

HumanComputer
 小明的爸爸有三个孩子,老大叫王一,老二叫王二,老三叫什么?

 

小明

 

用python写一个二分查找的代码def binary_search(arr, target):
  low = 0
  high = len(arr) - 1
  while (low <= high):
    mid = low + high // 2
    if arr[mid] == target:
      return mid
    elif target < arr[mid]:
      low = mid + 1
    else:
      high = mid - 1
  return -1
今天天气怎么样,把这句话翻译成英语What's the weather like today?
怎么让自己精力充沛,列5点建议以下是一些可以让你保持精力充沛的建议:
1. 睡眠充足。确保每天晚上得到充足的睡眠时间。
2. 多运动。进行适度的有氧运动,如慢跑、游泳等,可以帮助你提高能量和耐力。
3. 吃健康食品。选择富含蛋白质的食物,如鸡肉、鱼肉和鸡蛋,以及新鲜的水果和蔬菜。
4. 减少咖啡因的摄入量。尽量避免在白天喝含咖啡因的饮料或吃含有咖啡因的食物。
5. 放松身心。尝试冥想、瑜伽或其他形式的放松活动来减轻压力和焦虑感。
推荐几本金庸的武侠小说以下是三本我最喜欢的金庸武侠小说的推荐:
1. 《射雕英雄传》 - 一部充满智慧和机智的小说,讲述了郭靖、黄蓉夫妇的故事。
2. 《神雕侠侣》- 这是一部浪漫而感人的故事,讲述了一对情侣小龙女与杨过之间的爱情故事。
3. 《倚天屠龙记》- 这是一个宏伟而壮观的故事,描绘了明教领袖张无忌如何成为一位出色的英雄

五、 清华开源项目ChatGLM中文对话模型

项目地址:https://github.com/THUDM/ChatGLM-6B

据官方介绍,ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

效果如下所示:

六、基于LLaMA的开源中文语言模型“骆驼”

项目地址:https://github.com/LC1332/Chinese-alpaca-lora

这个模型是在Meta开源的LLaMA基础上,参考Alpaca和Alpaca-LoRA两个项目,对中文进行了训练,0.1版本的模型取得了基础的中文会话能力。

效果如下所示:

HumanComputer
中国的首都在哪里?中国的首都是北京。
麦当劳是哪个国家的?美国
2017年美国总统是谁?特朗普
华中师范大学在哪里?华中师范大学在武汉市。

总结

ChatGPT掀起的新一轮人工智能狂欢下,隐藏在背后的“大模型”正进入越来越多开发者的视野。正如有一句话说的那样:数据是燃料、模型是引擎、算力是加速器。ChatGPT的出现,恰如其分地诠释了数据、模型和算力的“化学反应”。

如何在垂直领域做出更有针对性模型也是未来的发展方向之一,尤其是算力以及数据不那么充足的情况下。

大家如果有什么好的想法和项目,也欢迎在评论区里留言评论!


参考:

1.开源方案复现ChatGPT流程!1.62GB显存即可体验,单机训练提速7.73倍_数据派THU的博客-CSDN博客

2.对标ChatGPT有哪些开源的方案? - 知乎 

3.训练中文LLaMA大规模语言模型 - 知乎

4.【开源GPT】三位华人小哥开源中文语言模型“骆驼”,单卡即可完成训练部署,花费几百训练自己的中文聊天模型 - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3909.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 开源了第一款插件,都来学习一下源码吧!

3 月 23 日&#xff0c;OpenAI 又投出了一枚重磅炸弹&#xff1a;为 ChatGPT 推出插件系统&#xff01; 此举意味着 ChatGPT 将迎来“APP Store”时刻&#xff0c;也就是围绕它的能力&#xff0c;形成一个开发者生态&#xff0c;打造出基于 AI 的“操作系统”&#xff01; 插…

开源版ChatGPT,30分钟训完,性能堪比GPT3.5!

转自&#xff1a;新智元 话说&#xff0c;ChatGPT 开源&#xff0c;是一件好事吗&#xff1f; 此前&#xff0c;OpenAI 不 Open 的事件&#xff0c;已经引发了坊间的诸多争议。 光放出基准和测试结果&#xff0c;不提供训练数据、成本、方法&#xff0c;是真的要「赢家通吃」了…

2023-02-18 什么是chatGPT?如何使用chatGPT?chatGPT可以胜任人类当前哪些工作?.什么是openAI?chatGPT的使用示例

文章目录 1.什么是chatGPT?2.如何使用chatGPT?3.chatGPT可以胜任人类当前哪些工作?4.什么是openAI?5,使用示例一:旅游攻略6.使用示例二:AI绘画 1.什么是chatGPT? chatGPT本质上是一个应用在对话场景中的语言模型,它是基于GPT3.5(Generative Pre-trained Transformer,是指…

人类与ChatGPT:互动中的共同进步

一、ChatGPT的发展历程 1. GPT模型 ChatGPT是由OpenAI推出的一款聊天机器人&#xff0c;其核心技术基于GPT模型。GPT模型&#xff08;Generative Pre-training Transformer&#xff09;是一种基于Transformer结构的预训练语言模型。它在大规模的文本语料库上进行无监督的预训…

零基础解读ChatGPT:对人类未来工作是威胁还是帮助?

摘要&#xff1a;火到现在的ChatGPT到底是什么&#xff1f;它背后有哪些技术&#xff1f;对于我们的工作和生活会有啥影响&#xff1f;快来一起了解吧~ 本文分享自华为云社区《零基础解读ChatGPT&#xff1a;对人类未来工作是威胁还是帮助&#xff1f;》&#xff0c;作者&#…

ChatGPT 是一种受到广泛关注的人工智能技术,它具备生成自然语言的能力,能够完成一些简单的文本生成、对话交互等任务。随着人工智能技术的不断发展,有人开始质疑 ChatGPT 是否能取代程序员,推动

ChatGPT 是一种受到广泛关注的人工智能技术&#xff0c;它具备生成自然语言的能力&#xff0c;能够完成一些简单的文本生成、对话交互等任务。随着人工智能技术的不断发展&#xff0c;有人开始质疑 ChatGPT 是否能取代程序员&#xff0c;推动着人类的智能化进程。本文将围绕“C…

【人工智能AI2.0】国产开源 ChatGPT: ChatGLM-6B 搭建属于你的永远免费的本地 ChatGPT

国产开源 ChatGPT: ChatGLM-6B 搭建属于你的永远免费的本地 ChatGPT 文章目录 国产开源 ChatGPT: ChatGLM-6B 搭建属于你的永远免费的本地 ChatGPTChatGLM-6B 介绍硬件需求使用方式环境安装代码调用Demo网页版 Demo命令行 Demo低成本部署模型量化CPU部署ChatGLM-webuiInstallre…

ChatGPT火了,对话式人工智能还能干嘛?

身兼数职的ChatGPT      从2022火到了2023      连日来一直是各大平台的热议对象      其实除了写诗、敲代码、处理文档      以ChatGPT为代表的      对话式人工智能      还有更重要的工作要做      对话式AI与聊天机器人      相信大多数人…

最近爆火chatGTP是人工智能还是人工智障?

关于chatGTP和一些话题? OpenAI 发布了 ChatGPT&#xff0c;是一个可以对话的方式进行交互的模型&#xff0c;因为它的智能化&#xff0c;得到了很多用户的欢迎。 ChatGPT是InstructGPT的兄弟模型&#xff0c;可以以对话的形式与用户交互&#xff0c;这使得ChatGPT能够回答问…

人工智能与Chat GPT

一本书全面掌握ChatGPT&#xff0c;既有向ChatGPT提问的技巧&#xff0c; 也有构建自己的ChatGPT模型的方法&#xff0c;涵盖开发背景、关联技术、使用方法、应用形式、实用案例等 人工智能是我们这个时代最热门的话题&#xff0c;人们既希望它能代替我们做一些工作&#xff0c…

CHATGPT是什么意思,人工智能软件chatGPT怎么用

在介绍 ChatGPT 平台之前&#xff0c;我们首先需要了解人工智能和自然语言处理&#xff08;NLP&#xff09;的概念&#xff0c;这对于进一步了解 ChatGPT 的使用非常重要。 人工智能是计算机科学中的一个分支&#xff0c;专注于研究如何赋予计算机类似于人类的智能。自然语言处…

阿猫智能机器人称:国内用户轻松训练类ChatGPT等大语言模型,使得人人都能拥有自己的ChatGPT!

4月12日&#xff0c;微软宣布开源了Deep Speed Chat&#xff0c;帮助用户轻松训练类ChatGPT等大语言模型&#xff0c;使得人人都能拥有自己的ChatGPT&#xff01;&#xff08;国内chatgpt平台阿猫智能机器人项目合作地址&#xff1a;https://3amao.comGptChat, AI, APIhttps://…

因为自家ChatGPT,谷歌「内讧」了

机器之心编辑部 首个 demo 就出错&#xff0c;发布会毫无亮点&#xff0c;谷歌的仓促连自家员工也看不下去了。 如今看来&#xff0c;微软和高启强一样&#xff0c;是略懂兵法的&#xff0c;微软使出了一招疲秦之策&#xff1a;早就开始了必应与 ChatGPT 的整合&#xff0c;然后…

苹果震撼发布首款头显,搭配强悍Mac和iOS 17等全新产品,价值25000元!

&#x1f337; 博主 libin9iOak带您 Go to New World.✨ &#x1f984; 个人主页——libin9iOak的博客&#x1f390; &#x1f433; 《面试题大全》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &#x1f30a; 《IDEA开发…

谷歌版 ChatGPT 首秀大翻车,市值暴跌 7000 亿!

转自 | 机器之心 现在看来&#xff0c;拼第一枪&#xff0c;微软赢了。 如今的谷歌&#xff0c;有点秦失其鹿的味道。 在微软更新 ChatGPT 加持的必应搜索之后&#xff0c;大家都极为关注谷歌 Bard 的首秀。怎知近日曝出的 Demo 大翻车&#xff0c;导致股票一夜之间暴跌 7000 亿…

ChatGPT引爆新一轮科技军备赛

出品&#xff5c;虎嗅科技组 作者&#xff5c;齐健 陈伊凡 编辑&#xff5c;陈伊凡头图&#xff5c;电影《华尔街之狼》 “一场针对AI的‘完美风暴’正在形成。” 一位产业投资人如此描述。 一时间&#xff0c;街头巷尾都在热议一个叫做ChatGPT的产品&#xff0c;ChatGPT相关概…

CSDN-InsCode (一个支持ai编程的代码分享社区网站)使用初体验

我叫Aaron,是一家研二在读计算机系学生。目前正在一家公司就职java后端研发实习。想往常一样正在逛csdn 的精选&#xff0c;看到一条 "Inscode 支持ai编程"的消息&#xff0c;我赶紧点进去看了下详情&#xff0c;并试用了Inscode的网站。在chatGPT大火的今天&#xf…

谷歌版ChatGPT首秀,第一个Demo就大翻车,市值暴跌7000亿

在微软更新 ChatGPT 加持的必应搜索之后&#xff0c;大家都极为关注谷歌 Bard 的首秀。怎知近日曝出的 Demo 大翻车&#xff0c;导致股票一夜之间暴跌 7000 亿人民币。而看微软那边&#xff0c;风景独好。 前后脚发布新一代 AI 搜索&#xff0c;人们的期待却完全反过来&#xf…

ChatGPT在GIS领域应用初测

1 引言 ChatGPT是由OpenAI开发的一种大型语言模型&#xff0c;它使用了Transformer架构&#xff0c;在大量现实世界文本数据上训练&#xff0c;以捕捉人类语言的复杂性和多样性。能够实现许多人工智能语言处理任务&#xff0c;如回答问题、进行翻译、修改代码、生成文档、文本等…

迎战 ChatGPT,Google 重组部门以专注 Bard 开发!

整理 | 朱珂欣 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 自从 ChatGPT 横空出世以来&#xff0c;完全可以用“杀疯了”来形容&#xff01; 尤其是整合了 ChatGPT 的新版 Bing &#xff0c;实现了“搜索答案聊天创造”相结合&#xff0c;一时之间让许多用户…