[算法前沿]--000-大模型LLaMA在docker环境搭建以及运行教程(含模型压缩)

文章目录

  • LLaMA
  • 论文
  • 步骤
      • 搭建步骤
      • 运行7B模型
      • 运行13B模型

未来已来,大模型依据压缩模型的方式,可以在普通的PC上运行.

LLaMA

Facebook的LLaMA 模型和Georgi Gerganov 的llama.cpp的结合。 LLaMA,这是一组包含 7B 到 65B 参数的基础语言模型。我们在数万亿个令牌上训练我们的模型,并表明可以仅使用公开可用的数据集来训练最先进的模型,而无需诉诸专有和不可访问的数据集。特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla-70B 和 PaLM-540B 竞争。我们将所有模型发布给研究社区。

论文

4位量化是一种减小模型大小的技术,因此它们可以在功能较弱的硬件上运行。它还减少了磁盘上的模型大小——7B 模型减少到 4GB,13B 模型减少到不到 8GB。
它完全有效!今晚我用它在我的笔记本电脑上运行 7B LLaMA 模型,然后今天早上升级到 13B 模型——Facebook 声称可以与 GPT-3 竞争的模型。

论文地址:Large language models are having their Stable Diffusion moment right now.

步骤

1.下载模型:

  1. 种子下载方式
  2. 签署的方式

搭建步骤


$ git clone https://github.com/ggerganov/llama.cpp
$ cd llama.cpp
$ docker pull ubuntu
$ sudo docker run -it -d -v ~/Desktop:/workspace --name llama imageid
$ sudo docker exec -it llama bash
$ apt install build-essential zlib1g-dev libncurses5-dev libgdbm-dev libnss3-dev libssl-dev libreadline-dev libffi-dev libsqlite3-dev wget libbz2-dev
$ apt install cmake python3.10 vim gcc # 下载模型 7B model/13B model/30B model/ 65B model bittorrennt(种子)
aria2c --select-file 21-23,25,26 'magnet:?xt=urn:btih:b8287ebfa04f879b048d4d4404108cf3e8014352&dn=LLaMA'下载到models路径下
$ ls ./models
13B
30B
65B
7B
llama.sh
tokenizer.model
tokenizer_checklist.chk$ pip install torch numpy sentencepiece
$ python convert-pth-to-ggml.py models/7B/ 1
$ make
$ ./quantize ./models/7B/ggml-model-f16.bin ./models/7B/ggml-model-q4_0.bin 2
# 这将生成型号/7B/ggml-model-q4_0.bin-3.9GB文件。这是我们将用于运行模型的文件。

运行7B模型

# 创建了ggml-model-q4_0.bin文件后,我们现在可以运行该模型了。
$ ./main -m ./models/7B/ggml-model-q4_0.bin \-t 8 \-n 128 \-p 'The first man on the moon was '
# ./main --help shows the options. -m is the model. -t is the number of threads to use. -n is the number of tokens to generate. -p is the prompt.$ usage: ./main [options]options:-h, --help            show this help message and exit-s SEED, --seed SEED  RNG seed (default: -1)-t N, --threads N     number of threads to use during computation (default: 4)-p PROMPT, --prompt PROMPTprompt to start generation with (default: random)-n N, --n_predict N   number of tokens to predict (default: 128)--top_k N             top-k sampling (default: 40)--top_p N             top-p sampling (default: 0.9)--temp N              temperature (default: 0.8)-b N, --batch_size N  batch size for prompt processing (default: 8)-m FNAME, --model FNAMEmodel path (default: models/llama-7B/ggml-model.bin)

我的第一个提示是第一个登上月球的人是-我得到了这个:

  • 测试

-p ‘def open_and_return_content(filename):’

def open_and_return_content(filename):"""Opens file (returning the content) and performs basic sanity checks"""if os.path.isfile(filename):with open(filename) as f:content = f.read()return contentelse:print('WARNING: file "{}" does not exist'.format(filename), file=sys.stderr)return ''def get_file_info(filename, fullpath):"""Get file information (i.e., permission, owner, group, size)"""

运行13B模型

参考建议运行13B没那么简单. 在运行任何转换之前,13B文件夹包含以下文件:

154B checklist.chk
12G consolidated.00.pth
12G consolidated.01.pth
101B params.json

转化脚本

$ convert-pth-to-ggml.py models/13B/ 112G ggml-model-f16.bin
12G ggml-model-f16.bin.1$ ./quantize ./models/13B/ggml-model-f16.bin   ./models/13B/ggml-model-q4_0.bin 2
$ ./quantize ./models/13B/ggml-model-f16.bin.1 ./models/13B/ggml-model-q4_0.bin.1 2

Then to run a prompt:

./main \-m ./models/13B/ggml-model-q4_0.bin \-t 8 \-n 128 \-p 'Some good pun names for a coffee shop run by beavers:-'

结果如下:
Some good pun names for a coffee shop run by beavers:

  • Beaver & Cat Coffee
  • Beaver & Friends Coffee
  • Beaver & Tail Coffee
  • Beavers Beaver Coffee
  • Beavers Are Friends Coffee
  • Beavers Are Friends But They Are Not Friends With Cat Coffee
  • Bear Coffee
  • Beaver Beaver
  • Beaver Beaver’s Beaver
  • Beaver Beaver Beaver
  • Beaver Beaver Beaver
  • Beaver Beaver Beaver Beaver
  • Beaver Beaver Beaver Beaver
  • Be

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25394.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聚观早报|恒大公告许家印成被执行人;特斯拉回应召回超百万辆车

今日要闻:恒大公告:许家印成被执行人;特斯拉回应召回超百万辆车;ChatGPT联网插件下周开放票;天翼物联发布首个3AZ亿级物联网平台;苹果MR头显功能预计远超竞争对手 恒大公告:许家印成被执行人 12…

微软OpenAI联盟,并非牢不可破

尚恩 发自 凹非寺量子位 | 公众号 QbitAI 就在今天,微软凭借近2.6万亿美元的市值,再次创下公司市值历史新高! 要说今年风头最盛的科技大厂,微软必定名列其中。 年初算起,背靠OpenAI的GPT-4等大模型技术,微软…

微软与 OpenAI,远没有看起来「亲密无间」

作者 | 鱼三隹 编辑 | 郑玄 看似亲密无间的微软与 OpenAI,隐忧已经浮现。 近日,根据《The Information》,微软的一份内部文件指示 Azure 的销售人员告诉客户微软能比 OpenAI 提供更多的服务;而 OpenAI 则在通过延迟授予微软产品 A…

互联网惊现 AI 鬼城:人类不得入内;阿里云史上最大规模降价,最高降幅达 50%;可致微信闪退的二维码Bug已找到|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

用 ChatGPT 读 Vue3 源码,会怎么样?

前言 ChatGPT 最近十分火爆,今天我也来让 ChatGPT 帮我阅读一下 Vue3 的源代码。 都知道 Vue3 组件有一个 setup函数。那么它内部做了什么呢,今天跟随 ChatGPT 来一探究竟。 实战 setup 函数在什么位置呢,我们不知道他的实现函数名称&…

Prompt 技巧指南-让 ChatGPT 回答准确十倍!

出品人:Towhee 技术团队 作者:张晨 随着 ChatGPT 等大型语言模型 (LLM)的兴起,人们慢慢发现,怎么样向 LLM 提问、以什么技巧提问,是获得更加准确的回答的关键,也由此产生了提示工程这个全新的领域。 提示工…

上市公司股价数据(含年度股价崩盘同步性数据)

一、股价崩盘数据 1、数据来源:国泰安数据库 2、时间跨度:2000-2020 3、区域范围:A股上市公司 4、指标说明: 参考最新文献,计算出度量股价崩盘相关衡量指标 具体指标如下: NCSKEW 公司股票收益率偏态…

CODESYS在工厂自动化中的应用:伊顿穆勒模块化控制器XC200

德国Sigloch Maschinenbau公司提供一种用于装订小册子和书籍等整套工艺流程的定制化生产线,包含集纸机、粘合装订机、底纸机、胶钉机和背衬机,干燥输送机,色带供料机。 整套自动化流水线的设备均由美国伊顿穆勒(Moeller&#xff…

为何世界足坛历史射手王是C罗?

C罗,一直是我很欣赏的球员,曾经在诺坎普,看过梅罗对决,当时的C罗,年轻气盛,全场球迷的嘘声,必不可少,但丝毫没影响他的状态,虽然他攻入一球,但皇马1:2落败&am…

打造汽车“安卓平台”,大众或亲手干掉传统汽车产业

干掉传统汽车产业的,很可能是大众,而不是特斯拉。\n 于无声处听惊雷。\n 2019年的日内瓦车展,看起来并没有传出太大的新闻。汽车世界的目光,依然被特斯拉的喧嚣所吸引。\n 然而,大众汽车展台上发生的一件看似不起眼…

零食社交 or 甜蜜陷阱?说说公司那些免费提供的零食饮料

很多公司都提供免费的零食、水果和饮料。说起来是件轻松愉快的事情,可是,偏偏有人因为这些小福利离职,还有人因为它们损害了健康……对于这些随便吃、随便喝、随便拿的东西应该采取什么样的态度才能于己有利?很多公司在普通零食之…

华为开发者大会上,鸿蒙问世、方舟编译器开源、还有 EMUI 10;壕置100万美元,苹果推出漏洞攻击报告赏金计划……...

关注并标星星CSDN云计算 极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快、更全了解泛云圈精彩news go go go 鸿蒙OS正式对外发布&am…

青年必读书——民国名流开具的书单

95 年前,一众文化、政治名流为当时的青年们开具了一份必读书单。今天的青、中、老年们不妨拿来看看,或许还有些借鉴之用。 本文由笔者根据 “《京报副刊》青年必读书十部,青年爱读书十部资料汇编” 一书整理而成。整理者才疏学浅&#xff0c…

AIGC应用层项目到底要不要现在出来融资?

告诉大家一个好消息:“4月26日北京路演的九个项目,有三个项目已经过会了。” 看到本文的读者相信已经不需要再去普及AIGC的概念和定义了,科技媒体和公众号里充斥着大量有关AIGC的文章,跟元宇宙开始火的时候如出一辙,知…

2023中国电子签领域最具商业合作价值企业盘点

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 近年来,中国数字经济规模不断扩张,成为拉动经济增长的重要发展引擎。产业数字化有利于电子签名在各产业的应用和渗透,给电子签名行业带来广阔的发展空间。受新冠疫情影响,越来…

数字中国看“浙”里丨太平鸟、实在智能、新秀丽等企业共探企业数智转型之路

当前,数字经济已成为重组全国要素资源、变革经济格局的关键力量。中共中央、国务院印发的《数字中国建设整体布局规划》中提出要培育壮大数字经济核心产业,研究制定推动数字产业高质量发展的措施,打造具有国际竞争力的数字产业集群&#xff0…

Qt编写魔塔小游戏

目录 一.游戏大致内容 1.玩家角色 2.怪物 3.可触发的物品 4.不可触发的物品 5.地图 6.(玩家与怪物的技能) 二.实现逻辑 三.具体实现 1.角色类声明 2.怪物类声明 3.地图类声明 4.主界面声明 5.玩家角色的构造 6.怪物的构造 7.地图的构造 8.主界…

ChatGLM-6B 安装试用

地址: https://github.com/THUDM/ChatGLM-6B https://huggingface.co/THUDM/chatglm-6b git clone https://github.com/THUDM/ChatGLM-6B conda create -n chatglm python3.8 conda activate chatglm cd ChatGLM-6B/ pip install -r requirements.txt试用以下代码&…

(非华为电脑,最新版PCManager安装,支持鸿蒙、一碰传

非华为电脑,最新版PCManager安装,支持鸿蒙、一碰传 与常规安装略有不同1.下载软件和获得nfc标签但淘宝nfc标签安装教程,一般都是老版的没有支持升级,一碰传安装步骤略有不同2.修改系统时间3.打开安装工具注意1.先修改地址&#xf…

Android 录音实现方法、仿微信语音、麦克风录音、发送语音

效果图(注!由于使用的模拟器录制,所以图片中的录音时候话筒上下波动比较小,手机上正常!): 使用方法: 录音工具类:AudioRecoderUtils.java,代码如下&#x…