测试在 4090 上运行 vicuna-33b 进行推理

测试在 4090 上运行 vicuna-33b 进行推理

news/2024/11/14 18:11:48/文章来源:https://blog.csdn.net/engchina/article/details/131471175

测试在 4090 上运行 vicuna-33b 进行推理

今天尝试在 4090 上运行 vicuna-33b 进行推理，使用的是 8bit 量化。

运行命令如下，

python3 -m fastchat.serve.cli --model-path lmsys/vicuna-33b-v1.3 --load-8bit

结论，使用 8bit 量化在 4090 上可以运行 vicuna-33b 进行推理，显存用到大概 23239MiB，GPU 使用率基本全程 100%，推理过程非常非常慢。
在这里插入图片描述
完结！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/29915.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【VSCode】VSCode把英文版设置为中文

【VSCode】VSCode把英文版设置为中文

在你安装Visual Stdio Code时没有注意选择中英文版本，那就看这里呀打开界面，看这里点击红框框------扩展搜索Chinese点击（中文简体）安装即可。

阅读更多...

chatgpt赋能python：如何下载Python中文插件？

chatgpt赋能python：如何下载Python中文插件？

如何下载Python中文插件？ Python是一种高级编程语言，它非常受欢迎。由于其易学性和开放源码的特性，许多人都正在学习或使用这个语言。然而，有时候，如果您使用Python编写的程序需要支持中文，您可能会发现需…

阅读更多...

智能合约通过getAmountsOut方法获取最近币对价格

智能合约通过getAmountsOut方法获取最近币对价格

一、UniswapV2Library合约源码使用的方法： 二、演示效果合约请求返回值： swap结果： 三、部分代码 function getTokenPrice(uint total) public view returns (uint[] memory amount1){address[] memory path new address[](2);path[0]…

阅读更多...

作为一名外贸业务员，如何正确跟进客户？

作为一名外贸业务员，如何正确跟进客户？

大量销售实践证明，在首次沟通中就达成交易的客户只有5%左右，而剩下的95%都是通过后续的跟进逐渐达成的。由此可见，跟进客户对于外贸朋友们促进业务有着举足轻重的作用。很多人不够重视对客户的后续跟进，只把关注点放在对新客户的…

阅读更多...

当“海外华人”发现淘宝/天猫以后……

当“海外华人”发现淘宝/天猫以后……

既然国内能兴起“海淘热”，为什么国外就不能呢？在年末双11、黑五、双12、双节（圣诞/元旦）的加持下，电商的海外市场之战掀起高潮。预计到2018年，中国跨境电商交易规模将达到8.8万亿元。毫无疑问&#xff0c…

阅读更多...

语音聊天室 anyHouse 使用手册

语音聊天室 anyHouse 使用手册

视频展示 anyHouse 操作演示目标读者本文针对首次使用 anyHouse 的用户。项目概述年初的时候因为马斯克的一场直播带货，让 Clubhouse 迅速出圈变成现在炙手可热的社交产品。为了帮助开发者快速打造自己风格的 Clubhouse。anyRTC 开源了仿 Clubhouse 语音模块…

阅读更多...

taobao.trade.postage.update( 修改交易邮费价格 )

taobao.trade.postage.update( 修改交易邮费价格 )

￥开放平台免费API必须用户授权修改订单邮费接口，通过传入订单编号和邮费价格，修改订单的邮费，返回修改时间modified,邮费post_fee,总费用total_fee。 API取消加邮费功能通知：http://open.taobao.com/support/announce…

阅读更多...

HTTP－C#模拟登录淘宝联盟并下载淘宝客订单xls

HTTP－C#模拟登录淘宝联盟并下载淘宝客订单xls

本程序实现模拟登录淘宝联盟并且下载淘宝客订单xls文件。现提供源码下载，有不明白的可以问我，同时如果您有好的修改建议请回复。我是第一次开发Http程序，请多包涵。本次开发环境与工具如下： IE9.0浏览器 IE抓包插件HttpWatch WI…

阅读更多...

淘宝关了我的店封了我的号, 严重歧视程序员开店

淘宝关了我的店封了我的号, 严重歧视程序员开店

我注册淘宝10年了, 2007年时花了50元办了淘宝建行的银行卡开通了支付宝, 不是我们支持, 他哪有今天. 但淘宝一直歧视程序员开店, 从没看到过有程序员的软件APP目录, 我做为一名程序员只能接定制单, 卖源码. 但是好景也不长. 2017-5-23号在我发了个自己写的QQ相册源码后, 封…

阅读更多...

阿里妈妈账号PID和淘宝账号PID的区别

阿里妈妈账号PID和淘宝账号PID的区别

一、问题描述做淘宝客，我们会遇到两种pid，一种是阿里妈妈账号的pid，一种是淘宝账号对应的pid 当我们访问 http://www.alimama.com/，看到右边的登录框，如图 (1)当我们使用这里的淘宝联盟会员登录后，我们看…

阅读更多...

GPT自动理解视频、法律顾问、大模型安全围栏

GPT自动理解视频、法律顾问、大模型安全围栏

每天都要浏览大量AI相关新闻，是不是感到信息量爆炸，有效信息少，无从看起？ 这么多新产品和新工具，到底哪些是真正是有价值的，哪些只是浮躁的热点？ 想参与AI产品和工具的开发，但苦于…

阅读更多...

ChatGPT开始商业化！2023年AI将给企业带来哪些新机遇？

ChatGPT开始商业化！2023年AI将给企业带来哪些新机遇？

去年11月，美国人工智能研究实验室OpenAI发布了一款AI对话机器人——ChatGPT，一经推出，就在科技圈引发了热议。ChatGPT“脱胎”于OpenAI在2020年发布的GPT-3，在3.0的基础上进行了应用层的强化训练，提高了对话质量。 Ch…

阅读更多...

ChatGPT教我使用计算机名挂载共享文件夹

ChatGPT教我使用计算机名挂载共享文件夹

前言试了一下最近火爆世界的ChatGPT，牛！真的牛！！！ 网上很多人说它会淘汰普通程序员等职业者。。我个人认为是不会的，它不会给你一份完整的工程源码。。它革的是搜索引擎命，而不是各种职业…

阅读更多...

ChatGPT介绍 (文末有彩蛋)

ChatGPT介绍 (文末有彩蛋)

一、chatGPT简介 ChatGPT是一种基于GPT（Generative Pre-train Transformer）模型的大型语言模型，由OpenAI公司开发。它是目前世界上最先进的自然语言处理技术之一。 GPT是一种基于神经网络的语言模型，使用了非常大的数据集进行预训…

阅读更多...

《周易》乾卦-彖

《周易》乾卦-彖

《彖》曰：大哉乾元，万物资始，乃统天。云行雨施，品物流形。大明终始，六位时成，时乘六龙以御天。乾道变化，各正性命，保合太和，乃利贞。首出庶物，万国咸宁。人道…

阅读更多...

JavaScript专题实例学习三注册，js三级联动等

JavaScript专题实例学习三注册，js三级联动等

JavaScript专题实例学习三这个在实际项目中用到的还是比较多的，所以如果虽然懂，但不太清楚的，不妨也来复习下。如果觉得文章不错，对你有帮助，请作者喝杯咖啡，谢谢！如果对您有帮助 &#xff0…

阅读更多...

意大利奢华品牌菲拉格慕香水联名下午茶；星巴克月饼全新上市 | 食品饮料新品...

意大利奢华品牌菲拉格慕香水联名下午茶；星巴克月饼全新上市 | 食品饮料新品...

星巴克、雀巢、菲仕兰、麦当劳中国、苏格兰威士忌The Glen Grant、成都万达瑞华酒店与菲拉格慕等企业最新动态。新品上市 2021星巴克月饼全新上市星巴克以“新|月一起圆”为主题打造了四款月饼礼盒。星巴克通过最大化地使用环保概念材料，并采用创新设计延续包装生…

阅读更多...

阿里出品的最新版 Java 开发手册，嵩山版，扫地僧

阿里出品的最新版 Java 开发手册，嵩山版，扫地僧

说起嵩山，我就想起乔峰，想起慕容复，以及他们两位老爹在少林寺大战的场景。当然了，最令我印象深刻的就是那位默默无闻，却一鸣惊人的扫地僧啊。这次，阿里出品的嵩山版 Java 开发手册的封面就有一个扫地僧&…

阅读更多...

核芯物联蓝牙AOA定位解决方案合作伙伴嘉兴太和国内首家发布uwb蓝牙AOA混合部署方案

核芯物联蓝牙AOA定位解决方案合作伙伴嘉兴太和国内首家发布uwb蓝牙AOA混合部署方案

深圳核芯物联蓝牙AOA定位解决方案合作伙伴嘉兴太和国内首家发布uwb&蓝牙AOA混合部署方案深圳核芯物联科技有限公司蓝牙AoA产品合作伙伴浙江嘉兴太和信息国内首家发布的uwb&蓝牙AOA混合部署方案解决卫星信号无法覆盖的区域内的定位需求问题背景：移动互联网…

阅读更多...

用JQ+AJAX+PHP+Mysql做简单的用户注册功能

用JQ+AJAX+PHP+Mysql做简单的用户注册功能

文章目录题目要求使用方法index.html 文件代码index.js 文件代码index.css 文件代码city_code.json 文件代码initDataBases.php 文件代码register.php 文件代码执行过程演示题目要求题目要求 > 创建一个Mysql数据库，库中有一个名为user的数据表，包…

阅读更多...

最新文章

推荐文章