【visualGPT的配置与体验】

Visual GPT简介

微软发布了一个叫做VISGPT的东西,继承了很多个模型,可以实现图片的处理
这个gpt不但可以接受图片文字输入,还能够输出图片,个人觉得离解放生产力更进一步了。我个人不喜欢瞎逼逼,单纯的把项目链接就放这里了:
https://github.com/microsoft/visual-chatgpt
下面开始介绍我的使用经历

项目clone与环境配置

首先声明,visgpt分为很多个功能模块,读者可以根据自己的需求启动相应的模块。而且要想在本地运行,至少需要一张3060(显存6GB+),因为一个大一点的功能模块(比如文字转图片)就要吃掉3个GB多,再加上基础的那个功能就是4.5GB左右了,3060玩他够呛,要是单纯想自己玩玩就行,推荐colab。
在本地配置项目照他给的Quick Start来就行了,我最开始尝试把它放在自己创建的一些目录下,结果发现会带来一些奇奇怪怪的问题,踩了不少坑。
在这里插入图片描述
然后就是openai的API了,怎么生成这个自行查阅,一般github项目网页会给你对应的链接.
每个人最开始有一定的免费额度,然鹅我的账号申请的比较早,在四月一18美元就过期了,于是我自己买的token。(最开始我不知道我的额度没了,给我报错)
在这里插入图片描述
在这里插入图片描述
当你拿到你的免费API,或者说搞定了payment。导入你的openai 的API key,上图的方法不能永久写入conda环境,如果想永久写入conda环境,这个自己查(我用了但我忘了)
接下来就是运行了,本地运行后他会根据你运行的功能模块下载对应的模型,见下图,输入python巴拉巴拉后会下载对应的东东
在这里插入图片描述

这个模型好大啊,我尝试下载了它所有的功能模块
在这里插入图片描述

关于tokens的购买

简单说一下怎么买token,国内的一切卡,就连国内银行发的visa也亲测无效,你需要一张国外的信用卡。虚拟卡就行,这个有个叫depay的软件应该就能搞定,也有其他途径,我不列举了。在支付绑卡的时候,注意用工具生成好姓名地址账单信息截图做好准备。支付的地址最好选免税州。余额不够时不能支付,存多少用多少不能透支。
拿到卡后把它跟你的openai绑在一块儿就行,会根据你的使用情况扣费的。

使用体验

我没敢多体验,就画了一只猫猫,因为舍不得tokens
在这里插入图片描述
另外我最后配齐了组件,就是它的每个功能模块我都下载了对应的GPU版本好大啊,环境本身需要的package我装了6个G,另外就是各种模型的参数,有27.2个G,下图右下叫红色的那一片全都是
在这里插入图片描述

后记(关于生产力)

我拿它尝试修图,下边是我的原图
在这里插入图片描述
我叫他给我refine,磨皮啥的,do as photoshop does,结果效果很奇特,现在看来这玩意离转化为生产力还有一定的距离啊
在这里插入图片描述
在这里插入图片描述
上边是他“PS”的结果…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24294.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

热门chat-gpt-3.5-vscode最简单的实用教程

步骤 1,下载vscode编程软件(可以直接下载VSCODE不用设置环境) 【编辑器】VSCode的Web前端(html,css,JavaScript)开发环境打造_vscode配置html开发环境_小哈里的博客-CSDN博客 2,下…

视觉图像的通用智能:基于GPT和大语言模型思考

作者丨谢凌曦知乎 内容只代表作者观点 来源丨https://zhuanlan.zhihu.com/p/620631150 引言 距离上次的长篇大论,已经过去了半年有余。这段时间,对于AI业界甚至整个世界,都是惊心动魄的。在这段时间里,最令人印象深刻的大事莫过于…

VALSE 2023 | 走向计算机视觉的通用人工智能:GPT和大语言模型带来的启发

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【目标检测和Transformer】交流群 作者:谢凌曦 | 源:知乎(已授权转载) https://zhuanlan.zhihu.com/p/620631150 声明 文章所有…

【综述专栏】VALSE 2023 | 走向计算机视觉的通用人工智能:GPT和大语言模型带来的启发...

来源:知乎—谢凌曦 作者:https://zhuanlan.zhihu.com/p/620631150 转载声明 本文可以规范转载,无需通知本人。转载时请注明出处(知乎链接)、标明作者,并且注明:文章所有内容均只代表作者本人观点…

Vision-AGI-Survey

视觉图像的通用智能:基于GPT和大语言模型思考 感谢大佬 这是搬来看看 大佬勿怪~~ 距离上次的长篇大论,已经过去了半年有余。这段时间,对于AI业界甚至整个世界,都是惊心动魄的。在这段时间里,最令人印象深刻的大事莫过…

VALSE 2023 | 走向CV的通用人工智能:GPT和大模型带来的启发

作者 | 谢凌曦 编辑 | 极市平台 原文链接:https://zhuanlan.zhihu.com/p/620631150 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心【AIGC】技术交流群 导读 CV是否已经做好实现发展大一统的任务和…

李沐论文精度系列之九:InstructGPT

文章目录 一、背景1.1 时间线1.2 ChatGPT功能展示1.3 指示学习(Instruct Learning)和提示(Prompt Learning)学习1.4 人工反馈的强化学习(RLHF) 二、摘要三、导言3.1 算法3.2 结论 四、方法和实验细节4.1 数…

LLM-2022:InstructGPT【GPT3-(问题和答案拼成一段对话,使用这些对话微调GPT3)->SFT(监督微调)-(SFT的答案排序后的数据集上再训练)->RM->RL(强化学习)】

一、前言 GPT系列是OpenAI的一系列预训练文章,GPT的全称是Generative Pre-Trained Transformer,顾名思义,GPT的目的就是通过Transformer为基础模型,使用预训练技术得到通用的文本模型。目前已经公布论文的有文本预训练GPT-1,GPT-2,GPT-3,以及图像预训练iGPT。据传还未发…

基于GLM-6B对话模型的实体属性抽取项目实现解析:对Zero-shot与In-Context Learning的若干思考...

来自:老刘说NLP 进NLP群—>加入NLP交流群 Zero-shot、One-shot以及Few-shot让人傻傻分不清,读了很多文章,也没搞清楚他们的差别,究竟什么叫zero-shot,其在应用过程中的no gradient update是什么含义,zer…

在疯狂三月之后,深入浅出分析AIGC的核心价值 (下篇)|【AI行研商业价值分析】

Rocky Ding 公众号:WeThinkIn 写在前面 【AI行研&商业价值分析】栏目专注于分享AI行业中最新热点/风口的思考与判断。也欢迎大家提出宝贵的优化建议,一起交流学习💪 大家好,我是Rocky。 本文是《在疯狂三月之后,深…

软件开发最难的不是编码,而是需求,你认同吗?

【编者按】文章主要讨论了在软件开发过程中,编码并不是最困难的部分,而是需求的定义。作者通过自己的经验和例子,强调了需求的不明确、不一致或错误是导致软件问题的主要原因。文章还讨论了人工智能在软件开发中的应用,指出虽然 A…

ChatGPT-5发布时间已定!又要炸了!

文 / 高扬(微信公众号:量子论) 今天轻松一下,不写干货了,扯点ChatGPT最新进展。 刚在reddit上看到一则消息,说OpenAI今年12月份完成GPT-5的训练,这预示着可能将在2024年某个时候正式发布。 预计…

10、InstructGPT:Training language models to follow instructions with human feedback

简介 GPT的发展历程 GPT-1用的是无监督预训练有监督微调。GPT-2用的是纯无监督预训练。GPT-3沿用了GPT-2的纯无监督预训练,但是数据大了好几个量级。InstructGPT在GPT-3上用强化学习做微调,内核模型为PPO-ptx GPT-1比BERT诞生略早几个月。它们都是采用…

5个不可不知的Python自动化脚本利器

用这5个Python自动化脚本,提升你的Python变成效率。 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 为了提升Python编程的效率,我总结了一份Python脚本的独家秘籍,并对一些Python的功能进行了提升。 简介…

ChatGPT相关指令使用大全之一

1.写报告 1)选定切入角度 产生数字个具有说服力和描述性的文章主题想法,主题为「某个主题」 例:产生3个具有说服力和描述性的文章主题想法,主题为「社交媒体如何影响青少年」 2)报告开头 我现在正在报告的情境与目的。我的简报主题是某个…

AI周报-一周发生两次Ai事件;DragGAN 问世

🚀 AI 图像编辑技术 DragGAN 问世,用户可以通过拖拽改变汽车大小或人物表情等 近日,马克斯・普朗克计算机科学研究所研究者们推出了一种控制GAN的新方法DragGAN,用户可以通过拖拽改变汽车大小或人物表情等。 DragGAN类似于Photo…

家用洗地机哪种好?怎么选购家用洗地机

在这个高度关注环境、健康和安全的时代,洗地机已成为多种设施不可或缺的清洁工具。它不仅可以提高清洁速度和质量,还可以协助您提高生产效率和管理流程。洗地机的优点在于它易于使用,具有多种高效能力和灵活性,是一个为现代清洁服…

北京科技大学 工科物理实验 大二下

前言 本文由20级学生整理,包括实验目的和仪器、实验原理、实验步骤三个部分。主要是想节约一下大家手机拍照扫描、语音输入或手打的时间。(可能有些任课老师要求手写,那就爱莫能助了) 【5.4 实验原理部分缺失】 使用方法 点击“…

美创科技四个行业数据安全治理实践案例

自《数据安全法》、《个人信息保护法》等法律法规出台以来,数据安全治理,作为体系化提升数据安全保障能力的重要抓手,得到越来越多的重视,“具体该如何有效落地”也成为不少单位组织普遍关注的话题。 从率先推出数据安全治理咨询…

家用洗地机哪个好用?家用洗地机分享

洗地机是一种代表现代化清洁的设备,它具有高效、环保、经济、智能等多种特点。洗地机可以为您提供先进的清洁技术和设备,为您的清洁工作提供有力的支持。洗地机可以适应不同场所和建筑物的需求,提高工作效率和卫生形象。因此,选择…