Visual GPT简介
微软发布了一个叫做VISGPT的东西,继承了很多个模型,可以实现图片的处理
这个gpt不但可以接受图片文字输入,还能够输出图片,个人觉得离解放生产力更进一步了。我个人不喜欢瞎逼逼,单纯的把项目链接就放这里了:
https://github.com/microsoft/visual-chatgpt
下面开始介绍我的使用经历
项目clone与环境配置
首先声明,visgpt分为很多个功能模块,读者可以根据自己的需求启动相应的模块。而且要想在本地运行,至少需要一张3060(显存6GB+),因为一个大一点的功能模块(比如文字转图片)就要吃掉3个GB多,再加上基础的那个功能就是4.5GB左右了,3060玩他够呛,要是单纯想自己玩玩就行,推荐colab。
在本地配置项目照他给的Quick Start来就行了,我最开始尝试把它放在自己创建的一些目录下,结果发现会带来一些奇奇怪怪的问题,踩了不少坑。
然后就是openai的API了,怎么生成这个自行查阅,一般github项目网页会给你对应的链接.
每个人最开始有一定的免费额度,然鹅我的账号申请的比较早,在四月一18美元就过期了,于是我自己买的token。(最开始我不知道我的额度没了,给我报错)
当你拿到你的免费API,或者说搞定了payment。导入你的openai 的API key,上图的方法不能永久写入conda环境,如果想永久写入conda环境,这个自己查(我用了但我忘了)
接下来就是运行了,本地运行后他会根据你运行的功能模块下载对应的模型,见下图,输入python巴拉巴拉后会下载对应的东东
这个模型好大啊,我尝试下载了它所有的功能模块
关于tokens的购买
简单说一下怎么买token,国内的一切卡,就连国内银行发的visa也亲测无效,你需要一张国外的信用卡。虚拟卡就行,这个有个叫depay的软件应该就能搞定,也有其他途径,我不列举了。在支付绑卡的时候,注意用工具生成好姓名地址账单信息截图做好准备。支付的地址最好选免税州。余额不够时不能支付,存多少用多少不能透支。
拿到卡后把它跟你的openai绑在一块儿就行,会根据你的使用情况扣费的。
使用体验
我没敢多体验,就画了一只猫猫,因为舍不得tokens
另外我最后配齐了组件,就是它的每个功能模块我都下载了对应的GPU版本好大啊,环境本身需要的package我装了6个G,另外就是各种模型的参数,有27.2个G,下图右下叫红色的那一片全都是
后记(关于生产力)
我拿它尝试修图,下边是我的原图
我叫他给我refine,磨皮啥的,do as photoshop does,结果效果很奇特,现在看来这玩意离转化为生产力还有一定的距离啊
上边是他“PS”的结果…