爆火的Auto-GPT:实战及运行体验

Auto-GPT可以说是目前AI应用方向最火爆的项目了,自从3月份上线以来,一个月疯狂拦下将近7万star(截至本文写稿时69.5k)。它的目的是探索诸如GPT-4这样的大语言模型自主完成任务的能力。业界也有一些大佬出来表示这个项目真的很有趣。

这么疯狂的实验,咱也不能闲着……于是花了一个下午搭建了一下运行环境,记录一下中间踩过的坑。文章先介绍一下安装流程,再简单说一下使用体验。

项目地址:https://github.com/Significant-Gravitas/Auto-GPT

安装流程

0. 注意事项

  • 目前暂时没有使用elevenlabs提供的语音输入,未来会继续尝试+更新;
  • 目前暂时没有使用pinecone database(因为要排队),等排到了会尝试并在这里更新;
  • 版本:0.2.0

1. 系统

带terminal的操作系统即可。推荐使用带有X display的系统,安装起来更方便。云端VM要装很多东西,debug的流程很长。Mac、Windows都可以。
笔者恰好发现Google Compute Engine目前正在beta测试c3类型的VM,一个月只要1刀,等于是白嫖了,所以设置了一个VM,也正好可以踩一遍所有的坑。

2. 安装过程

2.1 clone项目

https://github.com/Significant-Gravitas/Auto-GPT.git
cd Auto-GPT

2.2 准备OpenAI API key

去到https://platform.openai.com/account/api-keys,生成一个新的API key。记得复制到记事本里,因为关闭了页面就看不到了。
在这里插入图片描述
同时,需要开启账户的付款机制。去到billing菜单,然后点击“set up paid account”,然后输入付款的银行卡信息。
在这里插入图片描述

2.3 设置python环境

笔者直接采用miniconda创建了运行环境,免得扰乱系统环境。miniconda的安装包可以去其官网下载,在这里就不赘述了。建议采用python 3.10,因为issues里面有人提及3.8以下的版本会出错。

conda create -n autoGPT python=3.10

执行完之后开始安装auto-GPT的依赖库:

conda activate autoGPT
pip install -r requirements.txt

2.4 设置运行时配置

将名字为.env.template的文件重命名为.env,然后执行以下动作:

  1. 把刚才保存下来的OpenAI api key粘贴到OPENAI_API_KEY项中;
  2. 设置EXECUTE_LOCAL_COMMANDS=True。这个是为了让程序运行时能够执行一些本地操作,比如写入文件等。如果不希望程序执行,可以保留False。
    设置完之后的.env文件大致长这样:
    在这里插入图片描述
    到这里,安装过程就结束了,可以开始运行:
python -m autogpt

然后按照terminal里面的输出一步步执行即可。Auto-GPT是基于多轮会话的,也就是说给定一个目标,AI通过调用chatGPT api自我生成一连串问题、问题答案和执行方案。下图为笔者运行的一轮输出:
在这里插入图片描述

3. 安装时遇到的问题

3.1 Chromedriver 无法启动

因为使用的是cloud VM,很多系统库都没有,所以程序在执行COMMAND=browse_website的时候首先遇到了chromedriver无法链接到两个库:libnss3.so和libxcb.so.1。通过以下指令解决:

sudo apt-get install libnss3 libnss3-dev
sudo apt-get install libxcb1-dev

3.2 找不到chrome binary

chromedriver当程序运行的时候,如果没有找到,是会给系统自动安装的,但chrome浏览器则不会安装(应该仅发生在VM上,因为如果是桌面系统那多半都安装了chrome浏览器)。
安装chrome浏览器:

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

默认的可执行路径为/usr/bin/google-chrome(Linux系统)。
除此之外,因为没有X display,chrome直接执行会crash。需要定位到项目中名为web.py文件,增加两个启动chrome时候的选项:
在这里插入图片描述

这样,程序就能够无障碍地浏览网络、执行搜索了。

4. 初步使用体验

很有意思的项目,个人认为是下一步AI应用值得发展的一个方向。不过在使用过程中,发现目标不能定得太大,比如“挣它一个亿”这样的目标,AI执行起来就比较困难(尤其是在没有pinecone db的支持下,长期记忆显得不那么稳定),需要通过更多轮的对话才有可能得出一个相对可行的解决方案。

当然,笔者也只是粗粗试了一下,很多体验都比较浅,暂时不能给出全面的感受。后续会继续在这里更新一下语音和pinecone加持后的使用体验,尝试不一样的使用目标等。会及时更新。

2023年04月15日

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/31065.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

把你的阿里巴巴图标库转成你自己的@ant-design/icons

背景 我们使用iconfont-阿里巴巴矢量图标库来管理自己的一套图标,并且基于它的js资源,封装了自己的icons图标组件。封装的方法是使用了antd提供的createFromIconfontCN方法 但随着图标库越来越大,JS资源文件也变得越来越大。在业务中&#x…

智能设计-阿里巴巴Banner设计

阿里巴巴Banner设计的核心在于优化会场页面拓展及Banner尺寸拓展两部分低水平重复建设工作,提升设计效率,压缩设计周期,为设计师保留充裕的创意时间。 色彩转移与页面拓展设计 分会场设计工作大致分为:色彩拓展、产品组合设计、…

阿里 ChatUI 开源:让对话美而简单

作者 | 孙辉 背景 对话式交互一直存在于我们的日常生活中,工作时使用的钉钉,联系朋友使用的微信,都属于对话式交互应用。 随着技术的发展,我们正在经历从「移动互联网时代」走向「人工智能时代」的过程中,人工智能扩大…

Prompt Engineering | 文本转换prompt

LLM非常擅长将输入转换成不同的格式,例如多语种文本翻译、拼写及语法纠正、语气调整、格式转换等。 文章目录 1、文本翻译1.1、中文转西班牙语1.2、识别语种1.3、多语种翻译1.4、翻译正式语气1.4、通用翻译器 2、语气 / 风格调整3、格式转换4、拼写及语法纠正5、一个…

vue3 实现 chatgpt 的打字机效果

在做 chatgpt 镜像站的时候,发现有些镜像站是没做打字机的光标效果的,就只是文字输出,是他们不想做吗?反正我想做。于是我仔细研究了一下,实现了打字机效果加光标的效果,现在分享一下我的解决方案以及效果图…

Haproxy--高可用代理

一、haproxy简介 软件:haproxy---主要是做负载均衡的七层,也可以做四层负载均衡。 负载均衡是通过OSI协议对应的。 7层负载均衡:用的是7层http协议; 4层负载均衡:用的是tcp协议加端口号做的负载均衡。 ha-proxy概…

2021-03-11

idea创建mybatis的maven项目 用idea创建Maven Web项目 添加依赖 创建编写实体类 创建持久层接口 创建SqlMapConfing.xml

mybatis初学

创建一个mybatis的maven项目 环境&#xff1a;IDEA19.3.3&#xff0b;jdk1.8mysq 新建maven项目 项目名字 maven 大体框架 导包&#xff08;要在pom.xml中dependencies标签里面&#xff09; 2 <!-- mybatis核心包 -->3 <dependency>4 <…

2021-03-21

MyBatis-Plus创建 创建数据库 -- 创建测试表 CREATE TABLE tb_user ( id bigint(20) NOT NULL AUTO_INCREMENT COMMENT 主键ID, user_name varchar(20) NOT NULL COMMENT 用户名, password varchar(20) NOT NULL COMMENT 密码, name varchar(30) DEFAULT NULL COMMENT 姓名, …

基于 Go 语言开发在线论坛

&#xff08;一&#xff09;&#xff1a;整体设计与数据模型 通过一个简单的在线论坛项目帮助大家从项目实际开发维度快速了解 Go Web 编程的全貌&#xff0c;然后再各个击破&#xff0c;深入介绍请求、响应、视图、数据库、Web 服务、测试、部署等各个模块的细节。 功能需求…

从智能对话系统导论,到如何设计第一个对话机器人

从智能对话系统导论&#xff0c;到如何设计第一个对话机器人 一、智能对话系统导论1、生活中的 Conversational AI2、一种新的人机交互方式3、一些关于 Conversational AI 的数据4、对话机器人行业产业链及产业图谱5、课程主要部分 二、Conversational AI 概览1、什么是Convers…

ChitChat论坛

《Go web编程》ChitChat论坛 本文摘自《Go web编程》 京东购书&#xff1a;https://item.jd.com/12252845.html 上一章在末尾展示了一个非常简单的Go Web应用&#xff0c;但是因为该应用只是一个Hello World程序&#xff0c;所以它实际上并没有什么用处。在本章中&#xff0c;我…

微信聊天机器人,不使用iChat,可以群聊

目录 1. 微信聊天界面截图 2. 图片文字识别 3. 获取最新消息 3.1 独聊 3.2 群聊 4. 机器人聊天系统 5. 成果展示 6. 全部代码 本文参考大神【喵王叭】的文章&#xff1a;python实现微信、QQ聊天自动回复【纯物理】_喵王叭的博客-CSDN博客_python自动回复纯物理方式实现微…

【论文翻译】2020.8 清华大学AI课题组——大型中文短文本对话数据集(A Large-Scale Chinese Short-Text Conversation Dataset)

大型中文短文本对话数据集 写在前面&#xff1a; 研究用&#xff0c;原创翻译&#xff0c;转载请标明出处&#xff1b;第一次译文&#xff0c;之后会跟进完善。侵删。 今年暑假末&#xff0c;清华大学公开了大型对话数据集及预训练模型。该数据集融合各大社交媒体对话数据库&am…

头条原创文章一键转换剪映生成视频

最近一段时间某更新了一个功能就是自己发布的文章可以在后台通过视频平台的功能一键生成短视频。 但是这个功能只能支持自己的写的文章,而且只能在本平台发布视频,还暂时不能同步到其他平台。而且必须是自己的原创文章哟,不是话会有一些问题。 这个做了几个视频之后发出来…

自媒体必备视频剪辑SDK,操作简单,功能强大,让每个精彩瞬间都能锦上添花!

VESDK DELUXE介绍&#xff1a; 一个全能好用的视频编辑工具&#xff0c;帮你轻松剪出美好生活。VESDK Deluxe APP视频编辑SDK集手机视频拍摄和视频剪辑主要功能于一体,同时包含手机端视频配音配乐&#xff0c;字幕特效&#xff0c;滤镜&#xff0c;转场特效等各种功能&#xff…

抖音之电脑版剪映的使用

本内容介绍剪映功能的使用以及一些个人剪映作品。紫色文字是超链接&#xff0c;点击自动跳转至相关博文。持续更新&#xff0c;原创不易&#xff01; 目录&#xff1a; 一、抖音&#xff1a;逝雪情感的剪映作品 1、曾经以为离不开的是微信 2、半生走过 3、夏日田园 二、音…

剪映专业版 - 你的短视频剪辑小帮手!附Mac/Win地址!

剪映专业版&#xff1a;做精品视频你不一定要用 FCPX &#xff01;随着短视频的崛起&#xff0c;市面上的剪辑软件也越来越多。除我们熟知的Premiere、Final Cut Pro等专业剪辑软件外&#xff0c;也有很多轻松易上手的App等待我们选择。近期&#xff0c;剪映推出了全新的专业版…

剪映电脑版详细使用教程,让视频剪辑变得更简单了

这几天关于剪映电脑版的消息非常多&#xff0c;相比于专业成熟的视频剪辑软件&#xff0c;但大家对这款剪映似乎特别感兴趣&#xff0c;小编也抽时间简单使用了一下&#xff0c;相比于adobe Premiere 和达芬奇来说&#xff0c;真的特别简单上手&#xff0c;结合了手机版的触摸与…

剪映app怎么剪辑视频

剪映是一款非常好用的手机上的视频剪辑软件&#xff0c;拥有这款软件的话&#xff0c;用户们即使是在手机上也能够快速方便的进行视频剪辑哦&#xff0c;但是有很多用户们没有剪辑过视频&#xff0c;不会使用剪映这款软件等&#xff0c;那么剪映app具体要怎么操作使用呢&#x…