前言
小白一句话生成一个网站?小白一句话生成一个游戏?小白一句话生成一个ppt?小白一句话生成一个视频?
可以
原理
总体的执行流程是
1,用户下达指令
2,大模型根据用户指令,分解指令任务为多个细分步骤
3,mauns框架根据大模型分配的多个任务队列,依次排队,调用外部注册的工具模块执行,同时执行过程中给予大模型反馈,大模型根据实时状态微调步骤
4,得到指令结果,反馈给用户
流程
1.访问https://github.com/mannaandpoem/OpenManus,下载源码
git clone https://github.com/mannaandpoem/OpenManus.git
2.配置openManus框架
2.1在anaconda中创建虚拟环境,进行环境隔离,防止包冲突
conda create -n open_manus python=3.12
conda activate open_manus
2.2在虚拟环境中配置框架依赖,依赖包已经写入txt中
pip install -r requirements.txt
如果需要让他操作浏览器,就额外安装
playwright install
2.3修改配置文件,导入大模型api给框架
在源码目录config下创建config.toml文件
插入如下代码
这里使用的大模型是qwen-plus,需要注意的是只有支持function calling的大模型才能匹配openMauns框架,使用其中的框架,否则会报兼容性问题
api在通义千问上注册可以获得暂时的免费额度
# Global LLM configuration
[llm]
model = "qwen-plus"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1/"api_key = "你的api密钥"
max_tokens = 4096
temperature = 0.0# Optional configuration for specific LLM models
[llm.vision]
model = "qwen-plus"
base_url = "https://dashscope.aliyuncs.com/compatible-mode/v1/"
api_key = "你的api密钥"
2.4运行框架,查看效果
playwright install
可以看到,大模型根据用户命令,自动分配了任务,然后调用浏览器去收集相关信息
2.5playwright 提示找不到可以执行的浏览器
根据错误日志,在指定目录中放置chorme.exe即可
根据错误日志程序去这个路径下面寻找 Browser action ‘navigate’ failed: BrowserType.launch: Executable doesn’t exist at C:\Users\admin\AppData\Local\ms-playwright\chromium-1148\chrome-win\chrome.exe,那么在此目录解压chorme.exe的工具即可
如果网络好可以执行
python -m playwright install chromium