使用vscode + Roo Code (prev. Roo Cline)+DeepSeek-R1使用一句话需求做了个实验

摘要

使用vscode、Roo Code和deepseek-reasoner进行了一个实验,尝试使用一句话需求来生成小红书封面图片。工具根据需求提供了详细的架构方案,包括技术栈选择、核心模块划分、目录结构建议等。然后,工具自动化地完成了开发和测试,并记录了详细的逻辑和使用方式在Readme文件中。实验结果表明,工具能够生成小红书封面图片,但需要进一步调整和完善,作者认为,这次实验对于小白来说已经很不错了,价格也不算贵。未来可以继续完善和优化工具来生成更实用的封面图片。

使用vscode + Roo Code (prev. Roo Cline)+deepseek-reasoner 使用一句话需求做了个实验

最近在探索一些有趣的AI工具组合,就用vscode搭配Roo Code (以前叫Roo Cline)和deepseek-reasoner(DeepSeek-R1)做了个小实验,看看能不能用一句话需求实现一些有意思的功能。

一、准备工作

要开始实验,首先得把工具准备好。在vscode的插件市场搜索“Roo Code”,然后安装就行,安装过程挺简单的,很快就能搞定。
在这里插入图片描述
安装完插件,接着就是配置Roo Code 。配置步骤按照提示一步步来,也不算复杂。我配置了DeepSeek,选择deepseek-reasoner作为默认的模型
在这里插入图片描述

需要了解到模型的相关信息和价格,可以看看官方说明:https://api-docs.deepseek.com/zh-cn/quick_start/pricing/ 。

二、实验开始

  • 我给工具提的需求很简单,就是一句话需求:我想做一个小红书封面图片自动生成的本地工具,提供几种字体和图片模板,生成大字封面图片,你有什么建议么?

  • 工具开始分析我的需求,从技术栈选择、核心模块划分,到目录结构建议,都给出了详细的思路。比如技术栈方面,推荐了Python的Pillow/OpenCV 、Node.js的Sharp/Jimp等图像处理库;核心模块划分成模板管理、字体管理、渲染引擎和输出模块;目录结构也给出了像templates、fonts、assets这些建议。还考虑到了字体版权、图片分辨率适配等关键设计点,以及安全和扩展性方面的问题。当然,我是什么都不懂的。

  • 根据我的选择,工具基于Python技术栈开始构建详细架构方案,确定了Pillow、PyYAML等核心依赖,还给出了架构优化点、异常处理策略和扩展接口设计。以下是一些AI跟我的沟通交互过程记录:

首先分析用户需求:需要开发一个本地工具用于生成小红书封面图片,核心功能包括字体管理、模板选择和图片生成。基于架构设计角度,需考虑以下几个方面:
1. 技术栈选择:
图像处理库:Python Pillow/OpenCV 或 Node.js Sharp/Jimp
字体渲染:需支持多字体文件加载
模板系统:JSON/YAML配置模板参数
界面方案:CLI命令行或Electron轻量级GUI
2. 核心模块划分:
模板管理系统(存储布局参数)
字体管理系统(字体文件加载校验)
渲染引擎(图文合成核心)
输出模块(格式转换与导出)
3. 目录结构建议:
├── templates/       # 模板配置文件
├── fonts/           # 字体资源
├── assets/          # 背景图素材
├── output/          # 生成结果
└── config.json      # 全局配置
4. 关键设计考量:
字体版权合规性(建议集成开源字体)
图片分辨率适配(多尺寸预设)
模板热加载机制
缓存优化策略(预渲染常用元素)
5. 安全方面:
图片文件类型校验
字体文件安全检查
输出目录隔离
6. 扩展性设计:
插件式模板系统
支持自定义渲染管线
元数据标注(记录生成参数)
建议采用Python技术栈快速原型开发,使用Pillow+Click构建基础版本,后续可升级为PyQt图形界面
请确认偏好技术栈:Python或Node.js?这将影响后续架构细节设计

这是我确认使用Python之后的答复

根据用户选择Python技术栈,开始构建详细架构方案:1. 核心依赖确认:- Pillow 9.0+(图像处理)- PyYAML(模板配置)- Click 8.0+(CLI构建)- fontTools(字体解析)2. 架构优化点:- 引入缓存机制预加载常用字体- 使用LRU缓存模板配置- 支持多线程批量生成- 颜色管理系统支持PANTONE色卡3. 异常处理策略:- 字体文件校验(TTF/OTF)- 图片资源尺寸校验- 内存使用监控(大图处理)4. 扩展接口设计:- 插件式滤镜系统- 模板市场对接接口- 自动化测试框架
  • 接下来就是自动化的Coding,在操作的过程,我把Auto-approve全部勾选上,让工具自动发挥作用。
    在这里插入图片描述
  • 然后一顿自动操作,需要我确认的就点一下,完成开发,并且它已经帮我做了测试。
    在这里插入图片描述
  • 为了以后使用方便,我让工具把详细的逻辑和使用方式记录在Readme文件里,为了节约篇幅、省略展示,以下是文件的主要内容提炼,可以说想的还是很周全了。
# 小红书封面生成工具## 功能特性
- 基于模板的封面图片生成
- 支持多种字体和文字样式配置
- 智能布局系统(边距/对齐/行间距)
- YAML格式配置文件
- 安全校验机制(文件存在性/尺寸限制)## 快速开始### 1. 环境准备
- 创建虚拟环境(可选)
- 安装依赖### 2. 基础使用
- 生成默认模板封面
- 指定模板生成
- 自定义字体### 3. 参数说明
- `--template`:指定模板名称(默认default)
- `--font`:自定义字体路径
- `--output`:输出路径(支持时间戳占位符)
- `--help`:显示完整帮助信息### 4. 高级功能
- 批量生成模式(需准备titles.txt文件)
- 质量参数调整(0-100)
- 背景图片叠加## 项目结构
- config.yaml:全局配置文件
- templates/:模板目录
- fonts/:字体资源
- main.py:主程序
- template_loader.py:模板加载器## 配置说明 (config.yaml)
- defaults:输出图片宽度和高度、字体目录、默认字体
- quality_settings:输出图片质量
- template_settings:默认模板## 模板开发指南
- 创建 `templates/your_template.yaml`
- 定义模板名称、布局、背景等## 高级用法
- 使用自定义模板
- 指定字体文件
- 批量生成模式## 常见问题
- Q1: 字体加载失败
- Q2: 模板格式错误## 许可证
MIT License - 自由修改和分发,建议保留原始作者信息

三、测试结果

  • 我马上进行了测试,默认的模板图片就是一张白色的图片,结果发现生成的图片文字没显示出来。
    在这里插入图片描述
  • 后来我替换了一个电脑本地的黑色字体,测试就成功了,默认模板是一张白色的图片。我想着后面只要在yaml文件里调整一下字体的坐标、布局,再用AI生成图片的工具做几个图片模板,应该就能正常使用了。
    在这里插入图片描述

四、最后再看下调用的TOKEN数量

当然这个token数量不只是这个小实验产生的,姑且粗略计算一下
在这里插入图片描述
然后我把这张图和官方的价格表格的图丢给豆包帮我计算了一下,我比较懒,没有人工核对。
2025 年 1 月 25 日使用 deepseek - reasoner 的费用约为 0.89 元。

从第一张图可知,deepseek - reasoner 在 2025 年 1 月 25 日的 API 请求情况为:
输入(命中缓存):351744 tokens
输入(未命中缓存):65450 tokens
输出:17115 tokens
从第二张图可知,deepseek - reasoner 的价格为:
百万 tokens 输入价格(缓存命中):1 元
百万 tokens 输入价格(缓存未命中):4 元
百万 tokens 输出价格:16 元
计算输入费用
计算输入(命中缓存)费用:
(元)
计算输入(未命中缓存)费用:
(元)
计算输出费用
(元)
计算总费用
将输入(命中缓存)、输入(未命中缓存)和输出费用相加可得:
(元)
综上,2025 年 1 月 25 日使用 deepseek - reasoner 的费用约为 0.89 元。

五、实验感受

这次实验,工具调用的速度有点慢,不过对于我这样的小白来说,只提了一句话需求,就能做到这个程度,已经挺不错的了。价格也不算贵,要是一开始需求能更明确些,后续再不断完善,相信能做出更实用的小红书封面生成工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/7459.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vscode环境中用仓颉语言开发时调出覆盖率的方法

在vscode中仓颉语言想得到在idea中利用junit和jacoco的覆盖率,需要如下几个步骤: 1.在vscode中搭建仓颉语言开发环境; 2.在源代码中右键运行[cangjie]coverage. 思路1:编写了测试代码的情况(包管理工具) …

基于SpringBoot+WebSocket的前后端连接,并接入文心一言大模型API

前言: 本片博客只讲述了操作的大致流程,具体实现步骤并不标准,请以参考为准。 本文前提:熟悉使用webSocket 如果大家还不了解什么是WebSocket,可以参考我的这篇博客: rWebSocket 详解:全双工…

積分方程與簡單的泛函分析8.具連續對稱核的非齊次第II類弗雷德霍姆積分算子方程

1)def求解具連續對稱核的非齊次第II類弗雷德霍姆積分算子方程 设 是定义在上的连续对称核函数, 非齐次第二类弗雷德霍姆积分算子方程的形式为: , 其中是未知函数,是给定的连续函数,是参数。 2)def其特徵值是否一致…

RV1126画面质量四:GOP改善画质

一. 什么是 GOP GOP 实际上就是两个 I 帧的间隔,比方说分辨率是 1920 * 1080 50 帧,假设 GOP 为 5,那就是大概 2s 插入一个 I 帧。我们再 回顾下,H264/H265 的帧结构。H264/H265 分别分为三种帧类型:I 帧、…

一文了解二叉树的基本概念

文章目录 二叉树1二叉树的定义及其主要特征1.1二叉树的定义1.2二叉树的特点1.3二叉树的五种形态1.4二叉树与度为2的有序树的区别1.5几个特殊的二叉树1.6二叉树的性质 2二叉树的存储结构2.1二叉树的顺序存储2.2二叉树的链式存储 二叉树 1二叉树的定义及其主要特征 1.1二叉树的定…

MAX98357A一款数字脉冲编码调制(PCM)输入D类音频功率放大器

MAX98357A是一款数字脉冲编码调制(PCM)输入D类音频功率放大器,以下是对其的详细介绍: 一、主要特性 音频性能: 提供D类效率与AB类音频性能。支持高达3.2W(4Ω负载,5V供电)的输出功率…

nacos(基于docker最详细安装)

1、什么是Spring Cloud Spring Cloud是一系列框架的集合。它利用Spring Boot的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等,都可以用Spring Boot的开发风格做到一键启动和部署。…

78,【2】BUUCTF WEB .[安洵杯 2019]不是文件

进入靶场 解题过程 点击最下面的英文字即可上传图片 新建一个文本文档 里面内容为空 更改名字为 1,2,3,4,0x4f3a363a2268656c706572223a323a7b733a393a22002a00696676696577223b623a313b733a393a22002a00636f6e666967223b733a353a222f666c6167223b7d)#.png 知道id1&#x…

Git 如何将旧仓库迁移新仓库中,但不显示旧的提交记录

一、异常错误 场景:我想把旧仓库迁移新仓库中,放进去之后,新仓库会显示这个项目之前的所有提交,如何不显示这些旧的提交? 二、原因 我们需要将旧仓库迁移新仓库中,但是又不想在新仓库中显示旧的提交记录…

Mysql索引(学习自用)

目录 一、索引概述 优缺点 二、索引结构 1、索引数据结构 2、索引支持结构 3、B树 4、B树 5、hash索引 6、为啥采用B树索引 三、索引分类 四、索引语法 五、索引性能分析 5.1查看执行频率 5.2慢查询日志 5.3profiling 5.4explain 六、索引使用规则 6.1验证索…

PSD是什么图像格式?如何把PSD转为JPG格式?

在图形设计的世界里,Photoshop 文档(PSD)格式是 Adobe Photoshop 的原生文件格式,它允许设计师保存图像中的图层、蒙版、透明度和不同色彩模式等信息。对于需要进一步编辑的设计作品来说,PSD 文件提供了极大的灵活性。…

基于物联网的风机故障检测装置的设计与实现

1 系统总体设计方案 通过对风机故障检测装置的设计与实现的需求、可行性进行分析,本设计风机故障检测装置的设计与实现的系统总体架构设计如图2-1所示,系统风机故障检测装置采用STM32F103单片机作为控制器,并通过DS18B20温度传感器、ACS712电…

全面评测 DOCA 开发环境下的 DPU:性能表现、机器学习与金融高频交易下的计算能力分析

本文介绍了我在 DOCA 开发环境下对 DPU 进行测评和计算能力测试的一些真实体验和记录。在测评过程中,我主要关注了 DPU 在高并发数据传输和深度学习场景下的表现,以及基本的系统性能指标,包括 CPU 计算、内存带宽、多线程/多进程能力和 I/O 性…

websocket实现

由于安卓资源管理器展示的路径不尽相同,各种软件保存文件的位置也不一定一样.对于普通用户上传文件时,查找文件可能是一个麻烦的事情.后来想到了一个办法,使用pc端进行辅助上传. 文章目录 实现思路1.0 实现定义web与客户端通信数据类型和数据格式web端websocket实现web端对客户…

【科研建模】Pycaret自动机器学习框架使用流程及多分类项目实战案例详解

Pycaret自动机器学习框架使用流程及项目实战案例详解 1 Pycaret介绍2 安装及版本需求3 Pycaret自动机器学习框架使用流程3.1 Setup3.2 Compare Models3.3 Analyze Model3.4 Prediction3.5 Save Model4 多分类项目实战案例详解4.1 ✅ Setup4.2 ✅ Compare Models4.3 ✅ Experime…

CY T 4 BB 5 CEB Q 1 A EE GS MCAL配置 - MCU组件

1、ResourceM 配置 选择芯片信号: 2、MCU 配置 2.1 General配置 1) McuDevErrorDetect: - 启用或禁用MCU驱动程序模块的开发错误通知功能。 - 注意:采用DET错误检测机制作为安全机制(故障检测)时,不能禁用开发错误检测。2) McuGetRamStateApi - enable/disable th…

docker 安装 mysql 详解

在平常的开发工作中,我们经常需要用到 mysql 数据库。那么在docker容器中,应该怎么安装mysql数据库呢。简单来说,第一步:拉取镜像;第二步:创建挂载目录并设置 my.conf;第三步:启动容…

【2025年数学建模美赛E题】(农业生态系统)完整解析+模型代码+论文

生态共生与数值模拟:生态系统模型的物种种群动态研究 摘要1Introduction1.1Problem Background1.2Restatement of the Problem1.3Our Work 2 Assumptions and Justifications3 Notations4 模型的建立与求解4.1 农业生态系统模型的建立与求解4.1.1 模型建立4.1.2求解…

编码器和扩散模型

目录 摘要abstract1.自动编码器2.变分编码器(VAE)3.论文阅读3.1 介绍3.2 方法3.3 结论 4.总结参考文献 摘要 本周学习了自动编码器(AE)和变分自动编码器(VAE)的基本原理与实现,分析其在数据降维…

【C++】类与对象初级应用篇:打造自定义日期类与日期计算器(2w5k字长文附源码)

文章目录 一、日期类的实现1. 日期类的默认成员函数的分析与实现构造函数其它默认成员函数 2. 各种逻辑比较运算符重载3. 日期加与减天数日期加天数系列日期减天数系列日期加减天数的最后修定和- -系列 4. 日期减日期方法一方法二 5. 流插入与流提取重载流插入重载流提取重载(含…