五音不全？手把手教你用自己声音唱任何歌；最详细的Auto-GPT整理；4月AI绘画模型推荐；HayoAI平台简直太酷了

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦！

🤖 『ChatGPT + Code Interpreter = Magic』魔法！离谱！正在怀疑人生…

OpenAI 近期面向部分用户发放了 Code Interpreter (代码解释器) 插件使用权限，推上目前满屏惊讶脸 😮 拿到权限的用户，展示了使用 Code Interpreter插件进行的诸多尝试：

1. 处理图片。输出动态二维码、脸部识别、图片转ASCII码、创建调色板等

2. OCR 识别。导入图片输出文本等

3. 画图，生成较为复杂的svg

4. 生成 GIF 动画，也可以将GIF转为视频

5. 生成音频。创作音乐等

6. 生成日历邀请文件 .ics

7. 游戏模拟器，比如吃豆人游戏、行星轨道、跳棋、国际象棋

8. 数据分析。对上传的任意excel文件进行数据分析，绘制各类型图表，并提供洞察

9. 多个插件之间可以串起来，前一个代码运行的结果可以给下一个插件代码作为参数 ⋙ 部分推文

🤖 『微软 Bing Chat 全面开放并即将发布插件』

微软今天公布了 Bing 聊天机器人的重大升级，增加了图像和视频回答、餐厅预订、聊天历史记录以及更智能的 Microsoft Edge 整合。具体的功能包括：

1. Bing 聊天插件。类似于 ChatGPT 的插件系统，现在可以使用微软的 Bing AI 来完成任务，而无需在站点之间来回跳转。

视频里面演示了搜索结果推荐了一家餐厅，它就可以找到适合的预订时间，并帮助在聊天界面中预订所有餐厅

2. 多模态答案，支持图像搜索。很快就可以在 Bing 聊天中搜索，并要求查找物体、动物、地点等的照片或视频

3. 持续的聊天+聊天记录。聊天历史记录将使你能够在不同设备之间继续聊天机器人对话，甚至将 Bing 聊天用作研究工具

4. 官方已经取消了等候名单。注册即可使用了 ⋙ the verge | 中文解读

🤖 『生成式设计工具「即时AI」全面开放』

即时AI，可以将用户输入的自然语言描述快速生成可二次编辑的 UI 设计稿。5月4日，官方宣布全面开放，不再需要内测码，登录即可开始使用。

无论是「类似豆瓣App首页」的简单需求，还是「一个类似我的世界风格的游戏详情页，里面请包含了游戏简介、游戏截图、 steam 上的评分和评价」这类包含具体信息的需求，都可以在几十秒内完成，帮助设计师释放时间进行更有意义的思考和深入探索 ⋙ 官网

🤖 『面向AI的编程语言 Mojo 发布』可能是过去三十年来编程语言最大的革新

5月3日，前苹果工程师、swift 编程语言创建者 Chris Lattner 创立的 ModularAI 网站，发布了一个新的编程语言 Mojo。根据测试，该语言比 Python 最高提速 35000 倍！

Mojo 最大的特点是有类似Python那样的语法，但是没有Python编程语言的问题。换句话说，这个编程语言号称非常简洁，但是性能却非常好。总的来说，官方宣传Mojo的特点如下：

1. 完全兼容 Python 生态

2. 比 C++ 更快

3. 比 CUDA 更容易定制和修改（more hackable）

4. 和 RUST 一样安全 ⋙ 官网 | 中文解读

🤖 『Chat Chat 开源啦』解锁你的下一级 AI 对话体验

Chat Chat 可以使用 OpenAI、微软 Azure、Claude、Cohere、Hugging Face 等多个 API，让你的 AI 对话体验更加丰富。

此外，Chat Chat 还支持 Plugins，可以搜索内容和总结网页；并且支持分享记录，支持云端存储记录和个人设置等 ⋙ GitHub | 官网

🤖 『HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT』

Hayo 是一个强大的应用 (尤其是客户端)，集合了 AI 聊天、艺术创作、工具推荐、新闻以及科技创新交流，有点类似于以下几大应用的结合体！完成度非常高，体验流畅，想做的事情有点大，大家快去下载体验！！

HayoAI = Product Hunt + Midjourney社区 + Discord + 聊天机器人+ FlowGPT

1. Product Hunt。HayoAI 收集了1700+ AI工具，有详细的介绍、点赞排名和标签分类，允许工具官方发布信息和用户交流

2. Midjourney社区。指令模块类似一个 AIGC 内容社区，可以浏览和直接使用内容的 Prompt，目前主要是 Stable Diffusion

3. Discord。针对部分工具有单独的聊天室，比如可以直接在 Stable Diffusion 社区内输入 Prompt 进行作画，目前可以免费生成15张/小时，50张/天

4. 聊天机器人。支持包含 ChatGPT 在内的5个AI模型对话，而且可以在指令工厂里的 Prompt 页面直接跳转到聊天室使用，不用魔法上就可以用

5. FlowGPT。内置 300+ Prompt，也可以创建自己的 Prompt ⋙ HayoAI官网 | 解读

🤖 『我把我的声音训练成了AI模型，并让它唱了一首歌…』附超全面教程

AI歌姬现在非常火，B站遍地都是AI歌声，AI孙燕姿，AI周杰伦等等。在初音未来、洛天依之后，AI音乐的时代这次真正的到来了。

作者 @数字生命卡兹克五音不全，这次终于借助 So-VITS-SVC，用自己的声音完整唱了一首「富士山下」。作者用大量的图文，详细写了整个AI声音教程，并准确了完整安装包。

1. 准备声音数据集。声音模型对数据集的要求比较苛刻，想训练自己的声音需要录制1小时以上的无杂音的纯人声，WAV 格式，再使用 Audio Slicer (音频切分工具) 将其剪裁成10秒左右的分段文件

2. 租云算力，上传数据集。训练模型挺烧显卡的，直接找到便宜稳定的云算力平台，充值三五十元就可以搞定！轻松便捷

3. 在云上训练模型。跟着截图在云平台的控制台操作，进行 10,000 步的模型训练，耗时较久，做好准备

4. 本地进行推理模型重绘歌曲。声音重绘的原理是，用模型的音色替换人声。这一步推荐了大量实用工具，比如分离工具「UVR5」、音乐获取「QQ音乐」、歌曲合成「AU/剪映」等

注意！项目完成时云算力还在烧钱！如果不继续使用，直接先点关机，然后点击释放实例 ⋙ 完整教程@数字生命卡兹克

🤖 『前魅族CMO李楠三个比喻解释AIGC』构建AI时代的核心能力和护城河

前魅族 CMO 李楠最新一期关于 AIGC 的视频「让所有人更好的理解 AIGC 的三个比喻」，观点和产出方式都很有意思，看完感觉很受启发。

他在视频里多次强调，新一代的技术之所以是革命性的，因为「带来了完全不同的思维方式和发展逻辑」，只有要抓住这个东西，才不会被时代淘汰。

比喻1：种子，水源和大树

▢ 种子 - 模型

▢ 水源 - Data

▢ 大树 - 可以使用的大模型 (比如训练好的 ChatGPT)

比喻2：工程师和魔法师

▢ 工程师 - 本质上前三次工业革命所有的参与者，都是工程师

▢ 魔法师 - 运用 AI 得到结果，但是并不清楚原理的人

比喻3：命令行和图形操作界面

▢ 命令行 - 上一代的技术，同时也是的确是下一代技术的基石

▢ 图形操作界面 - 下一代技术，但是其实会使用完全不同的逻辑发展

关于AIGC的内容，我们要小心什么

1. 用已知解释一切的人 - 福特汽车，无非就是更快的马。当真正技术变革发生的时候，不要听部分用已知解释一切的上个时代精英BB，因为他们把一切都纳入到自己的体系内，自洽的结果是他没办法进入新的领域，学习新的东西

2. 用技能掩盖认知 - 10 个技巧帮你玩转 Midjourney。技术进步的阶段，你尚可研究“ 10 个技巧玩转Midjourney”。但当技术发生颠覆性变革的时候，你不能用技巧用技能掩盖认知的落后

人类真正的价值在哪里

1. 预测和判断 - 用丰富的经验预测动荡未来，并且判断的能力

2. 感受力 - 对真实世界和人类社会更丰富的感受能力是 AI 不具有的数据

3. 跨界 - 不断进入新领域的学习能力，并且把自己的所有经历链接起来的能力

4. 面对未知，解决争论，创造 - 在动荡和不确定中领导和创造的能力 ⋙ B站视频

🤖 『4月AI绘画模型推荐榜』7个值得躺进收藏夹的模型

1. Anything V5：生成高质量的二次元和动漫图片 | 模型ID「9409」

2. AbyssOrangeMix3：生成高质量、逼真的纹理插图 | 模型ID「9942」

3. meinamix：擅长描绘二次元和动漫风格的图像，能够呈现出逼真且富有生动感的视觉效果 | 模型ID「7240」

4. GuoFeng3：高度逼真的古风角色模型，具有中国传统文化特色和华丽古风造型 | 模型ID「10415」

5. ReV Animated：适用于肖像和全身动漫般图片的人物描绘模型，同时也适用于幻想风景的2.5D或3D绘制 | 模型ID「7371」

6. Cute_girl_mix4：该LORA模型与Chilloutmix搭配使用，能够生成自然可爱的二次元女孩形象 | 模型ID「14171」

7. 墨心：该LORA模型与兴化板桥先生、八大山人等优秀作品搭配使用，生成的图片兼具传统与现代之美 | 模型ID「12597」 ⋙ 来源

🤖 『4月份爆火的 Auto-GPT 的系列整理』目前最详细清晰

随着 Auto-GPT、Baby AGI 以及斯坦福大学关于 AI Agents 的社会实验的出现，AI 代理/智能代理瞬间成为了 AI 领域的全球热点。本文从 Web 端、长期记忆、垂直领域服务、反面案例等等角度，整理了截止目前最具代表性的 AI 代理产品。

⭕ Auto-GPT

1. Auto-GPT

作为首批独立运行的 GPT-4 实例之一，Auto-GPT 重新定义了 AI 技术的边界，核心在于基于最少的人工输入/提示，利用 GPT-4 的推理能力解决更广泛、更复杂的问题

https://github.com/Significant-Gravitas/Auto-GPT

⭕ Baby AGI

2. Baby AGI

受 AGI 的定义启发，Untapped Capital 的合伙人 Yohei Nakajima 基于 GPT-4、Pinecone 和 LangChain搭建了一个名为 Baby AGI 的任务驱动的自动化代理

https://github.com/yoheinakajima/babyagi

⭕ Web Version｜Web 端版本

3. AgentGPT

功能最基础的网页版 AutoGPT，界面清爽，易于使用，可一键存储/复制所生成的结果，也可选择使用自己的 API key

https://agentgpt.reworkd.ai/

4. Godmode

需要人为添加任务并确认每个步骤的网页版 AutoGPT，可人为控制变量

https://godmode.space/

5. Cognosys

目前最火的 Web 端 Auto GPT，由 Homam Tradeit 与 Sully Omarr 共同开发。输入项目名称，设定目标，输入或自动生成三项任务，即可让代理自动完成目标

https://www.cognosys.ai/

⭕ Long-Term Memory｜长期记忆

6. MemoryGPT

MemoryGPT 是记忆力更长久的 ChatGPT，这个特点让它可以解决更复杂更具体的问题，同时也可以更个性化

https://memorygpt.io/

7. Teenage AGI

一个真正拥有长期记忆，记住初始目标并自动规划完成复杂任务的 AI agent

https://github.com/seanpixel/Teenage-AGI

⭕ More Professional Service｜更专业的服务

8. Coding Assistant by Mckay Wrigley

开发者Mckay 通过 AI agents 进一步实现了与经过身份验证的用户搭建应用程序，当前可以构建和设计 Web 应用程序、创建具有工作数据库的后端、处理身份验证、部署到 Vercel等

https://twitter.com/mckaywrigley/status/1646596881420783619