猜猜看!哪张甜甜圈图是真的?AI数字人商业实践「真经」;LangChain X Prem挑战赛;故事绘本生成与盈利平台 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

img

🤖 猜猜看!你觉得,哪张甜甜圈的图片是真的?

img

这是 Reddit网站 Midjourney 子区发起的一项趣味挑战:一共6张图,其中5张是AI生成的,只有1张是拍照的,让神通广大的网友们判断下哪张是真实的。

目前帖子的投票数已经高达 4,700,评论区留言将近 700,特别活跃!综合评论信息来看,大家更倾向于〖第4张〗,判断理由大概有这么几项:

  1. 整齐:第4张排列自然错落,其他都太整齐了

  2. 糖霜:第4张甜甜圈上的糖霜细节更清晰,而且类型更丰富

  3. 光线:第4张是来自左上方的自然光线

  4. 细节:仔细看!第4张盒子底部有面包屑和糖霜 ⋙ @reddit

🤖 LangChain X Prem 挑战赛!

img

LangChain 与 Prem 联合举办了一项线上挑战赛,6月26日至7月10日期间,鼓励开发者利用Prem在本地部署AI模型和服务,构建新一代的AI应用程序。

参赛团队不超过4个人,单人也可参加;比赛结束后将评审出3个最佳应用,并奖励一万美金

了解提交流程、提交要求、使用方式、官方文档、评审标准等信息,可以查看官方博客 ⋙ @langchain

img

🤖 字节跳动要造机器人,团队计划扩充到百人

img

7月3日,晚点 LatePost 独家消息,字节跳动也将入局机器人行业,团队已有约 50 人,计划年底扩充到上百人。目前团队的业务方向明确为两部分:

一是生产一些机器人,优先服务字节的电商履约需求,涉及仓储里的分拣、组货和打包,以及物流环节

二是关注前沿技术,探索把 AI 大模型能力用到机器人上

由此推测,字节要做的机器人,可能是具备移动能力的、能在电商仓里送货的分拣机器人,以及带有视觉感知能力、能自己打包货物的机械臂 ⋙ @晚点 LatePost

🤖 Midjourney 推出 pan 功能,上下左右,可以平移扩展图片场景

img

7月4日,Midjourney 宣布正在测试名为「panning (平移)」的新功能,可以按指定的上下左右方向,拓展生成图片的外部场景。这也使得「outpainting (补全)」功能更加强大。

用户生成图片后,下方菜单栏会出现⬅➡⬆⬇四个按钮,点击某个箭头后,图片就会按照这个方向进行拓展补全。不过此项功能当前还有一些限制,需要更多的后续开发完善 ⋙ Twitter @Midjourney

img

🤖 StoryBird 根据提示词生成故事绘本,还能售卖赚钱

img

StoryBird 是一个绘本制作平台,只需要输入1000词以内的提示词,平台就可以生成一本完整的、带有精美插图的故事书。书籍还能上架网站和亚马逊进行售卖哦

网站还贴心地给出了提示词指南和示例,帮助生成更满意的绘本故事和插图:https://storybird.ai/chatgpt-stories-plugin/prompt-examples

img

StoryBird 已经上线了 ChatGPT 插件「Stories」,如果有 GPT-4 权限,那么只需安装插件并输入提示词,就可以等待生成故事和插图。需要注意的是:

  1. 输入的提示词,越详细越好

  2. 插件生成插图的时间要久一些,需要耐心等待

  3. 可以编辑文本并重新绘制,并且提供了多种选项,比如降低阅读年龄要求、调整文字阅读水平、调整故事长度等 ⋙ StoryBird | Twitter @xiaohuggg

img

🤖 AI Agents 绝佳综述:OpenAI团队的 Agents 理解与发展规划

img

LLM Powered Autonomous Agents 是 @Lilian Weng 一篇广泛传播的博文,可以说是目前 AI Agent 领域优质论文的系统综述。Lilian 现在是 OpenAI 的 Head of Safety Systems,之前还领导过 OpenAI 的 Applied AI 团队,她的文章绝对值得一看~

AI Agent 被认为是 OpenAI 发力的下一个方向。Lilian 将 Agents 定义为 LLM、Planning、Memory、Tools的集合,并在文章中对每个组建的实现路径进行了细致说明:

LLM (大语言模型) 是核心大脑

Planning (任务规划) 、Memory (记忆)、Tool use (工具使用) 等则是 Agents 系统实现的三个关键组件

以下是文章的核心目录,原文很长,可以结合感兴趣的要点进行阅读:

1. Agent System 是什么

2. Planning 任务规划

  • 任务分解〖Task Decomposition〗

  • 自我反思〖Self-Reflection〗

3. Memory 记忆

  • Memory 的类型

  • 最大内积搜索〖MIPS〗

4. Tool Use 工具使用

  • MRKL 架构

  • 让模型学习使用外部工具的 API

  • HuggingGPT

  • API-Bank

5. AI Agents 案例实践

  • 科学研究领域的应用

  • Generative Agents

  • AI Agent 的概念验证

6. LLM Agents 的局限

  • 有限的上下文容量

  • 长期规划和任务分解方面的挑战

  • 自然语言接口的可靠性挑战 ⋙ @Lilian Weng | @海外独角兽(中文翻译版)

img

🤖 AI虚拟人(数字人)商业实践现状,与未来发展初探

img

这是 @向阳乔木 7月2日举办的「AI虚拟人(数字人)交流会」的会议记录和要点提炼,也是截至目前对数字人分享最立体和透彻的内容。感兴趣可以前往飞书查看直播视频和文本!

🔔 AI数字人类型和应用场景

  1. 二维/三维虚拟人:用于游戏、IP品牌 (柳夜熙)、内容创作等

  2. 真人形象数字人:用于直播卖货、营销/投流广告视频录制 (Heygen)、语言学习 (CallAnnie) 等

🔔 AI数字人的价值是什么

  1. 代替人说话,提升表达效率和营销效率:例如真人做不到24小时直播,但数字人可以

  2. 创造真实世界无法完成的对话或交流:例如AI talk的实验探索,复活故去的亲人等

🔔 AI数字人面临的问题

  1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制;比如抖音出台一些标准,而微信视频号容忍度更低,人工检查封号

  2. 技术限制:形象只是皮囊,智能水平和未来想象空间,依赖大模型技术提升

  3. 需求限制:直播带货算个落地场景,但不刚,目前更多是体验新鲜感

  4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等

🔔 AI数字人直播盈利方式

  1. 直接卖数字人工具软件:「实时驱动」在直播时能改音频话术,真人接管,市面价格在一年4-6万往上 (标准零售价);「非实时驱动」一个月600元,效果很差,类似放视频的伪直播,市场价格混乱,靠发展代理割韭菜

  2. 提供数字人运营服务,按直播间成交额抽佣

🔔 AI直播卖货适用品类和场景

  1. 适用于不需要强展示的商品 (如品牌食品饮料),服装就搞不了(过品快,衣服建模成本高)

  2. 适用于虚拟商品,如门票、优惠券等

  3. 不适用于促销场景,这涉及主播话术、套路,调动直播间氛围能力等

  4. 电商直播分为达播跟店播,数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样 (朋友公司数据)

🔔 AI直播的壁垒和未来市场格局是什么

  1. 时间拉长,技术上没壁垒:但目前看仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高,比如更真实的对口型,更低的响应延迟等

  2. 不会一家独大:可能4-5家一线效果,大多二三线效果公司;因为它只是工具,迁移成本低

  3. 真正把客户服务好、能规模化扩张的公司更有价值:疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦

  4. 有资源、有业务的大平台下场,可能会带来降维打击:例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打

🔔 面对大厂竞争怎么办

  1. 大厂做产品有很多部门利益牵扯,法务合规等问题,不敢用野路子,开发上线产品效率低

  2. 大厂人工成本高,不少方向和领域都不会做,以及不少内部决策也不一定靠谱

  3. 在电商领域,数字人不能也无法成为壁垒,跟数字人配套的运营服务才是,大厂一般不愿做重运营的事 ⋙ Twitter @向阳乔木 | 观看录播视频 (134min)

img

🤖 关于「构建 LLM App」你所需要知道的一切

img

这是一篇长文,非常细致地讲解了如何使用 LLM 构建应用程序,并解释了相关概念的含义,以及你所需要的所有代码段。当然,如果你只想看一个「快速使用LLM构建应用程序」的简短教程,可以直接跳转到最后一部分!

🔔 我们为什么需要大语言模型 (LLM)

🔔 微调 VS 上下文注入

  1. Fine-Tuning (微调)

  2. In-context learning / Context Injection (情景学习 / 上下文注入)

🔔 什么是LangChain?

  1. Models (模型):各类模型的接口

  2. Prompts (提示):提示管理、提示优化、提示序列化

  3. Indexes (索引)::文档加载器、文本拆分器、矢量存储-支持更快、更高效地访问数据

  4. Chains (链):链超出了单个LLM调用,它们允许我们设置调用序列

  5. Agents (代理):是使用LLM来选择要采取哪些操作的实体

🔔 手把手教你使用 LLM 构建App

  1. 使用LangChain加载文档

  2. 将文档拆分为文本块

  3. 从文本块到嵌入

  4. 定义要使用的LLM

  5. 定义提示模板

  6. 创建矢量存储 ⋙ 来源

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21722.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

冲冲冲!找到了用AutoGPT+爬虫搞¥的新路子!

近几个月真是太魔幻了,优秀的AI接连问世,原本ChatGPT3.5的表现就足够震撼了,现在又来了一个更重磅的东西——AutoGPT! 它是一个由GPT-4驱动,能自主完成各项任务,几乎不需要人类插手的新AI产品。有了AutoGP…

怎么用电脑兼职赚钱,普通人可做的6个副业项目

现在的生活中,我们总是感觉所过的日子都很紧张,虽然我们尽可能地工作和努力,但是生活成本和社会压力仍然那么大。为了弥补自己的生活经验和财务困难,很多人开始寻找一种额外的收入来源。 其实这种额外的收入来源就被称之为&#x…

我找到了用AutoGPT+爬虫搞钱的新路子!

ChatGPT 已经过时了? ChatGPT已经是old news,AI 界又出现了一种新的趋势:AutoGPT——自主人工智能。 AI领域迭代之快,也难怪有人戏称:AI时代不能睡觉,眼睛一闭就OUT~ 【AutoGPT爬虫】 AutoGPT 到底是什么&a…

BOSS直聘+Chatgpt+RPA

1.BOSS直聘上项目的优势 很多路子,基本上见了光之后,就成千上万的人跟着做, 所谓的路子,最后连平台都知道了,也就挂了。 很多时候,不是别人吝啬分享, 分享往往意味着自掘坟墓。 所以生财这无数的…

了解ChatGPT的最便捷有效方式是跟对人

毕业后,工作原因,我自己的CSND就没有更新过。现在更新一篇有关chatGPT的快速入门指南。 一、什么是chatGPT 2022年12月底,你问我这个问题,我还真得好好跟你解释一下。目前这个阶段的火热程度,这里不再啰嗦了。基于GPT…

新路子!chatGPT+Python爬虫接私单怎么玩?

就在这两天,关于ChatGPT的疾呼突然在社交平台上刷屏。很多人发现自己的号已经不在了,用户们感到前所未有的惶恐。 ☝已经有不少公司把 chatGPT引入工作流,未来已来,AI智能时代真的来了,普通人如何在智能时代谋求发展&a…

chatgpt赋能python:Python挣钱路子:从初学者到专家,你需要知道的所有方法

Python挣钱路子:从初学者到专家,你需要知道的所有方法 Python是一个高效、可用于多种用途的编程语言。这让它成为一个非常稳定的工具,在过去的10年里,它已经成为了软件开发和数据科学中不可或缺的一部分。但是,Python…

ChatGPT之后,值得关注的垂直领域大模型

垂直领域大模型是指在特定的领域或行业中经过训练和优化的大型语言模型。与通用语言模型相比,垂直领域大模型更专注于某个特定领域的知识和技能,具备更高的领域专业性和实用性。 题图 from unsplash 与通用大模型相比,垂直领域大模型具有以下…

AntV-G6手动添加节点和边,实现拓扑图的可视化展示

一小时实现简单的手动添加节点和边,实现可视化展示 左边:取消添加节点和边、获取的拓扑图数据、添加节点、添加边 中间:可视化展示区域 右边:修改节点信息、修改边信息 下面是一些关键代码 根据官网修改G6设置交互模式 添…

ChatGPT来势凶猛,公有云格局会不会大变?

【引言】: AI风暴来袭,全球无人幸免。 但公有云与ChatGPT到底啥关系? 1) 公有云与ChatGPT,到底谁会“吃”掉谁? 【科技明说 | 热点关注】在看到公有云厂商纷纷开始大模型发布,开始GPT的融入之…

使用window便签功能实现桌面窗口置顶

在百度中搜索下载【DeskPins绿色汉化版】 https://dl-download.csdn.net/down11/20200708/0de0e95a267321e174e1ec3077edabaf.zip?response-content-dispositionattachment%3Bfilename%3D%2213542_DeskPins_16903.zip%22&security-tokenCAISgwJ1q6Ft5B2yfSjIr5b3eovVlO5jz…

QQ截图“钉在桌面上”:不用另外下载软件让图片在屏幕置顶,永远保持在最前面、最顶端

有时候为了方便“借鉴”某段文字写word时,需要频繁换窗口换文件,word挡住文字特别影响视线,属实是麻烦 这时QQ的“钉在桌面上”功能就起了大作用,还不用特地去下其他软件 比如要“参考”某篇写期末论文,就可以置于最…

win10如何置顶某个窗口

win10如何置顶某个窗口 方法一:Window Topmost Control方法二:OneQuick 网上很多推荐感觉都不太好用,要么收费,要么很阉割。这里推荐两个小工具。 方法一:Window Topmost Control 下载: 百度、谷歌自行下载…

windows窗口置顶--Windows on Top

目录 工具界面(非常简介): 使用方法 工具设置 快捷键设置及其他设置 在工作的时候,有时需要频繁切换窗口,而有时候需要看实时的数据请求,将窗口调小,又不好后面代码修改操作。这一款工具可以…

【窗口置顶神器】DeskPins

由于想边记笔记边看PPT,但是苦于笔记窗口老被PPT遮挡住,如果整小了笔记窗口或者PPT窗口又很不爽,所以才找到这个软件。 这个软件叫做DeskPins,非常好使,强烈推荐!此帖作为记录。 附上DeskPins下载地址 安…

利用ChatGPT协助编写单元测试

ChatGPT自从2022年推出以来受到很多人的喜欢,此篇博客重点介绍如何修改Prompt来自动生成较理想的单元测试。如下图所示的一段代码,该class中有一个public方法toLocale(),其余都是private方法,toLocale()方法会调用private的方法。&#xff08…

32岁医生放弃医院编制,转行去做程序员!

这年头大环境不好,程序员都想方设法往体制内跑,希望能端起稳定的铁饭碗。但也有人是逆行者,明明在体制内,却非要跳出去当程序员。 一个网友发帖说自己今年32岁,放弃了月薪7500元的二甲医院编制,转行去做ja…

文心一言发布我怎么看?

文心一言发布我怎么看? 文心一言发布会我只简短的回答两个问题:补充: 文心一言发布会 有想看发布会视频的朋友,关注爱书不爱输的程序猿,私信找我拿 我只简短的回答两个问题: 1.文心一言能否为百度止颓? 首先,百度的颓势是由于多种因素导致的&#xff0c…

ChatGPT - 生成新的想法并克服写作的障碍

文章目录 Prompt Prompt “我正在撰写有关[主题]的博客文章。为此博客文章提供一个包含10个要点的大纲。还给我5个引人注目的标题选项。”大纲:I. 介绍Flink - Flink是什么? - Flink的特点 - Flink的应用场景II. Flink的核心概念 - 流处理 vs 批处理 - …

革新写作方式:ChatGPT最新版带来高质量聚合文章的批量生成

随着人工智能技术的不断发展,自然语言处理模型也在不断进步。ChatGPT最新版作为一种强大的语言模型,可以生成高质量的聚合文章,为写作方式带来了革新。本文将详细阐述ChatGPT最新版带来的革新之处,包括其应用领域、生成文章的流程…