chatgpt+mj+did生成会说话的头像

chatgpt+mj+did生成会说话的头像

当我们有了 ChatGPT 生成的内容,有了 stable-diffusion、midjourney 或者 dalle2 生成的人像,如果还能让人像动起来,替我们朗诵或者播报一下 ChatGPT 的内容,不就是一个数字人了么?

D-ID 公司,就可以帮助人们快速达成这个目的:https://www.d-id.com/creative-reality-studio/。他可以综合利用虚拟图片、剧本文案,生成一段对应的数字人短视频。

快速点击注册后,就可以看到上图这样的 D-ID 的编辑器界面。在底部可以选择一个默认形象,或者自己上传一个形象照片,或者切换到"Generate AI presenter"标签页,输入类似 stable-diffusion prompt 形式的提示词,由 D-ID 生成 AI 形象:

D-ID 默认提供了一些 prompt 示例,帮助不太熟悉 AIGC 绘图的用户快速了解用法。比如上图中我们就直接点选了其中一条示例,画一幅迪丽热巴的全身像,不过看起来 D-ID 使用的文生图模型其实并不知道迪丽热巴是谁——换一个角度说,知道了容易侵权。因此,想要生成虚拟数字人,建议大家还是使用更专业的文生图产品,完成恰当的肖像图后,通过自定义上传照片的方式完成形象定义。

在右侧,可以输入需要数字人实际念的剧本文案。可以看到,我们最多被允许输入3875 个字符。应该足够用了。如果你只有一个核心的想法,还没有完整内容,你也可以像使用 ChatGPT 补全文本一样,点击输入框底部第三个魔法棒 icon,让 GPT-3 AI帮你自动生成更多文案。 GPT-3 是 ChatGPT 的上一代产品,因此基于 GPT-3 的补全文本同样需要小心校验,避免错误。比如下图中,GPT-3 补全的介绍是根据"领先"二字生成了"IBM, SAP, Oracle"等公司名称,显然不符合实际。

完成文案输入后,可以调整语音的风格,包括:语种、声音来源、语气风格等等,还可以在文案中特意插入一些停顿时间。完成以后,点击输入框底部第一个喇叭 icon,试听一下生成的语音效果。如果对标准语音方案不满意,我们可以点击"Audio"标签,选择录一段自己的声音,上传到 D-ID 平台。

最后,点击页面右上角"Generate Video"按钮,就可以生成一段视频了。我们可以点击播放,看到 D-ID 自动识别了图片中头部和嘴部区域,按照文本的发音规律,生成了对应的口型,甚至辅助添加了一定的头部摆动效果。完成的数字人短视频,你可以发到短视频平台上,也可以插入到公司官网上,还可以放到产品介绍 PPT 里,都能给人眼前一亮的感觉。

D-ID 公司并不满足于调用 GPT-3 做剧本文案扩写,目前也在探索更多利用 ChatGPT 能力的方式,比如直接进行语音对话:https://chat.d-id.com/

事实上,数字人技术还有更大的发展和探索空间。微软在 2023 年 1 月发表了一篇论文,介绍他们的 Vall-E 系统,在线演示地址见:https://valle-demo.github.io/。Vall-E 系统只需要用户提供 3 秒钟录音,就可以模拟仿真原声的语气语调,来念输入的任意文本。不过因为被滥用的风险太大,微软并没有开源这个系统。

关于音频和数字人形象的口型对应技术,开源社区也有相关方案:https://github.com/ajay-sainy/Wav2Lip-GFPGAN。不过默认模型是采用英文视频训练,对中文语音口型表现不佳,需要使用者自行采集中文发音视频进行重训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15351.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对比CahtGPT Bard Claude2对中文的理解

对比CahtGPT Bard Claude2对中文的理解 今天简单测试了一下目前这三个很火的模型对中文的理解能力 简单问题 鲁迅和周树人的关系 Bard CahtGPT Claude 介绍一下平凡的世界这本书 Bard CahtGPT

chatgpt赋能python:Python和Geany的完美结合——快速高效的编程助手

Python和Geany的完美结合——快速高效的编程助手 什么是Python? Python是一种高级编程语言,由荷兰人Guido van Rossum于1989年圣诞节期间创建。它具有简单易学的语法和清晰优雅的语言结构,并且非常适合快速开发应用程序和系统脚本。 Pytho…

用 ChatGPT 解答 2023年四川高考语文作文题 - 时间掌控的边界:自由与仆役的交织

光阴似箭,距离我当年参加高考,已经 23 年过去了。 虽然我接触 ChatGPT 还不到半年,但它已经深刻改变了我的工作和思考方式。我不知道 ChatGPT 的出现,是不是让我变得越来越懒,越来越离不开它了。 今天看到群里讨论起…

chatgpt赋能python:Python加入高考:重塑高考科目格局

Python加入高考:重塑高考科目格局 自2021年起,Python作为一门新兴的科目,已经正式加入中国高考科目之列。这一决定引起了广泛的关注和讨论,有赞成的声音,也有反对的声音。本文将为大家介绍Python加入高考的理由和影响…

让ChatGPT做当年的高考现代文阅读

最近ChatGPT火出天际,我突发奇想,如果用ChatGPT来做高考现代文阅读会怎样。 于是找到了当年非常火的一篇文章,叫《一种美味》,这个名字大家可能不太熟,但是提到其中一句话,你可能立马就想起来了。 「眼里…

十分钟编码实战springboot对接ChatGPT

Java后端 pom.xml添加ChatGPT的依赖 <dependency><groupId>com.unfbx</groupId><artifactId>chatgpt-java</artifactId><version>1.0.10</version><!--排除子依赖 slf4j-simple 不然会有冲突 --><exclusions><exclu…

浅尝对接 ChatGPT 与 DDD 工程

1. SpringBoot DDD 工程 MVC 架构与 DDD 架构简单对比 MVC 架构&#xff1a;老项目将 controller、service、manager、dao、bean 按照系统模块分在一起&#xff0c;随着项目发展每个包中对象逐渐膨胀&#xff0c;导致维护困难、bug 难查DDD 架构&#xff1a;新项目按照功能模块…

ERD Online 4.1.0对接ChatGPT,实现AI建模、SQL自由

ERD Online 是全球第一个开源、免费在线数据建模、元数据管理平台。提供简单易用的元数据设计、关系图设计、SQL查询等功能&#xff0c;辅以版本、导入、导出、数据源、SQL解析、审计、团队协作等功能、方便我们快速、安全的管理数据库中的元数据。 4.1.0 ❝ :memo: fix(erd): …

为什么职场中35岁之后很难找到合适的工作?

(点击即可收听) 为什么职场中35岁之后很难找到合适的工作 无论是初入职场还是,职场多年的老司机,都听过一个35岁危机的一个话题 无论是企业还是一些招聘者,针对35,甚至就是30的人,充满了不是这样,就是那样的偏见的理由 每个公司都喜欢有激情,有想法,有干劲的年轻人,无论哪个公司…

毕业季到底是去大厂还是去小公司

(点击即可收听) 毕业季到底是去大厂还是去小公司 相信很多人在选择大小公司的时候,会比较痛苦,外面的人想进去,里面的人想出来&#xff0c;至于选择大厂还是小公司 这是因人而异的,不同的阶段都可以有不同的选择 进大厂不一定就是对的,进小公司也不一定就是错的,学习东西,增长经…

字节跳动发布自研 Web 构建工具 Rspack

作者 | Rspack Team Rspack 是由 ByteDance Web Infra 团队孵化的基于 Rust 语言开发的 Web 构建工具&#xff0c;拥有高性能、兼容 Webpack 生态、定制性强等多种优点&#xff0c;解决了我们在业务场景中遇到的非常多的问题&#xff0c;让很多开发者的体验有了质的提升。 仓…

Windows 在美国采用率迅速下跌,只剩 57%,已至历史最低点!

整理 | 苏宓 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 流水的操作系统&#xff0c;铁打的 Windows。不过&#xff0c;自 2018 年微软宣布分拆 Windows 部门拥抱 AI 之后&#xff0c;作为一项服务的 Windows&#xff0c;其王者地位还能持续多久&#xff0c;也…

微软 Bing 日活用户破 1 亿, 每日约 1/3 用户与 Bing Chat 交互

整理 | 朱珂欣 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 自 ChatGPT 横空出世以来&#xff0c;新一轮 AI 之战就似乎在无形中被燃起。 2 月 8 日&#xff0c;微软召开了一场闭门媒体发布会&#xff0c;推出了全新的、 由人工智能驱动的 Bing 搜索引擎和 Edg…

终于,GPT-4 将于下周问世!不仅能搞文字,还支持视频

整理 | 郑丽媛 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 作为当前全球最火的生成式 AI&#xff0c;ChatGPT 仅用了 3 个月&#xff0c;就几乎搅动了整个科技圈&#xff0c;人们不断惊叹于 ChatGPT 的强大——但微软和 OpenAI 想要的&#xff0c;显然不至于此…

美团以 20.65 亿人民币收购光年之外

美团于香港联交所发布公告&#xff0c;称已完成光年之外境内外主体 100% 股权的收购&#xff0c;收购价约为 20.65 亿人民币 。 此前&#xff0c;光年之外联合创始人王慧文因身体原因&#xff0c;离岗就医及休养。美团在公告中对于并购的解释是&#xff0c;通过收购事项获得领先…

5000亿美元「flag」后,微软 CEO 暂缓员工加薪,现发帖感谢大家,员工:“发钱才实际!”...

整理 | 朱珂欣 出品 | CSDN程序人生&#xff08;ID&#xff1a;coder_life&#xff09; 打工人眼里&#xff0c;没有比「加薪」更能直击心巴&#xff01; 据 Business Insider 报道&#xff0c;本周四&#xff0c;微软 CEO Satya Nadella 为感谢员工在 2023 财年里做出的贡献…

Rust 商标政策引争议,开发者:请放弃这个糟糕的政策吧!

整理 | 王子彧 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 近日&#xff0c;拥有 Rust 和 Cargo 商标的 Rust 基金会正在起草制定一项新商标政策提案。因提案中包含禁止在 Rust 工具或用 Rust 编写的软件的名称、域名或子域名中使用 Rust&#xff0c;引起了争…

GPT-4 让 Python 程序实现自修复 Bug,国外小哥将工具命名为“金刚狼”,并开源!...

整理 | 屠敏 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 继开发者用 GPT-4 制造了一款“贾维斯”代码助手之后&#xff0c;另一位程序员小哥 BioBootloader 再次整活&#xff0c;他利用 Python 和 GPT-4 创建了一个名为 wolverine&#xff08;金刚狼&#xff…

继「丑闻」之后,再爆 Stability AI 高层大换血!网友:“莫非是人心涣散?”...

整理 | 朱珂欣 出品 | CSDN程序人生&#xff08;ID&#xff1a;coder_life&#xff09; Stability AI 被爆「丑闻」不足一月&#xff0c;近日「新瓜」又来了&#xff01; 据彭博社报道&#xff0c;两名高管从 Stability AI 离职&#xff0c;大名指向 —— 研究主管 David Ha…

AIGC行业周刊【2023-0709】【第六期】2023年世界人工智能大会大佬发言汇总

点击加入->【智子纪元-AIGC】技术交流群 一、大咖观点&#xff1a; 0709AI日报&#xff1a;2023年世界人工智能大会大佬发言汇总「5年内&#xff0c;人类程序员没了」&#xff0c;Stability AI老板大胆预测&#xff0c;一众大佬狂怼&#xff1a;大错特错&#xff0c;都懒得…