音视频技术开发周刊 | 281

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

35403d0a9e43c4af615f346570513010.png

ChatGPT背后的经济账

ChatGPT能否取代Google、百度这样的传统搜索引擎?为什么中国不能很快做出ChatGPT?当前,对这些问题的探讨大多囿于大型语言模型(LLM)的技术可行性,忽略或者非常粗糙地估计了实现这些目标背后的经济成本,从而造成对LLM的开发和应用偏离实际的误判。

一文读懂:有关ChatGPT的十个问题

根据 Similarweb 的数据,今年1 月,平均每天约有 1300 万独立访客使用 ChatGPT,是去年 12 月份的两倍多,累计用户超1亿,创下了互联网最快破亿应用的记录,超过了之前TikTok 9个月破亿的速度。

如何使用ModelScope训练自有的远场语音唤醒模型?

本文介绍魔搭社区中远场语音增强与唤醒一体化的语音唤醒模型的构成、体验方式,以及如何基于开发者自有数据进行模型的定制。

ChatGPT的前世今生,以及未来

据传,ChatGPT还成功通过了谷歌的编程面试,拿到了年薪18.3万美元的L3工程师offer。

ChatGPT横空出世,有很多你不知道的细节

1月底,美国《财富》杂志2/3月合刊的封面文章《全球爆红的ChatGPT是如何诞生的?》引爆了创投圈。

对话大模型中的事实错误:ChatGPT 的缺陷

一个引人瞩目的问题就是 ChatGPT 交互中仍会生成不少的事实性错误,对一些老幼皆知的简单问题也会一本正经的胡说八道。

音视频杂谈--ChatGPT和音视频开发

ChatGPT懂不懂音视频开发?

c720478cd753cf626cc15fe52b03cdbf.png

ChatGPT 教你 AI 绘画之 Midjourney 屠龙刀法第 1 卷

随着 AI 绘画取得了重大突破,横空出世的神器 Midjourney 也越来越被大家所熟知。如果把 Midjourney 比作屠龙宝刀,那么要用好这一利器的还得再配上一套『刀法』(提示词拼装技巧)。

2023北京,80位艺术家齐聚“大都东南”艺术科技展

卜桦、缪晓春、费俊、许毅博、田渊、邱宇等80多位艺术家的90余件人工智能、算法动画、机械装置、脑电波艺术、数据可视化、书法、绘画等多元形态作品在北京集中展出。

e255b2297bf46e2076d4bbcb1f338757.jpeg

AR下的RTC技术与应用

LiveVideoStack很荣幸地邀请到了来自Rokid应用平台算法负责人,王文兵老师,为我们分享介绍AR下的RTC技术与应用。

ManVatar:基于运动感知神经体素的三维头像快速重建

本文提出了一种基于运动感知神经体素的快速三维头像重建方法 ManVata。ManVata是第一个将表情动作与标准外观解耦的头部模型,并用神经体素对表情动作进行建模。

a65fae8f8111cda10cb1fb4dd1af433d.png

FFmpeg 6.0有望在2023年秋季发布

VideoLAN 总裁 Jean-Baptiste Kempf 本周末在 FOSDEM 2023 上介绍了即将发布的 FFmpeg 6.0 版本以及 dav1d v1.1。FFmpeg 6.0的关键变化包括跨 Intel、NVIDIA 和 AMD GPU 的 AV1 硬件解码。FFmpeg 6.0 还将为 FFmpeg 命令行、RISC-V 架构优化、API 更改等带来多线程支持。

https://fosdem.org/2023/schedule/event/om_vlc/attachments/slides/5695/export/events/attachments/om_vlc/slides/5695/FFmpeg_VLC_js.pdf

AOM AV1 3.6 带来更多性能和效率优化

在使用 GCC 编译器工具链时还添加了 RISC-V 架构支持。

https://aomedia.googlesource.com/aom/+/refs/tags/v3.6.0

FreeSWITCH 1.10.9版本发布

这是一个重要的版本,包含了很多安全修复和稳定性改进。

49137b12b086fa43ef8f3b04e80401fa.png

QUIC 技术深入探究(1):QUIC 赋能未来

演讲者介绍了 QUIC,其优势和重要特征,并畅想了 QUIC 可以赋能的未来。

9842699a2e689979c8afb79ac0c03259.png

2023年十大流媒体发展趋势展望

经历了三年疫情,2023年流媒体将如何发展?虽然本文主要针对海外市场,但依然值得国内借鉴,比如AIGC、远程制播等领域领先国内许多。

未来科技创业畅想 | 5Y 3Sigma小圆桌年度回顾

本文来自五源资本,通过八场线上和线下的讨论会,针对消费机器人、通用机器人、自动驾驶、3D元宇宙、大模型与NLP、AIGC等不同领域的话题,有近百位来自工业界与学术界的朋友进行了观点分享与碰撞。

2e49aa04891a3d4713ca28b5c032714e.png

专访探索AGI的孤勇者,传奇工程师John Carmack:惊讶看不到如我这样的人

我坚信,实现AGI程序的源代码,一个人就能编写,规模是几万行。而不是Chrome三千万或者Twitter两千万那种量级。推理是:人的DNA信息量不到1GB,而大脑只有40MB,其中还有冗余和不精密的部分。十年内我们也能拥有匹配的硬件完成这项工作。

69bf0cd19e7de40a20d63e89c8b7e0b5.png

新版国家标准GB/T 28181-2022将于7月正式实施

与GB/T28181—2016相比,除结构调整和编辑性改动外,相关主要技术有一些变化。例如更改了标准范围,删除了“联网系统信息”“数字接入”“模拟接入”“模数混合型监控系统”“数字型监控系统”“监控点”“监控中心”的术语和定义。

840b3986541372e935ba38c0d765df50.png

Google AI 之旅的下一个重要阶段

Google 和 Alphabet CEO Sundar Pichai对ChatGPT的回应。

2022年32篇最佳AI论文:DALL·E 2、Stable Diffusion、ChatGPT等入选

Mila在读博士Louis Bouchard总结的论文列表,总体比较靠谱。GitHub上还有很多论文的短视频和文字解读、代码链接等。

https://hub.baai.ac.cn/view/22798

无损压缩鼻祖去世了,没有他就没有今天的Zip、PNG、MP3、PDF……

他就是Abraham Lempel,来自以色列的科学家。

oppo加入AAC音频专利池

oppo成为AAC中来自中国仅次于小米的第二大专利持有者。

https://www.iam-media.com/article/oppo-joins-licensings-aac-patent-pool

Zoom全球裁员15%

这可能是行业趋势扭转的信号?

https://blog.zoom.us/a-message-from-eric-yuan-ceo-of-zoom/

压着谷歌打!ChatGPT提前上岗微软搜索

就在谷歌预告Bard之后,微软已经抢先推出新版Bing和Edge浏览器。

阅读/资源推荐

2023年WebRTC趋势:黄金时代不在

随着疫情防控全面放开,混合办公成为主流的协作方式,WebRTC作为主流的RTC基础技术自然也受到影响。在2023年,WebRTC代表的RTC技术会有怎样的剧本?

一起来学习图片

Google官网的免费课程。

https://web.dev/learn-images/

活动推荐

392ed660e7b3c0db1333be05830a7ff7.png

【公开课】聊聊百度视频质量那些事儿

受限于各种因素,视频质量评测在实践中存在着诸多问题:主观评估的置信度如何保证?如何进行规模化的主观评估?如何解决不同设备的差异带来结果偏差?如何解决评估者的差异导致的结果偏差?如何对主观评估进行有效的管理和调度?如何解释主观评估和客观算法之间的一致性?

时间:44e23160610eccba15d40b0f8aa91f75.png2023年2月16日 19:00

报名:fb8d9bc50b46a7edc7d91595a41b5c24.png扫码关注LiveVideoStack小秘书,获得观看方式。

6cfa1175e34b89925e8f7547dbdd8d7f.jpeg

LiveVideoStackCon 2022北京站 一起见证多媒体趋势

时间:8e6ba721f85ca0fa9bdd1ec7d6a9fe83.png2023年3月31日-4月1日

报名:534fd07248e5b13be2611b23fd17cc0c.png扫描图中二维码或点击【阅读原文】了解更多详细信息,报名参与。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26057.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一周 AIGC 丨谷歌正面反击 GPT-4,Claude 一分钟看完万字长文,Stability AI 发布文生动画工具...

AIGC 再进化,谷歌在 2023 年 I/O 开发者大会上宣布面向所有用户开放 MusicLM 模型,输入文字描述即可生成音乐。GPT4 最强对手 Anthropic Claude 史诗升级,百页资料一分钟总结完毕。Stability AI 推出文本到动画工具 Stable Animation SDK&…

ChatGPT+Midjourney可量产“宫崎骏”,AI将会让多少设计师失业?

最近,大家都被横空出世的ChatGPT惊艳到了。 瞬间在全世界爆红的ChatGPT,除了陪聊,它还能写论文、写小说、写代码、编剧本……几乎无所不能。 ChatGPT让科技巨头谷歌发出了红色警报,一夜之间全世界的打工人们也都慌了——我们的很…

香港top5功能完善炒期货投资app软件排名(最新评测)

选择一款合适的炒期货投资软件对于投资者来说至关重要。考虑软件稳定、交易流畅度、交易品种、数据可靠性、而且还要考虑费用等多方面因素。 首先,软件的稳定性很重要。选用稳定性高的软件可以避免如断电、手机或电脑死机等突发状况,保证交易安全顺畅。…

量化交易软件哪家好?国内排名是?

一、量化交易软件是什么 量化交易软件是一种基于计算机程序和算法的交易系统,能够自动化地执行投资策略,降低交易成本、提高交易效率。它通过数据分析、技术分析等手段,对市场走势进行预测,并根据预测结果自动执行交易&#xff0…

贵金属实时行情看盘软件排行榜(top 10)

贵金属实时行情看盘软件哪个好,还是得看MT4软件,MT4是俄罗斯软件公司MetaQuotes生产的一款以外汇和贵金属交易为主的软件,其功能十分全面,目前全球有超过100家贵金属公司和30个国家的银行选择MT4软件作为网络交易平台。MT4综合行情…

重磅!ChatGPT席卷全球,Salesforce将推出EinsteinGPT!

2月9日,Salesforce首席执行官Marc Benioff在Twitter上发布了这样一则推文,表示将于3月7日的TrailblazerDX 23上发布Salesforce EinsteinGPT,随后Salesforce的官方Twitter也进行了转发。 虽然还没有正式的新闻稿,但不少业内人士猜测…

chatgpt赋能python:Python图片编辑-利用Python高效便捷地处理图片

Python 图片编辑 - 利用Python高效便捷地处理图片 介绍 随着互联网时代的发展,图片的运用也越来越广泛。对于经常需要处理大量图片的网站/应用程序而言,处理图片已经成为常见的需求之一。Python 作为一种功能强大的编程语言,也可以用来编辑…

2023人工智能发展五大趋势

点击蓝字 / 关注我们 源自:亿欧网 一、生成式AI 机器学习解决方案,正在引领新一代的产品和服务。但是,到目前为止,人工智能主要应用于数据驱动和分析工作流程。创造力和构思被认为非人工智能的能力。 但是,最近出现…

【固收研究】政策面债市情绪

*✧. ‿︵‿୨ 政策面 ୧‿︵‿✧ 政策面,政策面包括货币政策、财政政策以及监管政策等。政策面通过影响资金面、经济运行和市场参与者行为来影响债券市场。一般来说,货币政策偏宽松对债市构成利好,财政政策偏积极对债市构成利空&#xff0c…

AlphaGo 和 ChatGPT有何相似之处? 附AlphaGo核心算法开源链接

AlphaGo 和 ChatGPT 是迄今为止最著名、最具开创性的两个 AI 系统之一。尽管它们被设计用于不同的目的,但它们共享一些重要的相似之处,包括使用深度学习、神经网络以及专注于达到人类水平表现等。而不久前, DeepMind 悄悄开源了AlphaGo的核心…

探索AI图像安全,助力可信AI发展

探索AI图像安全,助力可信AI发展 0. 前言1. 人工智能发展与安全挑战1.1 人工智能及其发展1.2 人工智能安全挑战 2. WAIC 2023 多模态基础大模型的可信 AI2.1 WAIC 2023 专题论坛2.2 走进合合信息 3. AI 图像安全3.1 图像篡改检测3.2 生成式图像鉴别3.3 OCR 对抗攻击技…

GPT3 和它的 In-Context Learning

作者 | 太子长琴 整理 | NewBeeNLP 大家好,这里是NewBeeNLP。ChatGPT 的爆火让很多 NLPer 大吃一惊,焦虑感爆棚,它的思路和方法都不复杂,但效果却出奇的好。 我想任何研究成果的爆发都不可能是一蹴而就的,期间必然包含…

微软总裁布拉德・史密斯:目前 AI 最令人担忧的问题是深度造假

微软总裁布拉德・史密斯(Brad Smith)周四表示,他对人工智能的最大担忧是 Deep Fakes 深度造假,随着各式各样的人工智能工具出现,这类看起来很逼真但实际是虚假的内容如今越来越普遍了。 在周四于华盛顿的一次演讲中&a…

AI时代带来的图片造假危机,该如何解决

一、前言 当今,图片造假问题非常泛滥,已经成为现代社会中一个严峻的问题。随着AI技术不断的发展,人们可以轻松地通过图像编辑和AI智能生成来篡改和伪造图片,使其看起来真实而难以辨别,之前就看到过一对硕士夫妻为了骗…

扫眼球换“世界币” ChatGPT之父“剥削穷人”?

ChatGPT火爆全球后, 山姆奥特曼(Sam Altman)创立的加密项目Worldcoin(世界币)重回大众视野。这个项目诞生于2年前。那时,埋头迭代GPT模型的OpenAI还未如此知名,该公司的CEO 山姆奥特曼也位列科技…

OpenAI重磅研究:ChatGPT可能影响80%工作岗位,收入越高影响越大!

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年2月份热门报告合集 最新亲测国内可用ChatGPT使用教程(3分钟搞定) 文心一言、GPT3.5及GPT4应用测评对比报告 ChatGPT团队背景研究报告 ChatGPT的…

基于Android的医院预约挂号系统

一、APP(Android端---普通用户) 1.注册、登录 1.1注册 用户填写真实姓名、身份证号码(账号)、手机号码、性别和密码(6位数)进行注册 1.2 登录 用户第一次登录系统提醒用户进行注册,用户注册成功…

智能中医诊疗系统php代码,中医HIS

中医预约挂号 方便患者在微信上预约挂号、按医生预约,号码池和线下挂号共享方便医院管理;即方便了患者,又将诊所接入互联网,建设中医诊所品牌。 中药颗粒对接 系统提供独立的颗粒处方,将颗粒药品和其他药品分开&#x…

那些天天都在野外钓鱼的人不上班吗,有收入吗?

你好,我是钓鱼飞飞,很高兴可以回答你的问题,我也是一位常年钓鱼的钓鱼爱好者,特别是今年,几乎一整年都在钓鱼,关于你提出的问题:那些天天都在野外钓鱼的人不上班吗,有收入吗&#xf…

荒岛求生java游戏,荒岛求生手机版

荒岛求生手机版是一款冒险生存题材的手游,在游戏中玩家能够感受到非常丰富的元素,它们能够给游戏提供很棒的探索空间,但是也有很多地方融合的不够好,会出现很多的纰漏,随着游戏的进行,玩家会解锁更多的玩法…