音视频技术开发周刊 | 300

每周一期,纵览音视频技术领域的干货。

新闻投稿:contribute@livevideostack.com。

08848c859fa993da4458e9de23d902de.png

著名数据和AI企业Databricks,收购类ChatGPT开源平台MosaicML

6月27日,Databricks在官网宣布,以13亿美元(约94亿元)价格收购了类ChatGPT开源平台MosaicML。本次交易是全球生成式AI赛道第一笔超过10亿美元的收购。

LangKit:ChatGPT等大语言模型界的“安全管家”开源了

ChatGPT等大语言模型一直有生成虚假信息、数据隐私、生成歧视信息等难题,阻碍了业务场景化落地。为了解决这些痛点并增强大语言模型的安全性,AI和数据监控平台WhyLabs推出了LangKit。

加速大模型应用落地,“火山方舟”正式发布

6月28日,在2023火山引擎V-Tech体验创新科技峰会上,火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service)。

理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度

在人类的日常交流中,经常会关注场景中不同的区域或物体,人们可以通过说话并指向这些区域来进行高效的信息交换。这种交互模式被称为参考对话(Referential Dialogue)。如果 MLLM 擅长这项技能,它将带来许多令人兴奋的应用。例如,将其应用到 Apple Vision Pro 等混合现实 (XR) 眼镜中,用户可以使用视线注视指示任何内容与 AI 对话。

7195afba9892a4b026ccbeb9de446512.png

LinkedIn 将开放 AIGC 辅助撰写简历功能

面向职场的社交平台LinkedIn, 将生成式 AI 引入帖文写作中,此项功能在测试完成之后会面向所有用户开放。

ChatGPT的iPhone应用程序更新:添加了Bing搜索引擎

ChatGPT for iOS现在提供与Bing搜索的连接。这意味着AI驱动的ChatGPT应用程序,能够获取更近期的信息,而不仅仅使用它在训练过程中所接触到的旧数据(ChatGPT知识库截至2021年)。

https://www.digitaltrends.com/mobile/chatgpts-iphone-app-now-has-bing-built-in/

620a84a3ae60fbb20c73760f688f3df9.png

字节跳动服务器芯片负责人创立 RISC-V CPU 公司,估值超 1 亿美元

据获悉,字节跳动前 RISC-V 和服务器芯片项目负责人卢山已离职创业,成立蓝芯算力,方向为 RISC-V 数据中心 CPU(中央处理器),蓝芯算力正在进行首轮融资,投前估值超过 1 亿美元。

芯片工艺决定了未来计算芯片架构

论文作者总结了ISCA(国际计算机架构会议)举办至今五十年内,每个十年发表论文的共性主题,结合论文主题和半导体芯片工艺两者的变化进行了脉络梳理。在此基础上,作者提出观点:未来十年将是计算芯片架构领域的黄金十年。

Meta一直在为自主研发尽可能多的芯片做出努力

本月初,苹果发布了其Vision Pro混合现实头戴设备,将激化Apple和Meta之间在AR和VR市场的竞争。在过去的五年中,Meta一直在努力自主研发尽可能多的芯片,以更好地区分其产品与苹果的产品。

https://www.theinformation.com/articles/how-meta-stumbled-in-quest-for-chip-independence

72d7cef73415265b26d12a3c3f9c5738.png

COMSOL:基于图像数据生成网格的方法

这篇文章解释了COMSOL 软件如何帮助用户,利用三维成像技术获得的数据生成仿真网格。

老照片修复算法:具有细节和结构增强的修复网络

论文作者在这篇文章中,提出了一种级联的由粗到细的老照片修复算法,可以同时恢复老照片中的结构化和非结构化损伤。

科学量化的色差值DE不一定能真实反映人眼感受的颜色差异

在工业界,对于色差公式在人眼可感知阈值或者可接受容限附近色差的预测性能非常关注,因为色差公式对于产品颜色质量控制的评价主要处于这个色差范围。但人类对大自然中不同色彩的辨别能力是不一样的。

d937246a3eaca02cd60fd77230c43170.png

绿屏的6种检测方案

在这篇文章中,作者使用了opencv检测、图像全域检测等六种方案尝试解决问题,并提出了关于提高方案效率和健壮性的若干建议。

沉浸式视频流媒体的Versatile Video Coding(VVC)标准

该论文介绍了VVC(Versatile Video Coding)标准及其在沉浸式视频流媒体中的应用,以及VVC的ISOBMFF存储格式。

1a1794cf9dfeffcc903443b5d9d0b2a2.png

聊聊新一代蓝牙技术:LE Audio横空出世,无线耳机迎来进化

这篇文章梳理了蓝牙技术的发展脉络,并介绍了常见的蓝牙音频格式,并详细阐述了为何LE Audio能成为未来蓝牙音频中的主流。

95263cea86b88e516bc62ece0a511fe0.png

建设高性能终端平台——传音元宇宙的基础设施探索

本次分享将分为三个部分,第一部分介绍全球用户在音视频业务中的痛点;第二部分主要阐述传音针对不同用户所研发的网络优化,音视频影像,游戏体验优化等技术。第三部分详细介绍了,为提前布局元宇宙,并在AIGC时代迎来新的机遇,传音针对不同地区的人群研发了AI语音,虚拟人等技术;在未来也将在终端平台搭建异构计算,交互体验预测等新的技术平台。

华科开源:半直接法视觉-激光雷达里程计 SDV-LOAM

在这篇文章中,作者提出了SDV-LOAM,它结合了半直接视觉里程计和自适应扫描到地图激光雷达里程计,用于避免跟踪误差、实现高跟踪精度。

远程渲染虚拟现实中的眼底部分聚焦空间压缩技术

在远程渲染的虚拟现实(VR)中,应用程序的渲染被移至云端,使得高质量实时内容可以在低功耗的独立式头戴显示器(HMD)上消费。此篇论文探讨了,在远程渲染的虚拟现实中应用聚焦技术和超分辨率的策略,以解决延迟和高带宽要求的挑战,并优化传输的图像质量。

https://dl.acm.org/doi/pdf/10.1145/3597063.3597359

37fd49a3f8e39258d38a79924a4273a4.jpeg

Zoom加入AOMedia,双方的“见面礼”不仅是AV1

6月21日消息,视频会议软件Zoom加入了开放媒体联盟(AOMedia),成为了该联盟组织的其中一员。这意味着,下一代编解码器AV1有望获得Zoom公司的支持。

059e7ba01fabb94ae3e19ea67f0b587d.png

LiveVideoStackCon 2023 上海站日程发布

LiveVideoStackCon 2023 上海站音视频技术大会以「沉浸·新视界」为主题,除了探索音视频技术在不同场景下的融合与发展外,还增添了游戏、AIGC和数字化行业案例等新鲜火爆的话题。在这里,你可以感受到多媒体生态内的头部公司、顶级玩家对行业当前发展趋势、瓶颈挑战,与对未来规划的深入解读。

我们将邀请60余位顶级讲师聚集一堂,与你共同分享他们的专业见解。这是一个与业内顶尖专家进行深入交流的绝佳机会,你将有机会亲自与他们面对面,从他们丰富的经验中获得宝贵的技术心得。

04ed7e61ecaf7c1fbaa63b3b00c1fe95.png

3c891b96399180239cbd3cb24b5615ff.png

AIGC产业研究报告 2023

AIGC产业研究报告系列共分为六个部分,包括语言生成篇、图像生成篇、音频生成篇、视频生成篇、三维生成篇、分子发现与电路设计篇,目前已经全部发布,欢迎关注收藏并与我们共同探讨AIGC产业发展。

B站改革:将以视频播放分钟数代替播放次数

在B站14周年庆之际,董事长兼CEO陈睿进行了以“很高兴遇见你”为主题的演讲。该演讲分享了B站过去14年专注的三件事以及B站在UP主内容创作生态、商业收入等方面的发展。同时,B站将以播放分钟数替代目前外显的播放次数,以更好地挖掘B站的优质内容。

IBM扩大与Adobe合作,推进生成式AI应用

IBM在官网宣布扩大与Adobe的合作伙伴关系,帮助其生成式AI产品Adobe Sensei GenAI和 Adobe Firefly加速场景化落地和应用进程。

ad87950c731988d6f03f4381183c3e09.png

《时代》专访ChatGPT之父:人工智能影响经济还需要很多年

奥特曼的公司OpenAI,通过其病毒式产品ChatGPT,将人工智能带入公众的视野。几乎没有人质疑OpenAI是这场革命的先锋。最终,这场革命将改变世界,不管是好是坏,两者都有可能。

华创资本熊伟铭:不着急投资AIGC应用,真正的风口还没到来

ChatGPT爆火之后,大模型成为创投“新宠”,但也有一些长期布局AI赛道的投资人并没有出手。


1be1025204a6588f883228a03ef48130.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22424.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

比GPT-4 Office还炸裂!阿里版GPT全家桶来袭

Datawhale干货 发布:阿里巴巴,来源:新智元 【导读】通义千问一出世,阿里版GPT全家桶立马来了。草图秒变程序,开会还能摸鱼,会议记录邮件文案全整活!这只是开始,工作和生活将全面进入…

大咖齐聚CCIG论坛——文档图像智能分析的产业前沿

目录 1 文档图像智能分析技术2 大咖齐聚CCIG20233 议题介绍3.1 从模式识别到类脑研究3.2 视觉-语言预训练模型演进及应用3.3 篡改文本图像的生成和检测3.4 智能文档处理在工业界的应用与挑战 4 观看入口&议程 1 文档图像智能分析技术 文档图像智能分析是指使用计算机视觉和…

谷歌tryOnDiffusion实现了高度逼真的虚拟试穿;ChatGPT 或将推出 AI 应用商店

🦉 AI新闻 🚀 ChatGPT Plus 用户已支持联网和插件功能,OpenAI 或将推出 AI 应用商店 摘要:OpenAI 宣布 ChatGPT Plus 用户已支持联网和插件功能。据外媒 The Information 报道,OpenAI 正考虑为 AI 软件创建一个应用商…

可解释机器学习-Task01-导论

💡 博客地址:https://1nnoh.top/3W8VFN4/ 🥇 版权: 本文由【1nnoh】原创 各位大佬敬请查阅 🎉 声明: 本博文禁止转载 感谢尊重和理解 ❤️ 如果文章对你有帮助 欢迎一键三连 可解释机器学习-Task01-导论 0x00 Abstract0x01 什么是…

一、导论——可解释性机器学习(DataWhale组队学习)

目录 导言一、什么是可解释人工智能?二、学可解释机器学习有什么用?2.1学习可解释机器学习的原因2.2 Machine Teaching :人工智能教人类学习2.3 细粒度图像分类2.4前沿AI 三、本身可解释性好的机器学习模型四、传统机器学习算法的可解释性分析五、卷积神经网络的可解释性分析…

在TitanIDE中使用ChatGPT辅助科研开发

作者:行云创新CEO 马洪喜 命题:太空望远镜拍摄的照片处理 假设:我是图形科学家,但不是特别懂Python 先上传一张银河系照片,目的是把彩色转成灰度: 然后我不会啊, 问问chatGPT 彩色图片转灰度…

itest监考机制_iTEST管理员组织大型无纸化考试的经验分享

嘉宾介绍 林涛 集美大学外国语学院在线平台负责人,自2017年起负责学校iTEST大学外语测试与训练系统(下称iTEST系统)的管理工作,曾统筹过七个学期的全校性大学英语在线考试。林老师对于如何使用iTEST系统组织和管理无纸化考试有着丰富的实践经验与使用心得。 经验分享 Q1:请问…

考试系统分享

介绍 学之思考试系统是一款基于k12教育的考试平台,小学、初中、高中和不同学科均可以均可以使用,支持各种题型(单选、多选、判断、填空、解答),里面包含了三大系统:学生系统、教师系统(TODO)、管理员系统、微信小程序学生端。 演…

腾讯云认证FAQ | 考试类型、考试预约等常见问题

要说2023年最火的是什么,云计算必须占一个名额。 为啥这么火呢?看市场反馈就知道了: 2019年以来,云计算领域对技术岗位的人才需求始终在40%以上,并逐年提高。 2022年显示,核心技术人才的招聘需求占比达到…

考试管理系统/在线考试系统

目录 摘要 Abstract 1 绪论 1.1课题研究背景和意义 1.2 国内外现状分析 1.3 课题研究主要内容 2 核心技术介绍 2.1 mysql技术介绍 2.2 eclipse编译器介绍 2.3 Spring框架简介 2.4 Vue.js技术简介 3 需求分析 3.1 系统的设计模式 3.2 系统的设计目标…

【亲测可用】经验分享,开发在线考试平台(类似问卷星、考试星、阿里巴巴在线考试、易考通、考试云、移动网大、移动网校、中石化网络学院、宝武微学院、iTEST等)如何用程序代码防止学生作弊?

来源: 宝武微学院 http://mooc.baosteel.com 移动网大、移动网校 https://wangda.chinamobile.com 1、如何避免考生考试过程切屏去搜寻答案? 使用JavaScript自带的全局方法屏蔽考生作弊 window.onmouseleave window.onblur window.onmouseout documen…

itest监考机制_干货 | iTEST管理员组织大型无纸化考试的经验分享

原标题:干货 | iTEST管理员组织大型无纸化考试的经验分享 嘉宾介绍 林涛 集美大学外国语学院在线平台负责人,自2017年起负责学校iTEST大学外语测试与训练系统(下称iTEST系统)的管理工作,曾统筹过七个学期的全校性大学英语在线考试。林老师对于…

计算机等级考试无纸化模拟软件(免费版)

分享内容 计算机等级考试【National Computer Rank Examination】,简称NCRE。主要考核计算机基础知识和使用一种高级计算机语言编写程序以及上机调试的基本技能。当代大学生大学期间除了自己的必修课程外,总会给自己找一些其他的东西让自己忙碌起来。除了…

微信订阅号发送模板消息

参考的链接: 微信公众平台测试号——模板消息发送Demo_a816120的博客-CSDN博客 开放接口 | 微信开放文档 微信公众平台 功能一:代码实现发送微信公众平台配置的模板消息 1、事先获取好appID和appsecret 2、书写发送的工具类 package com.talk915.…

微信公众号订阅消息

1、官网介绍 功能介绍 | 微信开放文档 订阅通知是一个用户主动订阅、服务号按需下发的通知能力。使用过程请遵守《微信公众平台服务协议》《微信公众平台运营规范》。 如有疑问,可在微信开放社区反馈。 设置订阅功能:服务号可以在图文消息、网页等场景…

windows11默认浏览器开启chatGPT—直接拿下

1、进入浏览器扩展设置 https://microsoftedge.microsoft.com/addons/search/Wetab?hlzh-CN 搜索此软件 2、添加到扩展后,打开查看显示 3、注册账号,然后使用即可

为你的Pycharm装一个得力助手(ChatGPT吧)

Pycharm算是我们日常工作中用到的一个非常重要的python工具,如果能为Pycharm安装一个小助手那么我们的办公效率一定可以事半功倍!! 插件安装 1、点击左上角 file——setting 2、点击Plugins——输入NexChatGpt,安装 即可使用&…

教你如何用Python分析出选注双色球号码

前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 又到了学Python时刻~ 数据集介绍 找从19年到现在的开奖历史数据,我们首先要把这个历史数据拿到, 拿到我们再进行做分析,分析每个号码出现的频率是多少, 哪个多&#x…

自己编一个大乐透选号器

新手,最近自己尝试着做了一个体彩大乐透的选号器,感觉挺有意思的,下面分享给大家! 具体步骤: 1、新建一个基于对话框的MFC工程。 2、按下图所示添加显示前区号码的5个编辑框,显示后区号码的2个编辑框&am…

彩票号码自选程序

彩票之–超级大乐透选号小程序 是不是每次买彩票的时候,总是不知道选什么号码好呢?今天来看看这个小程序吧! package Thread; import java.util.*; /*超级大乐透选号机*/ public class lottery {public static void main(String[] args) {//因为彩票号…