[每日AI·0501]GitHub 版 Devin,Transformer的强力挑战者 Mamba,Sora 制作细节与踩坑,OpenAI 记忆功能

AI 资讯

  • 国资委:加快人工智能等新技术与制造全过程、全要素深度融合
  • GitHub版 Devin 上线,会打字就能开发应用,微软 CEO:重新定义 IDE
  • 在12个视频理解任务中,Mamba 先打败了 Transformer
  • Sora 会颠覆电影制作吗?3 人团队使用 Sora 制作短片完整技术细节&踩坑分享
  • 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
  • OpenAI:记忆功能现已对所有ChatGPT Plus用户开放
  • Phi-3 notebook发布,Phi的调优速度提高了2倍,且VRAM使用减少了50%
  • 使用张量并行技术进行自动驾驶感知模型训练
  • Meta 宣布在旧金山举办首届 Llama 3 黑客马拉松,与 Cerebral Valley 和 SHACK15sf 合作,提供超过1 0K 美元的现金奖励和合作伙伴积分以启动 AI 项目。这一事件强调了 Meta 在促进 AI 社区创新方面的承诺。
  • Google 推出了 Transformer 2 模型,该模型将注意力、递归、检索和前馈网络(FFN)集成到单一模块中,与原始 Transformer 的性能相当,但计算效率提高了 20 倍,并能有效处理高达 100M 上下文长度。

国资委:加快人工智能等新技术与制造全过程、全要素深度融合

报道地址
在这里插入图片描述

GitHub版 Devin 上线,会打字就能开发应用,微软CEO:重新定义 IDE

博客地址

微软的“GitHub 版 Devin” - Copilot WorkSpace,终于上线了!WorkSpace是一种“Copilot 原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。也就是说,只要有想法,而且会打字,就可以搞软件开发了。

在12个视频理解任务中,Mamba 先打败了 Transformer

论文链接 GitHub地址

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究团队发布了一项开创性工作。他们全面审视了 Mamba 在视频建模中的多重角色,提出了针对 14 种模型/模块的 Video Mamba Suite,在 12 项视频理解任务中对其进行了深入评估。

结果令人振奋:Mamba 在视频专用和视频 - 语言任务中均展现出强劲的潜力,实现了效率与性能的理想平衡。这不仅是技术上的飞跃,更是对未来视频理解研究的有力推动。

Sora 会颠覆电影制作吗?3人团队使用 Sora 制作短片完整技术细节&踩坑分享

原文地址

今年2月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。本周,知名视觉特效总监 Mike Seymour 采访了 Patrick Cederberg,就《Air Head》制作过程、技术难点等信息展开了提问,并在 fxguide 上发布一篇文章介绍了 Sora 在视频实际制作过程中发挥的作用和存在的问题。

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

原文地址

语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场。语言如何塑造我们的社会行为?我们的社会结构又是如何在不断的言语交流中演变的?近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的模拟平台,对这些问题进行了深入探讨。

OpenAI:记忆功能现已对所有 ChatGPT Plus 用户开放

推特地址

记忆功能现已对所有 ChatGPT Plus 用户开放。使用记忆功能很简单:只需开始新的聊天并告诉 ChatGPT 您希望它记住的任何内容。

记忆功能可以在设置中开启或关闭,并且目前在欧洲或韩国不可用。团队、企业版和未来的 GPT 产品将陆续推出。

Phi-3 notebook 发布,Phi 的调优速度提高了 2 倍,且VRAM使用减少了50%

推特地址 模型地址

Phi-3 notebook 发布了!使用 @UnslothAI,相比于 HF+FA2,Phi 的调优速度提高了 2 倍,且 VRAM 使用减少了 50%!

由于采用了滑动窗口注意力机制,不得不对其进行 Mistral 化,并修复了 2048/2047 的 SWA(滑动窗口注意力)错误。还解除了注意力机制与 MLP(多层感知机)的融合,因此 QLoRA 损失有所不同,但 16 位的表现相同。

NVIDIA 与蔚来联合研究:使用张量并行技术进行自动驾驶感知模型训练

原文地址

文章探讨了 NVIDIA 与蔚来合作,利用张量并行技术优化自动驾驶感知模型的 GPU 内存使用。通过分片处理卷积神经网络(CNN)的输入和中间激活值,将它们均匀分配到多个 GPU 上,显著降低了对单个 GPU 的内存占用。

此外,文章详述了在 PyTorch 2.0 中使用 DTensor 实现张量并行的细节,包括模型参数和优化器状态的处理方式,以及卷积操作中必要的数据交换和通信。这种方法不仅提高了 GPU 的利用率,还允许使用更深的模型和更高的分辨率输入,从而提升自动驾驶感知模型的精度和训练效率。

产品投资

「星元AI」获数千万天使轮投资

近日,星元先创网络有限责任公司旗下产品「星元AI」完成了数千万的天使轮融资,此次成功融资为星元先创的发展注入新的活力,本轮资金将重点投向星元先创旗下系统升级和市场推广,为广大服务商提供更多机会。

对于星元先创而言,意味着有望将领先的数字化营销系统和人工智能领域的成就在现有基础上再上新台阶,增强核心竞争力,迅速扩大新兴市场的市场份额;合作也标志着星元先创进一步强化“人工智能+营销系统”的战略,星元先创将加速产品升级和业务全国布局。

微软宣布在印尼的云计算和 AI 领域投资 17 亿美元

官方报道

微软计划在接下来的四年内在印尼投资17亿美元,用于新的云计算和人工智能(AI)基础设施,以及为84万人提供AI技能培训,并支持该国日益增长的开发者社区。这是微软在印尼29年历史中的最大单笔投资。此举旨在帮助实现印尼政府的“2045年黄金印尼愿景”,该愿景旨在将印尼转变为全球经济强国。


我的本博客原地址:https://ntopic.cn/p/ai20240501


微信公众号:Python禅师

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/318940.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信息泄露.

一,遍历目录 目录遍历:没有过滤目录相关的跳转符号(例如:../),我们可以利用这个目录找到服务器中的每一个文件,也就是遍历。 tipe:依次点击文件就可以找到flag 二,phpi…

LNMP部署及应用(Linux+Nginx+MySQL+PHP)

LNMP 我们为什么采用LNMP这种架构? 采用Linux、PHP、MySQL的优点我们不必多说。 Nginx是一个小巧而高效的Linux下的Web服务器软件,是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,已经在一些俄罗斯的大型网站上运行多年,目…

服务器被攻击,为什么后台任务管理器无法打开?

在服务器遭受DDoS攻击后,当后台任务管理器由于系统资源耗尽无法打开时,管理员需要依赖间接手段来进行攻击类型的判断和解决措施的实施。由于涉及真实代码可能涉及到敏感操作,这里将以概念性伪代码和示例指令的方式来说明。 判断攻击类型 步…

18、ESP32 ESP-NOW 点对点通信

ESP-NOW 是乐鑫自主研发的无连接通信协议,具有短数据包传输功能。该协议使多个设备能够以简单的方式相互通信。 ESP-NOW 功能 ESP-NOW 支持以下功能: 加密和未加密的单播通信;混合加密和未加密的对等设备;最多可携带 250 字节 的有效载荷;发送回调功能…

Python | Leetcode Python题解之第66题加一

题目: 题解: class Solution:def plusOne(self, digits: List[int]) -> List[int]:n len(digits)for i in range(n - 1, -1, -1):if digits[i] ! 9:digits[i] 1for j in range(i 1, n):digits[j] 0return digits# digits 中所有的元素均为 9retu…

阿里云API网关 产品的使用笔记

阿里云的产品虽多,还是一如既往的一用一个看不懂,该模块的文档依旧保持“稳定”发挥,磕了半天才全部跑通。 用阿里云API网关的原因是,在Agent中写插件调用API的时候,需要使用Https协议,又嫌搞备案、证书等事…

ASV1000视频监控平台:通过SDK接入海康网络摄像机IPC

目录 一、为何要通过SDK接入海康网络摄像机 (一)海康网络摄像机的SDK的功能 1、视频采集和显示 2、视频存储 3、视频回放 4、报警事件处理 5、PTZ控制 6、自定义设置 7、扩展功能 (二)通过SDK接入的好处(相对…

ARP欺骗使局域网内设备断网

一、实验准备 kali系统:可使用虚拟机软件模拟 kali虚拟机镜像链接:https://www.kali.org/get-kali/#kali-virtual-machines 注意虚拟机网络适配器采用桥接模式 局域网内存在指定断网的设备 二、实验步骤 打开kali系统命令行:ctrlaltt可快…

nginx--配置文件

组成 主配置文件:nginx.conf 子配置文件:include conf.d/*.conf 协议相关的配置文件:fastcgi uwsgi scgi等 mime.types:⽀持的mime类型,MIME(Multipurpose Internet Mail Extensions)多用途互联⽹网邮件扩展类型&…

Linux服务器常用命令总结

view查找日志关键词 注意日志级别,回车后等一会儿,因为文件可能比较大加载完需要时间 当内容显示出来后,使用“/关键词”搜索 回车就能搜到,n表示查找下一个,N表示查找上一个 find 查找 find Family -name book …

CBCGPStatic 显示图片

初始化代码: // 1、 m_DataPic.SetPicture(IDB_BITMAP1, TRUE, TRUE); //2、 CString strPath L"C:\\Users\\14713\\Desktop\\Example\\Example\\res\\pic.png"; m_DataPic.SetPicture(strPath, TRUE, TRUE); 资源中: / // //…

MVP+敏捷开发

MVP敏捷开发 1. 什么是敏捷开发? 敏捷开发是一种软件开发方法论,旨在通过迭代、自组织的团队和持续反馈,快速响应需求变化并交付高质量的软件。相较于传统的瀑布模型,敏捷开发强调灵活性、适应性和与客户的紧密合作。敏捷开发方…

深入 Django 模型层:数据库设计与 ORM 实践指南

title: 深入 Django 模型层:数据库设计与 ORM 实践指南 date: 2024/5/3 18:25:33 updated: 2024/5/3 18:25:33 categories: 后端开发 tags: Django ORM模型设计数据库关系性能优化数据安全查询操作模型继承 第一章:引言 Django是一个基于Python的开源…

chrome和drive安装包路径

Chrome for Testing availability (googlechromelabs.github.io) 下载Stable下面的包哈

如何低成本创建个人网站?

目录 前言 网站源代码 虚拟主机或服务器 域名注册或免费二级域名 域名解析 上传源代码压缩包 添加刚刚的域名 成功搭建 失败的解决方案 结语 前言 很多小白都非常想拥有自己的网站,但很多人虽然有了自己的源代码但苦于不知道怎么将其变成所有人都能够访…

深度学习中损失函数和激活函数的选择

文章目录 前言 你需要解决什么问题? 你想预测数值吗? 你想预测分类结果吗? 回归:预测数值 分类:预测二元结果 分类:从多个类别中预测单个标签 分类:从多个类别中预测多个标签 总结表 前言 本篇…

使用Neo4j和Langchain创建知识图谱

使用Neo4j和Langchain创建知识图谱 知识图谱是组织和整合信息的强大工具。通过使用实体作为节点和关系作为边缘,它们提供了一种系统的知识表示方法。这种有条理的表示有利于简化查询、分析和推理,使知识图在搜索引擎、推荐系统、自然语言处理和人工智能…

SpringBoot文件上传+拦截器

1、resource static下有个图片,希望浏览器可以查看这个图片 访问: 若yml设置路径,则可以定义在static下才可以访问 classpath代表类路径,都在target下 也就是项目在运行后的resource下的文件都会到classes下去 无需在target下创…

设计模式之业务代表模式

在编程江湖的风雨中漂泊多年,每当我遇到那些错综复杂的业务逻辑和系统交互,总有一个模式像一位忠诚的骑士,默默守护着我的代码城堡,那就是——业务代表模式(Business Delegate Pattern)。它不是最耀眼的明星…

Spark Structured Streaming 分流或双写多表 / 多数据源(Multi Sinks / Writes)

博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,…