ICLR 2025|DAMO开发者矩阵合作专场

点击蓝字

113e089ae27213ebb57b46611f71dda8.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

AITIME

01

ICLR 2025预讲会合作专场

13ac6bad9677898b433a8edc22d0c5ea.jpeg

AITIME

02

专场信息

01

Dynamic Diffusion Transformer

讲者:赵望博,达摩院研究型实习生

时间:3月12日 19:00-19:15

报告简介:

Diffusion Transformer(简称DiT)是一种新兴的用于图像生成的扩散模型,虽然在性能上表现出色,但却面临着巨大的计算成本。我们的研究发现,这些计算成本主要来源于静态推理范式,该范式不可避免地在某些扩散时间步和空间区域引入了冗余计算。为了解决这一低效问题,我们提出了动态扩散Transformer(Dynamic Diffusion Transformer,简称DyDiT),这是一种在生成过程中可以沿时间步和空间维度动态调整计算的架构。

我们引入了时间步动态宽度(Timestep-wise Dynamic Width,简称TDW)方法,该方法根据生成的时间步动态调整模型的宽度。此外,我们设计了空间动态Token(Spatial-wise Dynamic Token,简称SDT)策略,以避免在不必要的空间位置进行冗余计算。针对多个数据集和不同规模的模型进行的大量实验验证了DyDiT的优越性。值得注意的是,仅需增加不到3%的微调迭代次数,我们的方法将DiT-XL的FLOPs减少了51%,生成速度加快了1.73倍,并在ImageNet上实现了竞争性的FID分数2.07。

02

LongPO: Long Context Self-Evolution of Large Language Models through Short-to-Long Preference Optimization

讲者:陈官正,达摩院研究型实习生

时间:3月12日 19:15-19:30

报告简介:

我们提出了Short2Long Preference Optimization (LongPO),一种LLM长文本对齐的新方法,能使得LLM在没有外部监督的情况下,基于偏好优化(Preference Optimization )的思想利用自身良好的短文本能力去指导其在长文本能力上的不足,从而实现LLM由短到长的自我进化。实验结果表明,LongPO能让LLM仅在自我生成的数据上进化到支持128K以上的上下文长度,在长文本基准上取得良好性能,并始终保持短文本和指令跟随能力不下降。

03

InversionGNN: A Dual Path Network for Multi-Property Molecular Optimization

讲者:牛逸凡,香港科技大学(广州)博士生

时间:3月12日 19:30-19:45

报告简介:

探索化学空间以找到同时满足多种属性的新分子对于药物发现至关重要。然而,由于化学性质的冲突或关联性,现有方法往往难以权衡多种属性。本文引入了 InversionGNN 框架,一种有效且样本效率高的双路径图神经网络 (GNN),用于多目标药物发现。为了解码反演路径 (Inversion Path) 中多种属性的复杂化学知识,我们提出了一种基于梯度的帕累托搜索方法来平衡冲突属性并生成帕累托最优分子。

此外,InversionGNN 能够在离散化学空间中近似搜索整个帕累托前沿。实验表明,InversionGNN 在包括药物发现在内的各种离散多目标优化任务中都是有效且高效的。

04

CirT: Global Subseasonal-to-Seasonal Forecasting with Geometry-inspired Transformer

讲者:刘阳,香港科技大学博士生

时间:3月12日 19:45-20:00

报告简介:

次季节性-季节性预报对农业和灾害防控至关重要,但因大气混沌性和传统数值模型的高计算偏差而极具挑战。现有数据驱动模型多将球面经纬网格视为平面图像处理,导致几何失真与空间关系建模偏差。本文通过引入球面几何归纳偏置, 将纬线均匀分割为等距圆形区块, 利用傅里叶变换提取纬向周期信号,显式建模球面周期性。实验表明,该方法在精度和效率上优于主流数值模型与数据驱动方法。


05

GraphArena: Evaluating and Exploring Large Language Models on Graph Computation

讲者:张启凡,香港科技大学(广州)博士生

时间:3月12日 20:00-20:15

报告简介:

大规模语言模型(LLMs)的“军备竞赛”需要新的基准来检验它们的进展。本文引入了GraphArena,一个用于评估LLMs在真实世界图计算问题上的表现的基准工具。它提供了四个多项式时间任务(例如,最短距离)和六个NP完全任务(例如,旅行商问题)。GraphArena具备严格的评估框架,将LLM的输出分类为正确、次优(可行但不最优)、幻觉(格式正确但不可行)或缺失。对超过10种LLM的评估表明,即使是表现最好的LLM,在处理更大、更复杂的图问题时也会遇到困难,并表现出幻觉问题。我们进一步探讨了四种潜在的解决方案,以改善LLMs在图计算上的表现,包括链式思维提示(chain-of-thought prompting)、指令微调(instruction tuning)、代码生成(code writing)以及扩大测试时的计算规模(scaling test-time compute),每种方法都展现了独特的优势和局限性。


06

MolSpectra: Pre-training 3D Molecular Representation with Multi-modal Energy Spectra

讲者:王亮,达摩院研究型实习生

时间:3月12日 20:15-20:30

报告简介:

建立分子的三维结构与其能量状态之间的关系是学习三维分子表征的有效方法。然而,现有方法基于经典力学建模分子势能函数,忽略了量子力学效应,例如能级结构。这些效应能够准确地描述分子能量,并且可以通过能谱实验进行测量。本文提出利用分子能谱增强三维分子表征预训练的方法MolSpectra,将能级结构知识融入分子表征。我们设计了SpecFormer,通过掩码片段重构对多模态能谱进行编码,并将三维表征和能谱表征进行对齐。实验表明,该预训练方法在下游分子性质预测和动力学建模任务上优于现有方法。

AITIME

03

观看地址

c467eb5f00ca70bce483bc7c76d335ee.jpeg

进入Bilibili直播间观看,

提问有可能会被选中由讲者回答!

AITIME

04

加入群聊

02ea3424a44fddcac3f737472b64d75c.png

添加小助手,发送“ICLR”,

将拉您进“ICLR交流群”!

往期精彩活动推荐

223859d676dc229733e3e9756d2d3081.jpeg

CVPR 2025结果出炉|一作讲者已开启招募,欢迎新老朋友来预讲会相聚!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾700场活动,超800万人次观看。

223edc7f776d980536a4d4ad290adaa4.png

我知道你 

在看

提出观点,表达想法,欢迎 

留言

9975a83b476b8cfc52b9e990e234830d.gif

点击 阅读原文 进入直播间!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32157.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决jsch远程sftp连接报错:Exception:Algorithm negotiation fail

问题背景 今天遇见了使用JSch连接服务器时,报错Exception:Algorithm negotiation fail的问题!研究了半天哇!终于解决啦!把解决方案在这里给大家共享一下子! 问题原因 问题原因在于,JSch所支持的加密算法…

【C++】C++11新特性

目录 列表初始化 左值与右值 左值引用和右值引用 移动构造和移动赋值 类型推导 lambda 捕捉列表 函数对象及绑定 bind函数 包装器 Args参数包 抛异常 列表初始化 在C11中一切皆可用列表初始化。 用法:直接在变量名后面加上初始化列表进行初始化 cl…

FreeBSD下安装npm Node.js的22版本 并简单测试js服务器

FreeBSD下安装Node.js 在FreeBSD下安装Node.js很方便,直接pkg安装即可。 使用pkg install安装npm sudo pkg install npm-node22 Updating FreeBSD repository catalogue... Fetching data.pkg: 100% 7 MiB 2.5MB/s 00:03 Processing entries: 100% FreeB…

云原生可观测性体系:数字世界的神经感知网络

引言:从监控到全景式观测的范式升级 Datadog每日处理百万亿指标,Elastic APM实现万级服务拓扑动态发现。Grafana Loki日志分析延迟降至200ms内,Prometheus单集群支持千万时序存储。Uber通过全链路追踪压缩故障定位时间至秒级,Net…

基于VMware的Ubuntu22.04系统安装和配置以及解决Ubuntu共享文件夹无法实现的问题

一、前期准备 本次安装的虚拟机软件是 VMware Workstation Pro 17 登录跳转到 所有产品 进行下载 ​​​跳转到下载页面​​​ 选择 Windows 产品进行安装 勾选协议同意下载 离线版提供:大家根据自己电脑版本配置进行选择下载 本篇使用的虚拟机版本为 VMware Wor…

线程同步与互斥

目录 资源共享问题 (一)临界资源与临界区 (二)多线程并发访问问题 (三)锁 互斥锁原理 加锁原理 解锁原理 互斥锁相关操作接口 互斥锁封装 死锁 死锁产生的四个必要条件 解决死锁方法 &#xff…

SpringMVC 基本概念与代码示例

1. SpringMVC 简介 SpringMVC 是 Spring 框架中的一个 Web 层框架,基于 MVC(Model-View-Controller) 设计模式,提供了清晰的分层结构,适用于 Web 应用开发 SpringMVC 主要组件 DispatcherServlet(前端控…

Banana Pi OpenWRT One Wifi6 OpenWrt社区官方开源路由器评测

第一款不可破解、开源、版权软件、符合 FCC、CE 和 RoHS 的维修权路由器 OpenWRT项目今年已经20岁了,为了纪念这一时刻,Banana Pi OpenWrt One/AP-24.XY路由器开发系统已经上市。这是OpenWRT团队与硬件公司的第一个联合项目。选择 Banana Pi,…

打造智能钉钉机器人:借助智谱GLM-4-Flash实现高效智能回复(文末附源码)

文章目录 前言一、准备工作(一)钉钉机器人(二)智谱 GLM-4-Flash(三)内网穿透工具 cpolar(四)需要准备的工具和环境 二、钉钉机器人的创建与配置步骤1:创建钉钉机器人步骤…

react基础语法视图层类组件

react基础语法视图层&类组件 MVVM *区别mvc&mvvm 两者的区别: 数据模型去渲染视图。数据层改了,vue自己会监听到帮我们拿最新的数据去渲染视图;构建数据构建视图,数据驱动的思想。这一套是非常相似的。 视图中的内容改变&…

数据结构--【顺序表与链表】笔记

顺序表 template <class T> class arrList :public List<T> //表示 arrList 类以公有继承的方式继承自 List<T> 类 //公有继承意味着 List<T> 类的公共成员在 arrList 类中仍然是公共成员&#xff0c;受保护成员在 arrList 类中仍然是受保护成员。 { …

Docker容器与宿主机目录映射深度解析

哈喽&#xff0c;大家好&#xff0c;我是木头左&#xff01; 一、Docker容器与宿主机目录映射基础原理 在深入了解如何查询 Docker 容器目录在宿主机的映射目录之前&#xff0c;有必要先明晰其背后的基础原理。Docker 容器通过挂载&#xff08;mount&#xff09;机制将宿主机的…

p5.js:模拟 n个彩色小球在一个3D大球体内部弹跳

向 豆包 提问&#xff1a;编写一个 p5.js 脚本&#xff0c;模拟 42 个彩色小球在一个3D大球体内部弹跳。每个小球都应留下一条逐渐消失的轨迹。大球体应缓慢旋转&#xff0c;并显示透明的轮廓线。请确保实现适当的碰撞检测&#xff0c;使小球保持在球体内部。 cd p5-demo copy…

javascript-es6 (六)

编程思想 面向过程 面向过程就是分析出解决问题所需要的步骤&#xff0c;然后用函数把这些步骤一步一步实现&#xff0c;使用的时候再一个一个的依次 调用就可以了 就是按照我们分析好了的步骤&#xff0c;按照步骤解决问题 面向对象 面向对象是把事务分解成为一个个对象&…

Linux第0节:Linux环境的搭建

一、Linux 环境的搭建方式 搭建方式主要有三种&#xff1a; 直接安装在物理机上。但是由于 Linux 桌面使用起来非常不友好&#xff08;不推荐&#xff09;。使用虚拟机软件, 将 Linux 搭建在虚拟机上。但是由于当前的虚拟机软件(如 VMWare 之类的)存在一些 bug , 会导致环境上…

计算机网络:计算机网络的概念

1.计算机网络&#xff1a;由若干个结点和链接这些的链路组成。 2.集线器&#xff08;Hub&#xff09;&#xff1a;可以把多个结点连接起来&#xff0c;组成一个计算机网络。 不能避免数据冲突的情况 3.交换机&#xff08;Switch&#xff09;:可以把多个结点连接起来&#x…

mysql的锁-->一篇读懂所有锁机制

目录 mysql的锁 概述&#xff1a;根据mysql锁的大类型可以分为 我们先来讲一下范围最大的全局锁 使用 为什么要使用全局锁&#xff1f; 使用全局锁进行备份的缺点 表级锁 表锁 1.共享读表锁的语法 2.排斥写表锁 元数据锁 意向锁 什么是意向锁 怎么产生意向锁 意向…

Vue 实现智能检测文字是否溢出,溢出显示省略号,鼠标悬浮显示全部【附封装组件完整代码+详细注释+粘贴即食】

一、场景需求 在项目中&#xff0c;经常会遇到文本内容超出容器的情况。为了提高用户体验&#xff0c;我希望在文字溢出时显示悬浮提示&#xff0c;未溢出时则不显示。 二、效果演示 三、实现原理 DOM宽度对比法&#xff1a;通过比较元素的scrollWidth&#xff08;实际内容宽…

用Deepseek写一个 HTML 和 JavaScript 实现一个简单的飞机游戏

大家好&#xff01;今天我将分享如何使用 HTML 和 JavaScript 编写一个简单的飞机游戏。这个游戏的核心功能包括&#xff1a;控制飞机移动、发射子弹、敌机生成、碰撞检测和得分统计。代码简洁易懂&#xff0c;适合初学者学习和实践。 游戏功能概述 玩家控制&#xff1a;使用键…

《Spring日志整合与注入技术:从入门到精通》

1.Spring与日志框架的整合 1.Spring与日志框架进行整合&#xff0c;日志框架就可以在控制台中&#xff0c;输出Spring框架运行过程中的一些重要的信息。 好处&#xff1a;方便了解Spring框架的运行过程&#xff0c;利于程序的调试。 Spring如何整合日志框架 Spring5.x整合log4j…