一文了解机器学习顶会ICML 2024的研究热点

    对人工智能研究领域前沿方向的跟踪是提高科研能力和制定科研战略的关键。本文通过图文并茂的方式介绍了ICML 2024的研究热点,帮助读者了解和跟踪机器学习和人工智能的前沿研究方向。本推文的作者是许东舟,审校为邱雪和黄星宇。

1  会议介绍

    ICML(International Conference on Machine Learning,国际机器学习会议)创办于1980年,由国际机器学习协会主办,每年举办一次。作为人工智能(Artificial Intelligence, AI)和机器学习领域中最具有影响力的会议之一,它的讨论主题领域广泛,列举如下。

(1)通用机器学习:包括主动学习、聚类、在线学习、排名、强化学习、监督学习、半监督学习和自监督学习、时间序列分析等。

(2)深度学习:架构、生成模型、深度强化学习等。

(3)学习理论:博弈论、统计学习理论等。

(4)优化:凸优化和非凸优化、矩阵/张量方法、随机优化、在线优化、非光滑优化、复合优化等。

(5)概率推理:贝叶斯方法、图形模型、蒙特卡洛方法等。

(6)可信机器学习:问责制、因果关系、公平性、隐私性、稳健性等。

(7)应用:计算生物学、众包、医疗保健、神经科学、社会公益、气候科学等。

2  ICML 2024 

    第41届机器学习国际会议(ICML 2024)于7月21日至27日在奥地利维也纳召开,以线上线下结合的方式举行。除了主要的会议环节,还包括展览会、Tutorials和Workshops。

    本次会议共接收了近一万篇论文,其中有2609篇被录用,录用率约为27%。与去年相比,论文的提交和录用数量均有显著增长,但录用率有略微下降。这一趋势说明AI顶级会议的影响力正在持续扩大,同时竞争的激烈程度也在不断增加。ICML近五年的录用情况如表1所示。

表1 ICML 近五年录用情况

会议的官方主页2024 Conferenceicon-default.png?t=N7T8https://icml.cc/

3  热点分析

    表2列出了在本次会议中,被录用的2609篇论文标题中的20个高频主题词。

表2 录用论文标题中出现的高频主题词

    随着GPT-4在2023年受到各界的广泛关注,以及视频生成模型Sora在今年初爆红出圈,生成式模型已经成为了AI领域中最受瞩目的热点之一,这一趋势也在各大顶级学术会议和期刊中得以体现。例如,表2中,语言模型(Language Model大语言模型(Large Language Model的出现次数分别高达221次和117次。还有近期凭借强大的文生图、文生视频能力,热度一直居高不下的扩散模型(Diffusion Model也出现了 65次。

    值得注意的是,尽管近期出现了一些宣称全面超越Transformer的模型(实际效果仍需进一步验证),但从目前来看,Transformer依然是AI领域中最主流的模型之一,在统计中出现了110次。

     对模型性能的优化也是本次会议中的热门研究方向,比如优化(Optimization)强化学习(Reinforcement Learning)高效(Efficient)自适应(Adaptive)等关键词分别出现了14314112762次。这些技术不仅提升了模型的运算效率、降低了对训练及存储的需求,同时还在自动驾驶、智能机器人等领域中展示出了巨大的价值。此外,智能体(Agent)和多模态(Multimodal / Multi-modal)作为具有广阔应用前景的研究方向,在本次会议的论文标题中也分别被提及了59次和41次。

4  大语言模型研究热点

图1 大语言模型研究热点

    图1展示了基于ICML 2024大语言模型研究热点生成的词云图,涵盖高效(Efficient)安全性(Safty)多模态(Multimodal)智能体(Agent)等研究领域,与本次会议的热点方向较为契合。下面是对大语言模型研究热点的详细介绍:

     随着大模型参数规模的不断扩大,计算成本、能耗和推理效率成为了目前最大的挑战,如何在保证模型性能的同时提高效率是研究的重点。因此,高效和优化(Optimization)是本次会议中大语言模型最受关注的研究方向之一。

     安全性是另一个关键研究主题,这主要是因为大语言模型的内部机制复杂,并且决策过程不透明。确保它们的行为符合人类意图,从而避免造成潜在风险至关重要。图1中的可解释性(Interpretability)、幻觉(Hallucination)、基于人类反馈的强化学习(RLHF)等主题也都与安全性密切相关。

     推理(Inference/ Reasoning)是大语言模型在处理推理任务时的核心能力。其中Inference侧重于从已知信息中推导结论,如因果推理和逻辑推理等;Reasoning则更注重如何处理多个信息之间的联系,并通过逻辑推理一步步得出结论。例如思维链(Chain-of-Thought)这类技术就是通过明确分步推理来提升模型在复杂问题上的表现。

    评估(Evaluation)贯穿整个模型的开发流程,是衡量模型性能和改进效果的关键环节。随着模型和任务复杂度的不断增加,合理设置针对多模态生成和跨领域任务的评估标准,不仅是当前大语言模型研究的难点,同时也是重点。

    此外,数据生成(Data Generation)、文本检测(Text Detection)以及大语言模型在医学(healthcare  LLM)、数学(Math LLM)、时间序列预测(Time Series Forecasting)、电子商务(E-commerce)等领域的应用,也展示了大语言模型在广泛领域中的巨大应用潜力。

5  最佳论文

    表3总结了ICML 2024的10篇最佳论文,研究方向涵盖了大语言模型、扩散模型、隐私安全和模型优化等多个领域。

    其中,大语言模型和扩散模型是最佳论文中的热门研究领域,与其相关的论文在10篇中占到了6成(表3中以下划线标出)。反映了当前AI领域中最前沿的进展。例如,多模态视频生成模型VideoPoet能够通过结合图像、文本和音频的输入,生成高保真视频内容,实现零样本视频生成;而Stable Diffusion 3则优化了图像合成的扩散流程,以生成高分辨率图像的生成。

表3 ICML 2024最佳论文

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/410471.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

运放阻抗和噪声(同相放大器的输入/输出阻抗 + 电压跟随器阻抗 + 噪声 +信噪比)

2024-8-27,星期一,21:03,天气:阴雨,心情:晴。培训终于结束啦,开始轮岗了,看了两天PPT,加油加油,继续学习。 今天继续学习第六章运算放大器,主要学…

一文带你从零到实战,学会gcc和Makefile,多文件编译神器的使用与编写

目录: 目录: 一、什么是Makefile 1.1 makefile的作用: 1.2 makefile的基本组成: 二、Linux编译过程: 2.1 linux编译过程: 2.1.1 预处理(Preprocessing) 2.1.2 编译(Compilation&am…

Android Studio 自定义字体大小

常用编程软件自定义字体大全首页 文章目录 前言具体操作1. 打开设置对话框2. 选择外观字体 前言 Android Studio 自定义字体大小,统一设置为 JetBrains Mono ,大小为 14 具体操作 【File】>【Settings...】>【Appearance & Behavior】>【…

二、设置地图配置表

一、导入一个背景图 由于背景图比较大,需要缩小至0.73 二、写配置文件(SO) 使用List需要一个命名空间 写一个类,声明房间的出现数量和种类;将它实例化出来 三、枚举变量的多选 在枚举变量中标记命名空间&#xff…

docker 多线成服务,比如gunicorn服务启动报错解决办法

docker执行的时候报错,排查是线程创建权限不足导致的,报错如下。 解决办法 docker run -e OPENBLAS_NUM_THREADS1 your_image

Unity XR Interaction Toolkit 踩坑记录

1:按下 grap/select 键 物品直接飞到手上 2 按下 grap/select 键 物品一点点的想自己移动

OpenCV杂项图像变换(2)线性混合函数blendLinear()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 执行两个图像的线性混合: dst ( i , j ) weights1 ( i , j ) ∗ src1 ( i , j ) weights2 ( i , j ) ∗ src2 ( i , j ) \texttt{…

关于多线程你了解多少?

或许是执念太重,又或许是性格缺陷,我对java中一些知识的坚持,已经到了让人无法接受的地步。有些人甚至因此在背后骂我神经病、傻瓜。但我依旧我行我素,即使中间懈怠了很长时间,重新开始时我依旧会以这些知识为起点。不…

Ubuntu上搭建Nginx环境

1. 软件包下载 nginx下载地址 下载linux版本的nginx,如图圈示 2. 将下载好的软件包上传至Linux服务器 假设上传到 /opt/nginx 目录,进入目录 cd /opt/nginx解压,根据版本自行修改版本号 tar zxvf nginx-1.16.0.tar.gz3.安装 安装编译所需的依赖&a…

前端算法 === 力扣 111 二叉树的最小深度

目录 问题描述 DFS(深度优先搜索)方案 BFS(广度优先搜索)方案 总结 力扣(LeetCode)上的题目111是关于二叉树的最小深度问题。这个问题可以通过深度优先搜索(DFS)和广度优先搜索&…

QJson的写入和解析基本操作

一、QJson简介 QJson 是一个用于处理 JSON(JavaScript Object Notation)数据的 C 库 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式 JSON 的语法简洁明了,使用人类可读的文本格式来表示数据 它由键值…

分块矩阵的转置

证明 则 证明:令,有,对它做一个分块使得和后面的分块矩阵中的是同型矩阵,要证明(任意的),需要证明1)是一个的矩阵 2)任意的 首先证明1)我们先定义两个函…

Getting RateLimitError while implementing openai GPT with Python

题意:“在使用 Python 实现 OpenAI GPT 时遇到 RateLimitError 错误。” 问题背景: I have started to implement openai gpt model in python. I have to send a single request in which I am getting RateLimitError. “我开始在 Python 中实现 Ope…

SSH弱口令爆破服务器

一、实验背景 1、概述 使用kali的hydra进行ssh弱口令爆破,获得服务器的用户名和口令,通过 ssh远程登录服务器。 2、实验环境 kali攻击机:192.168.1.107 centos服务器:192.168.1.105 二、前置知识 1、centos设置用户并设置弱…

HR招聘,如何解决面试流程繁琐的问题

要解决面试流程繁琐的问题,就必须要精简和优化招聘流程。比如精简面试环节,制定标准化流程,完善信息管理,对面试环节进行细致梳理之后,尽快识别并去除那些不必要的步骤,这样就能够减少求职者的等待时间&…

IAR软件配置笔记

Project->Optiions->配置Device Debug中配置 C/C Compiler中配置 优化等级 C语法标准选择 回到主界面,Tools->Options 字体调整 Editor更改缩进数 Project->Make编译 调试模式和编辑模式的View菜单栏不一样http://t.csdnimg.cn/JsWjy Disa…

Python | Linux | 解析Himawari-8/9 | Standard Data

写作前面 之前一个相关的工作需要解析Himawari-8/9 Standard Data文件,因为他是二进制的,之前没有处理过,导致完全摸不着头脑。在网上找了中英文搜索找了好久,虽然也找到了公开的解析代码,但是放在自己的数据这感觉总是…

Golang | Leetcode Golang题解之第375题猜数字大小II

题目&#xff1a; 题解&#xff1a; func getMoneyAmount(n int) int {f : make([][]int, n1)for i : range f {f[i] make([]int, n1)}for i : n - 1; i > 1; i-- {for j : i 1; j < n; j {f[i][j] j f[i][j-1]for k : i; k < j; k {cost : k max(f[i][k-1], f[…

字节跳动-生活服务-java后端-一面

基础题 计算机网络 1.tcp三次握手和四次挥手&#xff1f;tcp的第三次握手可以传输应用层数据嘛&#xff1f; 4.1 TCP 三次握手与四次挥手面试题 | 小林coding (xiaolincoding.com) 2.描述一下打开百度首页后发生的网络过程&#xff1f; 计算机网络面试题 | 小林coding (xi…

无损放大图片,盘点5款最新无损放大图片软件

我们常常遇到需要放大图片却又不希望损失画质的尴尬境地。无论是为了打印大幅海报、在线展示高清细节&#xff0c;还是想要修复珍贵的老照片&#xff0c;无损放大图片成为了许多人的迫切需求。下面给大家分享5款最新无损放大图片软件&#xff0c;高效且实用&#xff0c;一起来学…