KDD 2023 获奖论文公布,港中文、港科大等获最佳论文奖

ACM SIGKDD(国际数据挖掘与知识发现大会,KDD)是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,也是首个引入大数据、数据科学、预测分析、众包等概念的会议。

今年,第29届 KDD 大会于上周在美国加州长滩圆满结束,大会包含研究方向(Research)和应用数据科学方向(Applied Data Science,ADS)两个 track,共公布了8篇获奖论文。

KDD最佳论文奖

研究方向

All in One: Multi-task Prompting for Graph Neural Networks

标题:All in One: 多任务提示用于图神经网络

作者:Xiangguo Sun, Hong Cheng, Jia Li, Bo Liu, Jihong Guan

内容:受自然语言处理(NLP)中提示学习的启发,提示学习在利用先验知识进行各种NLP任务方面展示了显著的有效性,我们研究图形提示的主题,目的是填补预训练模型和各种图形任务之间的差距。

在本文中,作者为图形模型提出了一种新的多任务提示方法。具体来说,首先使用提示词、词汇结构和插入模式统一了图形提示和语言提示的格式。通过这种方式,NLP中的提示想法可以无缝地引入图形领域。然后,为了进一步缩小各种图形任务与最先进的预训练策略之间的差距,作者进一步研究了各种图形应用的任务空间,并将下游问题重构为图形级任务。之后,作者引入元学习来有效地学习图形多任务提示的更好初始化。以便提示框架对不同的任务更可靠和通用。经实验,结果证明了该方法的优越性。

应用数据科学方向

Improving Training Stability for Multitask Ranking Models in Recommender Systems

标题:改进推荐系统中多任务排序模型的训练稳定性

作者:Jiaxi Tang, Yoel Drori, Daryl Chang, Maheswaran Sathiamoorthy, Justin Gilmer, Li Wei, Xinyang Yi, Lichan Hong, Ed H. Chi

内容:在本文中,作者分享了对改进YouTube推荐的真实世界多任务排序模型训练稳定性方面的发现和最佳实践,展示了导致模型训练不稳定的一些特性,并猜测原因。此外,根据作者对训练不稳定点附近的训练动态的观察,作者推测为什么现有的解决方案会失败,并提出了一种新的算法来缓解现有解决方案的局限性。在YouTube生产数据集上的实验表明,与几种常用的基线方法相比,所提出的算法可以显着改善训练稳定性而不损害收敛性。

KDD最佳学生论文奖

研究方向

Feature-based Learning for Diverse and Privacy-Preserving Counterfactual Explanations

标题:基于特征的学习方法用于生成多样且保护隐私的反事实解释

作者:Vy Vo, Trung Le, Van Nguyen, He Zhao, Edwin Bonilla, Gholamreza Haffari, Dinh Phung

内容:可解释的机器学习旨在理解长期以来因缺乏可解释性而臭名昭著的复杂黑盒系统的推理过程。一种繁荣的方法是通过反事实解释,它提供了建议,告诉用户可以做些什么来改变结果。反事实示例不仅必须反驳黑盒分类器的原始预测,还应满足实际应用的各种约束。多样性是讨论较少的关键约束之一,虽然多样的反事实解释是理想的,但同时满足一些其他约束在计算上具有挑战性。

此外,针对发布的反事实数据的隐私问题日益受到关注。为此,作者提出了一个基于特征的学习框架,可以有效处理反事实约束,并为有限的私密解释模型池贡献自身。作者展示了该方法在生成具有可行性和合理性的多样反事实解释方面的灵活性和有效性。与同等容量的对应部分相比,作者的反事实引擎更高效,而重新识别风险也最低。

KDD时间检验奖

研究方向

Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms

标题:Auto-WEKA: 分类算法的组合选择和超参数优化

作者:Chris Thornton ,Frank Hutter, Holger H. Hoos, Kevin Leyton-Brown

内容:存在许多不同的机器学习算法,考虑到每个算法的超参数,总体上有令人难以置信的大量可能的替代方案。作者考虑同时选择学习算法并设置其超参数的问题,这超越了以前仅单独解决这些问题的工作。作者表明这个问题可以通过一个完全自动化的方法来解决,利用贝叶斯优化的最新创新。

具体而言,作者考虑了广泛的特征选择技术(组合3种搜索方法和8种评估方法)以及WEKA中实现的所有分类方法,跨越2种集成方法、10种元方法、27种基本分类器以及每个分类器的超参数设置。在来自UCI仓库、KDD Cup 09、MNIST数据集的变体和CIFAR-10的21个流行数据集上,作者展示的分类性能通常比使用标准选择/超参数优化方法好很多。

应用数据科学方向

Ad Click Prediction: A View From the Trenches

标题:广告点击预测:来自第一线的视角

作者:Hugh Brendan McMahan, Gary Holt, David Sculley, Michael Young, Dietmar Ebner, Julian Grady, Lan Nie, Todd Phillips, Eugene Davydov, Daniel Golovin, Sharat Chikkerur, Dan Liu, Martin Wattenberg, Arnar Mar Hrafnkelsson, Tom Boulos, Jeremy Kubica

内容:预测广告点击率(CTR)是在数十亿美元的在线广告业中处于核心地位的大规模学习问题。作者介绍了一些案例研究和话题,这些内容来自部署的CTR预测系统的最近实验。这包括在传统监督学习框架下的改进,该框架基于FTRL-Proximal在线学习算法(具有出色的稀疏性和收敛特性)以及每坐标学习率。

作者还探讨了一些在实际系统中出现但乍一看似乎不在传统机器学习研究领域内的挑战。这包括用于内存节省的有用技巧、评估和可视化性能的方法、为预测概率提供置信度估计的实际方法、校准方法以及自动管理特征的方法。本文的目标是强调理论进步与该工业环境下的实际工程之间的密切关系,并展示将传统机器学习方法应用于复杂动态系统时出现的深层挑战。

​杰出论文奖

On the Predictive Power of Graph Neural Networks

标题:关于图神经网络的预测能力

作者:Weihua Hu

内容:在本论文中,作者旨在通过理解、改进和基准测试GNNs的预测能力来构建强大的预测性GNNs,预测能力指GNNs进行准确预测的能力。本文由三个部分组成。在第I部分中,作者为理解GNNs的预测能力开发了一个理论框架。具体关注表达能力,询问GNNs是否可以表达期望的图函数。作者使用理论框架为给定GNN是否足够强大提供洞见,以对数据中的地面真值目标函数建模。

作者还提出了一个可以证明对图的大多数函数建模的最大表达能力GNN模型。在配备了设计表达能力强的GNN模型的框架之后,在第II部分中,作者继续提高它们在未见/未标记的数据上的预测能力,即提高GNNs的泛化能力。出于实际应用的考虑,作者在两个常见的有限数据场景下开发了提高GNN泛化能力的方法:有限标签数据和有限边连接性。最后,在第III部分中,作者创建了新的图基准数据集,以解决现有基准的问题,并促进社区提高GNN的预测能力。

杰出论文奖(亚军)

Characterization and Detection of Disinformation Spreading in Online Social Networks

标题:在线社交网络中虚假信息传播的特征和检测

作者:Francesco Pierri

内容:在这项工作中,作者利用网络和计算机科学方法来解决在线社交网络中虚假信息传播的问题。关注Twitter和Facebook,研究在政治选举和新冠疫情等相关事件期间,虚假信息和其他恶意内容传播所涉及的机制和参与者,因为公众此时对可靠信息的需求更高。作者对主流和传统新闻网站发布的可靠信息与反复被曝光传播虚假信息、误导信息、恶作剧、假新闻和极端宣传的网站传播的不可靠信息进行了系统性比较。

作者建立了一个回归模型,考虑了人口统计学、社会经济和政治因素,发现在线虚假信息与疫苗结果之间存在显著关联。最后,基于上述分析的结果,作者部署了一种方法来准确分类Twitter上用户自然交互的新闻文章。按照用户根据分享内容塑造不同传播模式的直觉,训练和测试现成的机器学习分类器,可以对新闻文章的真实性进行分类,而无需查看其内容。

Efficient and Secure Message Passing for Machine Learning

标题:机器学习的高效和安全的消息传递

作者:Xiaorui Liu

内容:机器学习(ML)技术给人类社会带来了革命性影响,未来它们也将继续作为技术创新者发挥作用。为了扩大其影响,迫切需要解决机器学习中出现的新兴和关键挑战,如效率和安全问题。

本论文的主要目标是通过创新研究和原理方法找出解决这些挑战的解决方案。特别是,作者提出了多种具有高效消息传递的分布式优化算法,以缓解通信瓶颈并加速分布式ML系统中的ML模型训练。作者还提出了多种安全消息传递方案作为图神经网络的构建模块,旨在显着提高ML模型的安全性和鲁棒性。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“KDD”获取全部获奖论文+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/93882.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言刷题指南(一)

📙作者简介: 清水加冰,目前大二在读,正在学习C/C、Python、操作系统、数据库等。 📘相关专栏:C语言初阶、C语言进阶、数据结构刷题训练营、有感兴趣的可以看一看。 欢迎点赞 👍 收藏 ⭐留言 &am…

网络层协议

网络层协议 IP协议基本概念协议头格式网段划分特殊的IP地址IP地址的数量限制私有IP地址和公网IP地址路由IP协议头格式后续 在复杂的网络环境中确定一个合适的路径 IP协议 承接上文,TCP协议并不会直接将数据传递给对方,而是交付给下一层协议,…

Python爬虫——scrapy_工作原理

引擎向spiders要url引擎把将要爬取的url给调度器调度器会将url生成的请求对象放入到指定的队列中从队列中出队一个请求引擎将请求交给下载器进行处理下载器发送请求获取互联网数据下载器将数据返回给引擎引擎将数据再次给到spidersspiders通过xpath解析该数据,得到数…

java-JVM内存区域JVM运行时内存

一. JVM 内存区域 JVM 内存区域主要分为线程私有区域【程序计数器、虚拟机栈、本地方法区】、线程共享区域【JAVA 堆、方法区】、直接内存。线程私有数据区域生命周期与线程相同, 依赖用户线程的启动/结束 而 创建/销毁(在 HotspotVM 内, 每个线程都与操作系统的本地线程直接映…

十七、地物识别

描述了使用2D卷积神经网络图像识别的全过程。下载和安装标注工具,对图像进行标注,生成标注后的图像。然后对数据进行增强,划分训练集和测试集。最后通过神经网络建立分类模型,对现有图片进行分类应用。 1、Labelme工具 Labelme工具是语义分割标注工具,在地物类型或建…

深入了解 Postman Test 校验的使用方法

Postman 是一个广泛使用的 API 开发工具,它允许开发人员测试 API 的各个方面,包括请求、响应、身份验证等等,其中最常用的功能之一就是 Test 校验。那今天就一起来看看 Postman 的 Test 校验该如何使用。 Test 校验是什么? Test…

【2024】MySQL中常用函数和窗口函数的基本使用方式

MySQL中常用函数和窗口函数的基本使用方式 一、基础函数1、聚合函数:2、字符串函数:3、日期和时间函数4、数值函数5、条件函数 二、窗口函数(*OVER*) 一、基础函数 1、聚合函数: SELECT COUNT(*) FROM table_name;:计算表中的行…

PO、BO、VO、DTO、DAO、POJO

文章目录 PO(Persistant Object)持久对象DO(Data Object)数据对象AO(Application Object)应用对象BO(Business Object)业务对象VO(Value Object)表现对象DTO&…

latex 笔记:cs论文需要的排版格式

主要针对英文文献 1 基本环境 连字符 不同长度的"-"表示不同含义。 一个"-"长度的连字符用于词中两个"-"长度的连字符常用于制定范围三个"-"长度的连字符是破折号数学中的负数要用数学环境下的-得到 强调 在正式文章中, 通常不…

MySQL— 基础语法大全及操作演示!!!(下)

MySQL—— 基础语法大全及操作演示(下)—— 持续更新 三、函数3.1 字符串函数3.2 数值函数3.3 日期函数3.4 流程函数 四、约束4.1 概述4.2 约束演示4.3 外键约束4.3.1 介绍4.3.2 语法4.3.3 删除/更新行为 五、多表查询5.1 多表关系5.1.1 一对多5.1.2 多对…

【数据结构系列】链表

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

SwiftUI 动画进阶:实现行星绕圆周轨道运动

0. 概览 SwiftUI 动画对于优秀 App 可以说是布帛菽粟。利用美妙的动画我们不仅可以活跃界面元素,更可以单独打造出一整套生动有机的世界,激活无限可能。 如上图所示,我们用动画粗略实现了一个小太阳系:8大行星围绕太阳旋转,而卫星们围绕各个行星旋转。 在本篇博文中,您将…

CSDN编程题-每日一练(2023-08-17)

CSDN编程题-每日一练(2023-08-17) 一、题目名称:计算公式二、题目名称:计算逆波兰表达式的结果三、题目名称:争抢糖豆 一、题目名称:计算公式 时间限制:1000ms内存限制:256M 题目描述…

Linux MQTT智能家居(温度,湿度,环境监测,摄像头等界面布局设置)

文章目录 前言一、温度湿度曲线布局二、环境监测界面布局三、摄像头界面布局总结 前言 本篇文章来完成另外三个界面的布局设置。 这里会使用到 feiyangqingyun的一些控件库。 一、温度湿度曲线布局 TempHumtiy.h: #ifndef TEMPHUMTIY_H #define TEMPHUMTIY_H#include <…

第十三课:QtCmd 命令行终端应用程序开发

功能描述&#xff1a;开发一个类似于 Windows 命令行提示符或 Linux 命令行终端的应用程序 一、最终演示效果 QtCmd 不是因为它是 Qt 的组件&#xff0c;而是采用 Qt 开发了一个类似 Windows 命令提示符或者 Linux 命令行终端的应用程序&#xff0c;故取名为 QtCmd。 上述演示…

船舶法兰盘法兰管件3D扫描尺寸测量|三维扫描检测|CAV测量-CASAIM

第一章 服务背景 船舶建造多采用分段建造法&#xff0c;即将零件、预装好的部件在胎架上组合焊接成分段或总段&#xff0c;然后由船台装配成整船的建造方法。而当船体合拢组装时&#xff0c;在船体上遍布着各种各样的管道&#xff0c;这些管道都需要互相完全适配以确保船体安装…

基于SSM的超市管理系统

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容&#xff1a;毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 项目介绍…

分类预测 | MATLAB实现GAPSO-LSSVM多输入分类预测

分类预测 | MATLAB实现GAPSO-LSSVM多输入分类预测 目录 分类预测 | MATLAB实现GAPSO-LSSVM多输入分类预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.分类预测 | MATLAB实现GAPSO-LSSVM多输入分类预测 2.代码说明&#xff1a;要求于Matlab 2021版及以上版本。 程序…

插槽Slot的作用和基本使用;具名插槽的使用;作用域插槽Slot使用;全局事件总线使用;依赖注入Provide/Inject

目录 1_插槽Slot的作用1.1_认识插槽Slot1.2_如何使用插槽slot1.3_插槽的默认内容1.4_多个插槽的效果 2_插槽Slot基本使用3_具名插槽的使用4_作用域插槽Slot使用4.1_渲染作用域4.2_认识作用域插槽4.3_独占默认插槽的缩写 5_全局事件总线使用5.1_全局事件总线mitt库5.2_使用事件总…

C++QT教程3——手册4.11.1自带教程(笔记)——创建一个基于Qt Widget的应用程序

文章目录 创建一个基于Qt Widget的应用程序创建Text Finder项目素材文件 填补缺失的部分设计用户界面完成头文件完成源文件创建资源文件 编译和运行程序 参考文章 创建一个基于Qt Widget的应用程序 本教程介绍如何使用Qt Creator创建一个小型Qt应用程序&#xff0c;名为Text F…