分享10篇优秀论文,涉及图神经网络、大模型优化、表格分析

引言

第38届AAAI人工智能年度会议将于2024年2月在加拿大温哥华举行。今天给大家分享十篇AAAI2024论文,主要涉及图神经网络,大模型幻觉、中文书法文字生成、表格数据分析、KGs错误检测、多模态Prompt、思维图生成等。 

论文获取方式,回复:AAAI2024

AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。更多AAAI介绍可以参考这篇文章:一文了解AAAI国际会议--附: 各年论文列表连接

图神经网络微调

图片

https://arxiv.org/pdf/2312.13583.pdf

本文研究解决预训练和微调图神经网络在图挖掘任务中的结构一致性问题。作者发现预训练图与微调图之间的结构差异主要源于生成模式的不一致。为此,本文作者提出了G-TUNING方法,通过调整预训练图神经网络,有效地保持了微调图的生成模式。

图片

通过理论分析证明了存在一组替代图谱基,利用它们的线性组合可以高效地近似微调图的生成模式。在迁移学习实验中,与现有算法相比,G-TUNING在领域内和领域外分别提升了0.5%和2.6%

中文书法字体生成

图片

https://arxiv.org/pdf/2312.10314.pdf

本文研究主要针对少样本中文书法字体生成的问题。本文提出了一种新颖的模型,DeepCalliFont,通过集成双模生成模型实现少样本中文书法字体合成。

图片

具体而言,该模型包括图像合成和序列生成两个分支,通过双模态表示学习策略生成一致的结果。两种模态(即字形图像和书写序列)通过特征重组模块和光栅化损失函数进行合理集成。此外,采用新的预训练策略,通过利用大量的单模态数据来提高性能。定性和定量实验证明了本文方法在少样本中文书法字体生成任务上优于其他最先进的方法。

RAG减少LLM幻觉研究

图片

https://arxiv.org/pdf/2309.01431.pdf

本文研究主要针对检索增强生成(RAG)在缓解大型语言模型(LLMs)产生幻觉方面的问题。现有研究缺乏对检索增强生成对不同大型语言模型的影响进行严格评估,这使得难以确定RAG在不同LLMs能力中的潜在瓶颈。本文系统地调查了检索增强生成对大型语言模型的影响。

图片

本文分析了不同大型语言模型在RAG所需的4个基本能力方面的性能,包括噪声鲁棒性、负例拒绝、信息整合和反事实鲁棒性。为此,本文建立了检索增强生成基准(RGB),这是一个用于在英语和中文中评估RAG的新语料库。RGB根据解决案例所需的上述基本能力将基准中的实例划分为4个独立的测试集。然后,我们在RGB上评估了6个代表性的LLMs,以诊断当前LLMs在应用RAG时的挑战。评估表明,虽然LLMs在一定程度上具有噪声鲁棒性,但在负例拒绝、信息整合和处理虚假信息方面仍然存在显著困难。结果表明,在将RAG有效应用于LLMs方面仍有相当的挑战。

表格数据分析

图片

https://arxiv.org/pdf/2312.13671.pdf

本文研究主要针对表格数据分析领域存在的问题,当前研究主要集中在Text2SQL和TableQA等基础任务,忽略了像预测和图表生成这样的高级分析。

图片

为填补这一空白,本文提出了Text2Analysis基准,涵盖了超越SQL兼容操作的高级分析任务。本文还开发了五种创新有效的注释方法,充分利用大型语言模型的能力,提高数据的质量和数量。此外引入了类似真实用户问题的不确定查询,测试模型对此类挑战的理解和解决能力。

最终,本文收集了2249个查询-结果对和347个表格,使用三种不同的评估指标对五个最先进的模型进行评估,结果显示本文的基准在表格数据分析领域提出了相当大的挑战。

零样本认知诊断

图片

https://arxiv.org/pdf/2312.13434.pdf

本文研究主要针对领域级零样本认知诊断(DZCD),该问题源于新启动领域中缺乏学生练习日志。近期的跨领域诊断模型被证明是解决DZCD的一种策略,但这些方法主要关注如何在领域之间转移学生状态。然而,它们可能会无意中将不可转移的信息纳入学生表示中,从而限制知识转移的效果。

图片

为了解决这个问题,本文提出了Zero-1-to-3,通过早期学生实现领域共享认知信号传递和虚拟数据生成,有效处理新领域中缺乏学生练习日志的情况。共享的认知信号可以传递到目标领域,丰富新领域的认知先验,确保认知状态传播的目标。在六个真实世界数据集上的广泛实验证明了本文模型在DZCD及其在问题推荐中的实际应用方面的有效性。

动态网络方法

图片

https://arxiv.org/pdf/2312.13068.pdf

本文研究主要针对动态网络方法在处理时间上连续变化的网络时存在的局限性。本文提出了一种基于生存函数的新型随机过程,用于建模链接在时间上的持续和缺失。这形成了一种通用的新似然规范,明确考虑了间歇性的边持续网络,即GRASP:Graph Representation with Sequential Survival Process。

本文将该框架应用于最近的连续时间动态潜在距离模型,以节点在潜在空间中的分段线性移动序列来刻画网络动态。本文在诸如链接预测和网络完成等各种下游任务中进行了定量评估,结果表明本文的建模框架能够有效跟踪潜在空间中节点的内在轨迹,捕捉不断演变的网络结构的基本特征。

KGs错误检测

图片

https://arxiv.org/pdf/2312.12108.pdf

本文研究主要针对知识图谱(KGs)中存在的各种错误问题。本文提出了一种KG错误检测模型CCA,通过三元组重建整合文本和图结构信息,更好地区分语义。

图片

本文采用交互对比学习捕捉文本和结构模式之间的差异。此外,本文构建了包含语义相似噪声和对抗性噪声的真实数据集。实验结果表明,CCA在检测语义相似噪声和对抗性噪声方面优于最先进的基线方法。

思维图生成

图片

https://arxiv.org/pdf/2312.11997.pdf

本文研究主要针对思维图生成中存在的问题,即现有方法虽然能够并行生成思维图,但主要侧重于顺序特征,难以捕捉结构信息,尤其在建模长程语义关系方面存在困难。

图片

本文提出了一种基于指代的思维图生成网络(CMGN),以引入外部结构知识。具体而言,本文基于指代语义关系构建指代图,引入图结构信息。然后,采用指代图编码器挖掘句子之间的潜在关系。

为了排除噪声并更好地利用指代图的信息,本文采用对比学习方式中的图增强模块。实验结果表明,本文模型优于所有现有方法。案例研究进一步证明,本文模型能够更准确、简洁地揭示文档的结构和语义。

多模态对齐Prompt

图片

https://arxiv.org/pdf/2312.08636.pdf

本文研究主要针对多任务学习中解码器随任务增加而复杂的问题。本文提出了一种集成无解码器的视觉-语言模型CLIP的方法,该模型表现出强大的零样本泛化能力。

图片

本文首先提出了多模态对齐提示(MmAP)方法,用于在微调过程中对齐文本和视觉模态。在MmAP的基础上,本文开发了一种创新的多任务提示学习框架。一方面,为了最大化相似任务的互补性;另一方面,为了保留每个任务的独特特征,为每个任务分配一个特定的MmAP。

在两个大型多任务学习数据集上的综合实验证明,本文方法相较于完全微调实现了显著的性能提升,同时仅利用约0.09%的可训练参数。

多模型标签对齐

图片

https://arxiv.org/pdf/2312.08212.pdf

本文研究主要针对在视觉-语言(VL)领域中,将预训练模型成功迁移到下游任务的问题。先前的方法主要集中于构建文本和视觉输入的提示模板,忽略了VL模型和下游任务之间类别标签表示的差距。

图片

为解决这一挑战,本文引入了一种名为LAMM的创新标签对齐方法,通过端到端训练动态调整下游数据集的类别嵌入。此外,为了获得更合适的标签分布,本文提出了一个分层损失,包括参数空间、特征空间和logits空间的对齐。我们在11个下游视觉数据集上进行了实验证明,本文方法在少样本场景中显著提高了现有多模态提示学习模型的性能,相较于16张图像的最先进方法,平均准确率提升了2.31%。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/230720.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微服务实战系列之Dubbo(下)

前言 眼看着2023即将走远,心里想着似乎还有啥,需要再跟各位盆友叨叨。这不说曹操,曹操就来了。趁着上一篇Dubbo博文的余温尚在,博主兴匆匆地“赶制”了Dubbo的下集,以飨读者。 上一篇博主依然从Dubbo的内核出发&#…

C++第四天

定义一个Person类,私有成员int age,string &name,定义一个Stu类,包含私有成员double *score,写出两个类的构造函数、析构函数、拷贝构造和拷贝赋值函数,完成对Person的运算符重载(算术运算符、条件运算…

Winform中使用Fleck实现Websocket服务端并读取SQLite数据库中数据定时循环群发消息

场景 Winform中使用Websocket4Net实现Websocket客户端并定时存储接收数据到SQLite中: Winform中使用Websocket4Net实现Websocket客户端并定时存储接收数据到SQLite中-CSDN博客 Winform中操作Sqlite数据增删改查、程序启动时执行创建表初始化操作: Wi…

docker 安装可视化工具 Portainer 以及 汉化

安装portainer是最新版本,汉化指定版本2.9.1 。如果要安装汉化版,可直接跳转步骤四 一、拉去镜像 安装网址:Install Portainer BE with Docker on Linux - Portainer Documentation docker pull portainer/portainer二、根据portainer镜像创建…

利用 PEB_LDR_DATA 结构枚举进程模块信息

1. 引言 我们常常通过很多方法来获取进程的模块信息,例如 EnumProcessModules 函数、CreateToolhelp32Snapshot 函数、WTSEnumerateProcesses 函数、ZwQuerySystemInformation 函数等。但是调用这些接口进行模块枚举的原理是什么我们并不知道。通过学习 PEB 中 PEB…

Prometheus-AlertManager 邮件告警

环境,软件准备 本次演示环境,我是在虚拟机上安装 Linux 系统来执行操作,以下是安装的软件及版本: System: CentOS Linux release 7.6Docker: 24.0.5Prometheus: v2.37.6Consul: 1.6.1 docker 安装prometheus,alertmanage,说明一下这里直接将…

ArrayList学生管理系统

文章目录 1.ArrayList集合和数组的优势对比:1.1 ArrayList类概述1.2 ArrayList类常用方法1.2.1 构造方法1.2.2 成员方法1.2.3 示例代码 1.3 ArrayList存储字符串并遍历1.3.1 案例需求1.3.2 代码实现 1.4 ArrayList存储学生对象并遍历1.4.1 案例需求1.4.2 代码实现 1…

【LLM】大型语言模型综述论文

今天我将与大家分享一篇精彩的论文。这项调查提供了LLM文献的最新综述,这对研究人员和工程师来说都是一个有用的资源。 为什么选择LLM? 当参数尺度超过一定水平时,这些扩展的语言模型不仅实现了显著的性能改进,而且还表现出一些…

uniCloud 云数据库(新建表、增、删、改、查)

新建表结构描述文件 todo 为自定义的表名 表结构描述文件的默认后缀为 .schema.json 设置表的操作权限 uniCloud-aliyun/database/todo.schema.json 默认的操作权限都是 false "permission": {"read": false,"create": false,"update&quo…

【熔断限流组件resilience4j和hystrix】

文章目录 🔊博主介绍🥤本文内容起因resilience4j落地实现pom.xml依赖application.yml配置接口使用 hystrix 落地实现pom.xml依赖启动类上添加注解接口上使用 📢文章总结📥博主目标 🔊博主介绍 🌟我是廖志伟…

华为HCIE-Datacom课程介绍

厦门微思网络HCIE-Datacom课程介绍 一、认证简介 HCIE-Datacom(Huawei Certified ICT Expert-Datacom)认证是华为认证体系中的顶级认证,HCIE-Datacom认证定位具备坚实的企业网络跨场景融合解决方案理论知识,能够使用华为数通产品…

C语言-环境搭建

文章目录 内容Notepad的安装gcc编译工具的配置 编写软件的安装:软件传送门:Notepad软件选择一个合适的路径,一键傻瓜式安装即可 编译工具gcc在windows环境下的配置:解压gcc编辑工具包解压出来的mingw64文件放到一个合适的磁盘路径…

从0到1入门C++编程——03 内存分区、引用、函数高级应用

文章目录 一、内存分区二、引用三、函数的高级应用1.默认参数2.占位参数3.函数重载 一、内存分区 C程序在执行时,会将内存大致分为4个区,分别是代码区、全局区、栈区和堆区。 代码区用来存放函数体和二进制代码,由操作系统进行管理。 全局区…

Kubernetes-网络

一. 前言 flannel两种容器跨主机通信的方案,其中UDP模式是IP in UDP,即三层报文封装在UDP数据包中通信;而vxlan模式则是MAC in UDP,即二层报文封装在UDP数据包中通信 flannel UDP模式和vxlan模式都对数据包做了封解包&#xff0c…

为什么我不建议大学生接公司单?

大家好,我是鱼皮。前两天,我 编程导航 的鱼友提了个问:大学生怎么接公司的单赚点零花钱? 然后我很认真地评论了一句:我不建议大学生接公司单。 这位小伙伴很认真,又通过微信单独问我: 想了想&am…

Mybatis行为配置之Ⅰ—缓存

专栏精选 引入Mybatis Mybatis的快速入门 Mybatis的增删改查扩展功能说明 mapper映射的参数和结果 Mybatis复杂类型的结果映射 Mybatis基于注解的结果映射 Mybatis枚举类型处理和类型处理器 再谈动态SQL Mybatis配置入门 Mybatis行为配置之Ⅰ—缓存 Mybatis行为配置…

【Midjourney】AI绘画新手教程(一)登录和创建服务器,生成第一幅画作

一、登录Discord 1、访问Discord官网 使用柯學尚网(亲测非必须,可加快响应速度)访问Discord官方网址:https://discord.com 选择“在您的浏览器中打开Discord” 然后,注册帐号、购买套餐等,在此不做缀述。…

3D目标检测(教程+代码)

随着计算机视觉技术的不断发展,3D目标检测成为了一个备受关注的研究领域。与传统的2D目标检测相比,3D目标检测可以在三维空间中对物体进行定位和识别,具有更高的准确性和适用性。本文将介绍3D目标检测的相关概念、方法和代码实现。 一、3D目…

Python消消乐小游戏(PyGame)

文章目录 写在前面喜羊羊与灰太狼PyGame入门消消乐注意事项写在后面 写在前面 本期内容:基于pygame实现喜羊羊与灰太狼版消消乐小游戏 实验环境 python3.11及以上pycharmpygame 安装pygame的命令: pip install -i https://pypi.tuna.tsinghua.edu.c…

Redis (三)

1、redis复制 简单的概括就是主从复制,master以写为主,Slave以读为主,当master数据发生变化的时候,自动将更新的数据异步同步到其他的slave是数据库。 使用这种机制的话,可以做到读写分离,可以减轻主机负担…