NeurIPS 2024 有效投稿达 15,671 篇,数据集版块内容丰富

NeurIPS,全称 Neural Information Processing Systems Conference,是神经信息处理系统的年度学术会议。该会议始于 1987 年,当时名为 NIPS。随着人工智能领域的快速发展,其影响力逐渐扩大,被越来越多的研究者和企业关注并熟知。为了更好地反映会议涵盖的广泛领域,NIPS 于 2017 年正式更名为 NeurIPS。

如今,NeurIPS 已经成为全球人工智能领域最具权威性的学术会议之一,吸引了来自世界各地的学者、企业家和研究人员。

今年是 NeurIPS 举办的第 38 届 (NeurIPS 2024),学术成果盛况依旧。据悉,今年共收到 15,671 篇有效投稿,最终接收了 4,000 篇左右论文。

HyperAI超神经从大会接收的数据集中为大家汇总了 9 个高质量开源数据集,覆盖云层去除、化学光谱、歌声音频、自动驾驶、昆虫标本等多个方面,大家可以按需下载~

点击了解更多顶会信息:
https://go.hyper.ai/vWvAW

NeurIPS 2024 数据集汇总

1、AllClear 公共云层去除数据集

发布机构:康奈尔大学、哥伦比亚大学

预估大小:22.42 GB

下载地址:https://go.hyper.ai/uVwmU

卫星图像中的云层对于下游应用构成了重大挑战,当前云去除研究面临的一个主要问题是缺乏全面的基准测试和足够大且多样化的训练数据集。而 AllClear 是目前最大的公共云层去除数据集,包含 23,742 个全球分布的兴趣区域 (ROIs),覆盖了多样的土地利用模式,总共包含 400 万张图像。

2、Muharaf 手写阿拉伯文数据集

发布机构:北卡罗来纳州立大学、卡斯利克圣灵大学、黎巴嫩历史协会

预估大小:9.83 GB

下载地址:https://go.hyper.ai/HBEuz

Muharaf 数据集是一个专注于手写阿拉伯文识别的机器学习数据集,包含了超过 1.6k 张历史手写页面图像,这些图像由档案阿拉伯语专家转录。每张文档图像都伴随着其文本行的空间多边形坐标以及基本页面元素的信息,旨在推进手写文本识别 (HTR) 领域的技术进步。

3、化学多模光谱数据集

发布机构:IBM Research 、苏黎世大学、 EPFL 、NCCR Catalysis

预估大小:9.7 GB

下载地址:https://go.hyper.ai/sXVdm

该数据集包含了从专利数据中的化学反应中提取的 79 万种分子的模拟 1H-NMR 、13C-NMR、HSQC-NMR 、红外和质谱(正负离子模式)光谱数据。这个数据集的核心价值在于其能够整合多种光谱模态的信息,模拟人类专家分析分子结构的方法,从而有望自动化结构解析,简化从合成到结构确定的分子发现流程。

4、GTSinger 歌声音频数据集

发布机构:浙江大学

预估大小:28.94 GB

下载地址:https://go.hyper.ai/gLb3t

该数据集包含了 80.59 小时的专业录音棚录制的歌声,这些歌声由 20 位专业歌手演唱,覆盖了 9 种不同的语言,包括汉语、英语、日语、韩语等,为研究者提供了一个音色和风格极为丰富的资源库。

5、DrivingDojo 自动驾驶数据集

发布机构:中国科学院、美团、中国科学院香港创新研究院人工智能与机器人中心

下载地址:https://go.hyper.ai/a85sN

该数据集包含约 18k 个视频片段,涵盖北京、深圳、徐州等城市,并在不同的天气条件和日光条件下录制。它不仅包括了加速、紧急刹车、停车启动等纵向操作,还包括了掉头、超车和变道等横向操作。此外,数据集特别设计了包含大量多主体交互轨迹的视频,旨在提升世界模型在复杂驾驶环境中的预测和控制能力。

6、多模态昆虫生物多样性数据集

发布机构:生物多样性基因组学中心、圭尔夫大学、滑铁卢大学等

预估大小:37.71 GB

下载地址:https://go.hyper.ai/narLh

BIOSCAN-5M 数据集包含了超过 500 万昆虫标本的详细信息,显著扩展了现有的基于图像的生物数据集,不仅包括分类标签、原始核苷酸条形码序列、分配的条形码索引号和地理信息,还涵盖了标本大小等多模态信息,旨在理解和监测全球昆虫生物多样性。

7、OpenSatMap 高分辨率卫星数据集

发布机构:中国科学院、中国科学院香港信息系统研究所人工智能与机器人研究中心、腾讯地图和北京邮电大学

预估大小:57.7 GB

下载地址:https://go.hyper.ai/mFXUw

该数据集是一个高分辨率卫星数据集,专为大规模地图构建而设计。其特点是细粒度的实例级注释和高分辨率图像,包含了 3,787 张高分辨率卫星图像,其中不仅包括中国多个城市的图像,还涵盖全球 50 多个城市和 18 个国家的图像。

8、自然物种声音数据集

发布机构:马萨诸塞大学阿默斯特分校、iNaturalist

预估大小:131.26 GB

下载地址:https://go.hyper.ai/R8Ix7

该数据集收集了 230,000 个音频文件,捕捉了来自超过 5,500 个物种的声音,这些声音由全球超过 27,000 名记录者贡献。这个数据集包含了鸟类、哺乳动物、昆虫、爬行动物和两栖动物的声音,音频和物种标签来源于提交给 iNaturalist 的观察记录。

9、MINT-1T 文本图像对多模态数据集

发布机构:华盛顿大学、斯坦福大学、Salesforce Research 等

下载地址:https://go.hyper.ai/l5vvj

该数据集包含 1 万亿个文本标记和 34 亿张图像,其规模是之前最大开源数据集的 10 倍。它不仅包括 HTML 文档,还涵盖 PDF 文档和 ArXiv 论文,其多样性显著提升了科学文档的覆盖率。

10、AudioSetCaps 音频字幕数据集

发布机构:西北工业大学、西安联丰声学技术有限公司、南洋理工大学、中国科学院声学研究所等

下载地址:https://go.hyper.ai/WRZDQ

AudioSetCaps 是一个音频-字幕数据集,数据来源于 AudioSet 、YouTube-8M 和 VGGSound,包含 6,117,099 个 10 秒的音频文件。每个音频文件都附有一个描述性标题,还附有 3 个 Q&A 对作为生成最终标题的元数据(共 18,414,789 对 Q&A 数据)。

以上就是 HyperAI超神经为大家汇总的 NeurIPS 2024 数据集,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/478861.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++编程玩转物联网:使用芯片控制8个LED实现流水灯技术分享

在嵌入式系统中,有限的GPIO引脚往往限制了硬件扩展能力。74HC595N芯片是一种常用的移位寄存器,通过串行输入和并行输出扩展GPIO数量。本项目利用树莓派Pico开发板与74HC595N芯片,驱动8个LED实现流水灯效果。本文详细解析项目硬件连接、代码实…

《白帽子讲Web安全》13-14章

《白帽子讲Web安全》13-14章 《白帽子讲Web安全》13-14章13、应用层拒绝服务攻击13.1、DDOS简介13.2、应用层DDOS13.2.1、CC攻击13.2.2、限制请求频率13.2.3、道高一尺,魔高一丈 13.3、验证码的那些事儿13.4、防御应用层DDOS13.5、资源耗尽攻击13.5.1、Slowloris攻击…

Linux—进程概念学习-03

目录 Linux—进程学习—31.进程优先级1.1Linux中的进程优先级1.2修改进程优先级—top 2.进程的其他概念3.进程切换4.环境变量4.0环境变量的理解4.1环境变量的基本概念4.2添加环境变量—export4.3Linux中环境变量的由来4.4常见环境变量4.5和环境变量相关的命令4.6通过系统调用获…

pikachu文件上传漏洞通关详解

声明:文章只是起演示作用,所有涉及的网站和内容,仅供大家学习交流,如有任何违法行为,均和本人无关,切勿触碰法律底线 目录 概念:什么是文件上传漏洞一、客户端check二、MIME type三、getimagesi…

从零开始学GeoServer源码(二)添加支持arcgis切片功能

文章目录 参考文章环境背景1、配置打包好的程序1.1、下载GeoServer的war包1.2、下载GeoWebCache1.3、拷贝jar包1.4、修改配置文件1.4.1、拷贝geowebcache-arcgiscache-context.xml1.4.2、修改geowebcache-core-context.xml1.4.3、修改geowebcache-servlet.xml 1.5、配置切片信息…

学习日志016--python实现双向循环列表与链栈

python中一些复合数据结构通过类的封装来实现的。双向循环链表与链栈也在其中。 双向循环链表 双向循环链表是一种特殊类型的链表,它结合了双向链表和循环链表的特点。在双向循环链表中,每个节点不仅包含数据,还持有指向前一个和后一个节点的…

【自动化Selenium】Python 网页自动化测试脚本(上)

目录 1、Selenium介绍 2、Selenium环境安装 3、创建浏览器、设置、打开 4、打开网页、关闭网页、浏览器 5、浏览器最大化、最小化 6、浏览器的打开位置、尺寸 7、浏览器截图、网页刷新 8、元素定位 9、元素交互操作 10、元素定位 (1)ID定位 &…

微软Ignite 2024:建立一个Agentic世界!

在今年的Microsoft Ignite 2024上,AI Agent无疑成为本次大会的重点,已经有十万家企业通过Copilot Studio创建智能体了。微软更是宣布:企业可以在智能体中,使用Azure目录中1800个LLM中的任何一个模型了! 建立一个Agent…

嵌入式linux系统中图像处理基本方法

目录 2.1 BMP图像处理 2.1.1 BMP文件格式解析 2.1.2 代码实现:将BMP文件解析为RGB格式,在LCD上显示 2.2 JPEG图像处理 2.2.1 JPEG文件格式和libjpeg编译 2.2.2 libjpeg接口函数的解析和使用 2.2.3 使用libjpeg把JPEG文件解析为RGB格式,在LCD上显示 …

探索 GAN 的演变之路

2014 年,在论文Generative Adversarial Networks中,首次提出了 GAN,其核心思想是“生成”与“对抗”。GAN 由一个生成器 G(Generator)和一个判别器 D(Discriminator)构成,前者用于捕捉数据分布,后者用于判别某个样本是…

Vue实训---5-路由搭建

回顾之前的代码 我们在my-vue-project\src\router\index.js中的代码如下: // 什么是路由?路由就是url地址和组件的对应关系 // 1.引入vue-router import { createRouter, createWebHashHistory } from vue-router// 2.定义路由 const routes [{path: …

【GAMES101笔记速查——Lecture 19 Cameras,Lenses and Light Fields】

本章节内容:相机、棱镜、光场 计算机图形学的两种成像方法: 1.合成方法:光栅化、光线追踪(展示出现实没有的东西) 2.捕捉方法:相机(捕捉现实已有的东西) 目录 1 相机 1.1 针孔相…

MacOS系统上Jmeter 录制脚本遇到的证书坑位

一、JMeter介绍与安装 1,下载及安装 jmeter官网地址 二、录制百度链接https请求时,需要导入jmeter相关证书到macos系统的更目录中. 导入方式,直接拖入mac的系统中,始终新人就可以; 三、jmeter 创建相关的录制组件…

软件团队的共担责任

问责制被认为是个人与其社会系统之间的纽带,它创造了一种将个人与其行为和绩效联系起来的身份关系。在入门系列的第一篇文章《超越工具和流程:成功软件开发团队的策略》中,我们介绍了问责制的概念,并提出了以下定义: …

【Python爬虫实战】深入解析 Scrapy:从阻塞与非阻塞到高效爬取的实战指南

🌈个人主页:易辰君-CSDN博客 🔥 系列专栏:https://blog.csdn.net/2401_86688088/category_12797772.html ​ 目录 前言 一、阻塞和非阻塞 (一)阻塞 (二)非阻塞 二、Scrapy的工作…

【Python数据分析五十个小案例】电影评分分析:使用Pandas分析电影评分数据,探索评分的分布、热门电影、用户偏好

博客主页:小馒头学python 本文专栏: Python数据分析五十个小案例 专栏简介:分享五十个Python数据分析小案例 在现代电影行业中,数据分析已经成为提升用户体验和电影推荐的关键工具。通过分析电影评分数据,我们可以揭示出用户的…

第八篇:CamX RawHdr Feature Enable

CamX RawHdr Feature Enable RawHdr feature介绍: 试用于拍照场景,输入3张Raw,输出一张Raw。 对应的pipeline: camxSWMFMergeRaw.xml (usecases: UsecaseZSL) featureGraph: RTRawHDRBayer2YUVJPEG ​ RT -> RawHdr -> Bayer2Yuv -> JPEG RTRawHDRBayer2YUVJPE…

Python毕业设计选题:基于django+vue的期货交易模拟系统的设计与实现

开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 系统首页 期货信息 个人中心 管理员登录界面 管理员功能界面 用户管理 期货公司管理…

文件内容扫描工具

简介 文件扫描助手是一款基于Vite Vue 3 Electron技术栈开发的跨平台桌面应用程序。它提供了强大的文件内容搜索功能,支持Word、Excel、PDF、PPT等常见办公文档格式。用户可以通过关键词快速定位到包含特定内容的文件,极大地提高了文件管理和查找效率…

数据结构--AVL树(平衡二叉树)

✅博客主页:爆打维c-CSDN博客​​​​​​ 🐾 🔹分享c、c知识及代码 🐾 🔹Gitee代码仓库 五彩斑斓黑1 (colorful-black-1) - Gitee.com 一、AVL树是什么?(含义、性质) 1.AVL树的概念 AVL树是最…