数据集相关网站(Open datasets and sources)

数据集相关网站(Open datasets and sources)

  • 数据集网站 Open datasets and sources
    • 政府数据网站 Government Data:
    • 金融数据网站 Financial Data Sources:
    • 犯罪数据网站 Crime Data:
    • 健康数据网站 Health Data:
    • 学术和商业数据网站 Academic and Business Data:
    • 其他数据集网站Other:
  • 数据集许可证 Dataset licenses

数据集网站 Open datasets and sources

在这里插入图片描述

政府数据网站 Government Data:

  • https://www.data.gov/ — 美国政府公开数据网站
  • https://www.census.gov/data.html
  • https://data.gov.uk/ – 英国政府公开数据网站
  • https://www.opendatanetwork.com/ – 一个美国各种数据的搜索网站
  • https://data.un.org/ – 联合国公开数据,可以查看全球各个国家的人口、教育、医疗、健康、经济等多种数据。
  • https://data.stats.gov.cn/ – 中国国家统计局数据查询网站

金融数据网站 Financial Data Sources:

  • https://data.worldbank.org/ – 世界银行公开数据网站
  • https://www.globalfinancialdata.com/ – 全球金融数据网站
  • https://comtrade.un.org/ – 联合国商品贸易统计数据库
  • https://www.nber.org/ – 美国国家经济研究局
  • https://fred.stlouisfed.org/ – 美联储经济数据,可以查找美国各个地区,各个行业等多种数据。

犯罪数据网站 Crime Data:

  • https://www.fbi.gov/services/cjis/ucr – 美国联邦调查局犯罪信息数据
  • https://www.icpsr.umich.edu/icpsrweb/content/NACJD/index.html – 美国国家刑事司法数据档案馆
  • https://www.drugabuse.gov/related-topics/trends-statistics – 美国国立卫生研究院数据网站
  • https://www.unodc.org/unodc/en/data-and-analysis/ – 联合国毒品和犯罪数据网站

健康数据网站 Health Data:

  • https://www.who.int/gho/database/en/ – 全球卫生健康观察网站,有全球的卫生健康方面的数据
  • https://www.fda.gov/Food/default.htm – 美国食品和药物管理局
  • https://seer.cancer.gov/faststats/selections.php?series=cancer – 癌症相关数据,美国政府网站
  • https://www.opensciencedatacloud.org/ – 开放科学数据云网站,需要注册
  • https://pds.nasa.gov/ – NASA行星数据,大气、行星相关数据。
  • https://earthdata.nasa.gov/ – NASA地球数据,地表面积、海洋、生物圈、人口等地球层面的数据。
  • https://www.sgim.org/communities/research/dataset-compendium/public-datasets-topic-grid – 普通内科协会网站,有医学相关的各种数据

学术和商业数据网站 Academic and Business Data:

  • https://scholar.google.com/ – 谷歌学术,需要梯子
  • https://nces.ed.gov/ – 美国国家教育统计中心,需要梯子
  • https://www.glassdoor.com/research/ – 玻璃门经济研究网站,主要数据内容针对:工作、薪水、福利、公司评论、招聘、薪酬和广泛经济方面的重要趋势。
  • https://www.yelp.com/dataset – 提供企业、大都市、图片等数据资源,网站打开的有些慢,有梯子会快一些

其他数据集网站Other:

  • https://www.kaggle.com/datasets – 大家都知道

  • https://www.reddit.com/r/datasets/ – 需梯子。。

  • https://www.datacastle.cn/dataset_list.html – datacastle网站,有数据竞赛,也可以下载数据集,国内网站

  • https://tianchi.aliyun.com/dataset/ – 阿里云天池数据网站,阿里的数据科学赛事平台。

  • https://connect.huaweicloud.com/courses/learn/aiModel?resourceType=dataset – 华为云大赛,数据集下载,华为的数据赛事平台

数据集许可证 Dataset licenses

  • 选择数据集时,有必要查看许可证。许可证说明您是否可以使用该数据集;或解释您是否必须接受某些准则才能使用该数据集。下面列出了不同的许可证类型。

PUBLIC DOMAIN MARK - PUBLIC DOMAIN

  • 当数据集具有公共领域许可时,使用、访问、修改和共享数据集的所有权利均向所有人开放。从技术上讲,这里没有许可证。

OPEN DATA COMMONS PUBLIC DOMAIN DEDICATION AND LICENSE – PDDL

  • 开放数据共享许可证与公共领域许可证具有相同的功能,但不同之处在于PDDL许可证使用许可机制来授予数据集的权利。

CREATIVE COMMONS ATTRIBUTION 4.0 INTERNATIONAL CC-BY

  • 此许可证允许用户共享和修改数据集,但前提是他们向数据集的创建者提供功劳。

COMMUNITY DATA LICENSE AGREEMENT – CDLA PERMISSIVE-2.0

  • 与大多数开源许可证一样,此许可证允许用户使用、修改、改编和共享数据集,但前提是还包括免责声明和责任。

OPEN DATA COMMONS ATTRIBUTION LICENSE - ODC-BY

  • 此许可证允许用户共享和改编数据集,但前提是他们向数据集的创建者致谢。

CREATIVE COMMONS ATTRIBUTION-SHAREALIKE 4.0 INTERNATIONAL - CC-BY-SA

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们授予数据集信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

COMMUNITY DATA LICENSE AGREEMENT – CDLA-SHARING-1.0

  • 该许可证使用“copyleft”原则:用户可以使用,修改和改编数据集,但前提是他们不对使用数据集创建的新作品添加许可证限制。

OPEN DATA COMMONS OPEN DATABASE LICENSE - ODC-ODBL

  • 此许可证允许用户使用、共享和改编数据集,但前提是他们为数据集提供信用并显示他们对数据集所做的任何更改或转换。用户可能不想使用此许可证,因为他们必须共享他们在数据集上所做的工作。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL 4.0 INTERNATIONAL - CC BY-NC

  • 此许可证是限制性许可证。用户可以共享和改编数据集,前提是他们将其归功于其创建者并确保数据集不用于任何商业目的。

CREATIVE COMMONS ATTRIBUTION-NO DERIVATIVES 4.0 INTERNATIONAL - CC BY-ND

  • 此许可证也是限制性许可证。如果用户将功劳归功于数据集的创建者,则可以共享数据集。此许可不允许对数据集进行添加、转换或更改。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-SHAREALIKE 4.0 INTERNATIONAL - CC BY-NC-SA

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户可以共享数据集的添加、转换或更改,但不能将数据集用于商业目的。

CREATIVE COMMONS ATTRIBUTION-NONCOMMERCIAL-NODERIVATIVES 4.0 INTERNATIONAL - CC BY-NC-ND

  • 此许可证允许用户仅在将数据集的创建者归功于数据集时共享数据集。用户不得修改数据集,也不得将其用于商业目的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/76810.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用C语言构建一个数字识别卷积神经网络

卷积神经网络的具体原理和对应的python例子参见末尾的参考资料2.3. 这里仅叙述卷积神经网络的配置, 其余部分不做赘述,构建和训练神经网络的具体步骤请参见上一篇: 用C语言构建一个手写数字识别神经网路 卷积网络同样采用简单的三层结构,包括输入层con…

最新2024届【海康威视】内推码【GTK3B6】

最新2024届【海康威视】内推码【GTK3B6】 【内推码使用方法】 1.请学弟学妹们登录校招官网,选择岗位投递简历; 2.投递过程中填写内推码完成内推步骤,即可获得内推特权。 内推码:GTK3B6 内推码:GTK3B6 内推码&…

01背包笔记

01背包题目链接 题意&#xff1a;有一个容量为m的背包以及n个可以拿的物品&#xff0c;给出n个物品的体积和价值&#xff0c;要求输出可以拿的最大价值 思路&#xff1a;代表在前i件物品中拿取总体积不超过j的最大价值 由此可以分情况讨论状态转移 当j<v[i]时&#xff0c;说…

STM32(HAL)串口中断接收

目录 1、简介 2 基础配置 2.1.1 SYS配置 2.1.2 RCC配置 2.2 串口外设配置 2.3 项目生成 3、KEIL端程序整合 1、简介 本文对HAL串口中断函数进行介绍。 2 基础配置 2.1.1 SYS配置 2.1.2 RCC配置 2.2 串口外设配置 2.3 项目生成 3、KEIL端程序整合 首先在main.c文件中进行…

【Spring】Spring之循环依赖底层源码解析

什么是循环依赖 A依赖了B&#xff0c;B依赖了A。 示例&#xff1a; // A依赖了B class A{public B b; }// B依赖了A class B{public A a; }其实&#xff0c;循环依赖并不是问题&#xff0c;因为对象之间相互依赖是很正常的事情。示例&#xff1a; A a new A(); B b new B…

C5.0决策树建立个人信用风险评估模型

通过构建自动化的信用评分模型&#xff0c;以在线方式进行即时的信贷审批能够为银行节约很多人工成本。本案例&#xff0c;我们将使用C5.0决策树算法建立一个简单的个人信用风险评估模型。 导入类库 读取数据 #创建编码所用的数据字典 col_dicts{} #要编码的属性集 cols [che…

51单片机学习--LED点阵屏显示图形动画

为了通用性考虑&#xff0c;需要把用到的几个口用特殊位声明来重新命名&#xff0c;由于RCLK在头文件中已有定义&#xff0c;所以这里把P3^5声明成RCK吧。。这样的做法可以提高可读性 sbit RCK P3^5; //RCLK sbit SCK P3^6; //SRCLK sbit SER P3^4;接下来编写74HC595的输…

AI 绘画Stable Diffusion 研究(三)sd模型种类介绍及安装使用详解

本文使用工具&#xff0c;作者:秋葉aaaki 免责声明: 工具免费提供 无任何盈利目的 大家好&#xff0c;我是风雨无阻。 今天为大家带来的是 AI 绘画Stable Diffusion 研究&#xff08;三&#xff09;sd模型种类介绍及安装使用详解。 目前&#xff0c;AI 绘画Stable Diffusion的…

vue+neo4j(neo4j desktop安装和使用)

vueneo4j&#xff08;neo4j desktop安装和使用&#xff09; 本文目录 vueneo4j&#xff08;neo4j desktop安装和使用&#xff09;官网下载安装基本使用创建项目新增数据库连接数据库 使用cypher构建简单知识图谱创建节点创建关系删除节点及关系查询节点和关系 数据导出为json文…

SpringCloudAlibaba之Sentinel(一)流控篇

前言&#xff1a; 为什么使用Sentinel&#xff0c;这是一个高可用组件&#xff0c;为了使我们的微服务高可用而生 我们的服务会因为什么被打垮&#xff1f; 一&#xff0c;流量激增 缓存未预热&#xff0c;线程池被占满 &#xff0c;无法响应 二&#xff0c;被其他服务拖…

LeetCode--剑指Offer75(3)

目录 题目描述&#xff1a;剑指 Offer 20. 表示数值的字符串&#xff08;中等&#xff09;题目接口解题思路什么是有限状态自动机&#xff1f;如何使用&#xff1f; 代码 PS: 题目描述&#xff1a;剑指 Offer 20. 表示数值的字符串&#xff08;中等&#xff09; 请实现一个函数…

Windows7+内网, 安装高版本nodejs,使用vite+vue3+typescript开发项目

前言&#xff1a;vite只支持高版本的nodejs&#xff0c;而高版本的nodejs只支持windows8及以上&#xff0c;且vite还对浏览器版本有兼容问题。以下均为vite官网截图 1、安装好低版本的nodejs win7系统建议安装13.及以下&#xff0c;我的是12.12.0这个版本。nodejs低版本官网下载…

【前端】搭建Vue3框架

目录 一、搭建准备二、node.js安装1、下载并安装2、配置默认安装目录和缓存日志目录①、创建默认安装目录和缓存日志目录&#xff08;我的node.js目录在D盘&#xff0c;所以直接在node.js文件夹下创建&#xff09;②、执行命令&#xff0c;配置默认安装目录和缓存日志目录到刚才…

Java ThreadPoolExecutor,Callable,Future,FutureTask 详解

目 录 一、ThreadPoolExecutor类讲解 1、线程池状态 五种状态 2、ThreadPoolExecutor构造函数 2.1&#xff09;线程池工作原理 2.2&#xff09;KeepAliveTime 2.3&#xff09;workQueue 任务队列 2.4&#xff09;threadFactory 2.5&#xff09;handler 拒绝策略 3、常…

【JMeter】 使用Synchronizing Timer设置请求集合点,实现绝对并发

目录 布局设置说明 Number of Simulated Users to Group Timeout in milliseconds 使用时需要注意的点 集合点作用域 实际运行 资料获取方法 布局设置说明 参数说明&#xff1a; Number of Simulated Users to Group 每次释放的线程数量。如果设置为0&#xff0c;等同…

【css】使用float实现水平导航栏

该实例使用float 浮动实现元素浮动在水平方向&#xff0c;从而实现水平导航栏效果。 overflow: hidden&#xff1a;当不给父级元素设置高度的时候&#xff0c;其内部元素浮动后会导致下面的元素顶上去&#xff0c;这是因为子元素浮动后&#xff0c;子元素脱离标准流&#xff0…

深度学习——注意力机制、自注意力机制

什么是注意力机制&#xff1f; 1.注意力机制的概念&#xff1a; 我们在听到一句话的时候&#xff0c;会不自觉的捕获关键信息&#xff0c;这种能力叫做注意力。 比如&#xff1a;“我吃了100个包子” 有的人会注意“我”&#xff0c;有的人会注意“100个”。 那么对于机器来说…

C语言:相交链表

Lei宝啊&#xff1a;个人主页 愿美好与我们不期而遇 题目&#xff1a; 描述 给你两个单链表的头节点 headA和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点&#xff0c;返回 null 接口 struct ListNode *getIntersectionNode (str…

与“云”共舞,联想凌拓的新科技与新突破

伴随着数字经济的高速发展&#xff0c;IT信息技术在数字中国建设中起到的驱动和支撑作用也愈发凸显。特别是2023年人工智能和ChatGPT在全球的持续火爆&#xff0c;更是为整个IT产业注入了澎湃动力。那么面对日新月异的IT信息技术&#xff0c;再结合疫情之后截然不同的经济环境和…