谷歌强势出手,人工智能学习者有福了,从此数据资产跨入搜索时代!

在这里插入图片描述
1995年,正是互联网方兴未艾之时,雅虎横空出世,雅虎以提供互联网各种信息目录起家,迅速崛起成为世界互联网巨头,整个互联网行业也迎来了门户网站时代。彼时的第一批互联网居民,要想在互联网上获取信息,就需要登录雅虎等门户网站,一页页地翻找目录。即使这样,也极大地方便了大家获取信息。

然而,随着互联网信息爆炸式增长,门户网站的这种收录目录的形式根本不能适应日渐暴涨的互联网内容。于是,以谷歌为代表的搜索引擎公司,一方面通过爬虫实时抓取互联网信息,一方面通过智能搜索算法,根据用户搜索关键词,匹配最合适的网页,谷歌也借此超越各大门户网站,跻身成新的互联网巨头。

在机器学习和人工智能的学习过程中,数据集是横亘在初学者之间的一座大桥,我在:

机器学习需要的大量数据集从哪里找?

机器学习超详细实践攻略(1):盘点scikit-learn里那些有趣又有用的彩蛋级入门数据集

两篇文章中已经介绍了一些初学者寻找数据集的网站和思路。但是,这些方法寻找数据集的时候需要登录不同的网站,然后在里边翻找自己可能用到的数据集。可以说,在寻找数据集方面,包括我写的所有知乎答案在内,仍然停留在“门户网站”的1.0时代。

其实,数据集本质上也是一种信息,如果需要从网上找到某个知识,或者某一张图片,只需要搜索引擎输入关键字就可以了。那是否可以输入一个关键字,就可以找到这个领域的所有数据集呢?

如今,经过一年的测试,谷歌正式推出了一款名为“Google Dataset Search”的数据集专用搜索引擎,目前已经涵盖了2500万个数据集,以后需要数据集,只需要从这个统一入口寻找就可以了,彻底让寻找数据集进入“搜索时代”。网站界面如下所示:
在这里插入图片描述
目前,搜索引擎收录的数据集涵盖了地球科学、生物学和农业等各种领域。包含了世界上大多数政府、科研机构、大学等机构发布的数据集,而且数据集的数量继续增加。并且支持普通人按照schema.org的开放标准添加和上传数据集。

利用这个数据集搜索工具,我们可以通过简单的关键字来查找全网中的数据集。对初学者来说,可以更方便地寻找自己感兴趣的数据集,对于整个人工智能行业来说,一方面形成一个数据共享生态系统,鼓励数据发布者按照规定格式存储和发布数据;另一方面也为数据科学家提供相应平台,方便大家引用他们创建的数据集,以使他们的研究成果获得更大的影响力。

一、使用方法

1、搜索方法

进入““Google Dataset Search”网站(网站地址:Dataset Search),这里,我们搜索一下经典的“泰坎尼克号”数据集,可以看到,左侧列出了很多数据集来源。点击排在第一位的kaggle源,还可以查看该数据集的作者、支持下载的格式、数据集的说明、数据集大小等信息。
在这里插入图片描述
再搜索一个鸢尾花数据集看看结果:
在这里插入图片描述

2、筛选搜索结果

对于搜索结果,还可以根据更新日期、下载格式、使用权限、是否免费四个条件进行筛选。进一步定位我们需要的数据集。
在这里插入图片描述

从以上搜索流程中可以看到,数据集的搜索和我们平常的搜索习惯和方式并没有什么不同。

3、其他应用

发布数据集的网站,很多都是诸如kaggle这样的竞赛网站,还是以泰坦尼克号数据集为例,点击这个数据集,直接跳转到了kaggle的主页,下载数据集的时候,还可以顺便研究一下其他人的实现代码。
在这里插入图片描述
也就是说,通过这个搜索引擎,不仅可以找到数据集,还可以找到对应的数据比赛以及一些选手的思路,即找问题,又能顺便找到答案。

二、不足

对于国内使用者来说,目前有两点不足,一是对中文支持不是很友好。比如,搜索鸢尾花数据集的时候,如果输入中文,则提示:找不到匹配的数据集。
在这里插入图片描述
二是需要一些上网技巧才能访问这个网站。

现在摆在我们面前的障碍,只有需要一些上网技巧和语言限制了。

写在最后

以搜索起家的谷歌,近年来在人工智能方面也是硕果累累,Tensorflow深度学习框架、Colab免费云计算实验室、各种顶会里的论文以及前几年流行一时的“你画我猜”等人工智能小程序,皆出自谷歌之手。甚至开发了Alphago,带动人工智能领域大火的 DeepMind公司,也被谷歌收入麾下。

在学习人工智能知识方面,数据集搜索绝对是刚需,搜索引擎出身的谷歌,也必然有实力让搜索数据集和搜索普通知识一样简单。

随口吐槽一句:寄希望于在国内自顾不暇的百度来跟随谷歌建设国内自己的数据集搜索系统,怕是遥遥无期了。

##############################################################

如果觉得有用,点赞、关注再走呗~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10831.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

虚拟机连不上群晖服务器,没NAS也能体验群晖:VMware虚拟机安装DSM详细安装步骤...

2015-10-14 11:48:23 十一国庆遇到台风“杜鹃”,下了几天雨,蛮凉爽的。放晴后虽说去外面玩了几天,但最多时间还是呆在家里。最近对DSM比较感兴趣,网上看了几篇文章,如何安装及设置,对此有点初步的了解。手上没有NAS,但是想体验DSM的朋友有福了,抽空写了这篇文章,希望对…

鸿蒙碧 不忘前,不忘初心,荣耀手机包括老机型也将可升级华为研发的鸿蒙OS

原标题:不忘初心,荣耀手机包括老机型也将可升级华为研发的鸿蒙OS 根据之前曝光的消息,从4月份开始,华为将全面开启旗下自主研发系统HarmonyOS的升级适配,而且消息显示,华为大部分机型都将可以升级HarmonyOS…

Linux 游戏玩家有福了

ProtonDB 对 Steam 上前 10、前 100 和前 1000 款游戏的兼容性进行了评级,根据评级,前 1000 款游戏中有 77% 在 Linux 上运行良好,在前 100 款游戏中有 80% 在 Linux 上运行良好,而在前 10 名游戏中只有 4 个在 Linux 上运行良好。…

荣耀v20不支持鸿蒙,华为鸿蒙系统下月推送,这44款手机有福了!荣耀V20无缘升级...

原标题:华为鸿蒙系统下月推送,这44款手机有福了!荣耀V20无缘升级 从去年到今年,大家对于华为自主研发的“鸿蒙”系统非常期待,而余承东也在Mate40系列发布会上就明确表态,鸿蒙系统将在2021年第二季度推送。…

杜有福 c语言 第三版,C语言程序设计习题答案 杜有福.doc

C语言程序设计习题答案 杜有福.doc C语言程序设计习题答案习题一 C语言程序设计概述一、名词解释(1)程序P1 (2)程序设计P1 (3)机器语言P1 (4)汇编程序P2(5)高级语言P2 (6)编译程序P3 (7)解释程序P3 (8)算法P4(9)结构化的程序设计P9二、简述题1. 设计程序时应遵循哪些基本原则P4…

c语言编程设计杜有福,C语言程序设计习题答案 杜有福

C语言程序设计习题答案 习题一 C语言程序设计概述 一、名词解释 (1)程序P1 (2)程序设计P1 (3)机器语言P1 (4)汇编程序P2 (5)高级语言P2 (6)编译程序P3 (7)解释程序P3 (8)算法P4 (9)结构化的程序设计P9 二、简述题 1. 设计程序时应遵循哪些基本原则?P4 答&#xff1a…

【与ChatGPT相处两个星期让我刮目相看】

最近OpenAI的ChatGPT热度不减,作为一名IT老兵,怎么能够错过如此重量级的产品,就冲着微软的100亿美金,我也不得不给足面子,通过一系列爬山涉水、翻山越岭的准备工作,终于是能够一睹ChatGPT的庐山真容&#x…

斯坦福谷歌新研究爆火,用ChatGPT控制NPC,在虚拟世界构筑人类社会

放任25个AI共同生活,他们竟然在虚拟世界里构建人类社会! 前沿 时至今日,ChatGPT已经火遍全球,我们都见识到了AI的强大。但“生活”这个看似充满人情味的词,不负众望的和AI有了联系。 来自斯坦福和谷歌的一组研究人员…

R(2+1)D理解与MindSpore框架下的实现

一、R(21)D算法原理介绍 论文地址:[1711.11248] A Closer Look at Spatiotemporal Convolutions for Action Recognition (arxiv.org) Tran等人在2018年发表在CVPR 的文章《A Closer Look at Spatiotemporal Convolutions for Action Recognition》提出了R(21)D&a…

鸿蒙哪些机型可以用,鸿蒙2.0可以在哪些型号的手机中使用?鸿蒙2.0适配的机型介绍...

鸿蒙2.0全新系统已于昨日正式更新发布,在很多方面都具有非常不错的优越性,而且在一台手机中也可以实现多个系统同时运行,这在其他品牌的手机上是极少出现的,小编相信本次的更新一定可以为大家带来更棒的使用体验,而且适…

华为nova2s可以升级鸿蒙吗,华为Nova7怎么升级鸿蒙系统 Nova7升级鸿蒙系统步骤教程...

Nova7这一次在鸿蒙系统的升级名单之中在第二批次,那么华为Nova7怎么升级鸿蒙系统呢?为了解决各位小伙伴们疑惑的问题,小编收集了资料带来了Nova7升级鸿蒙系统步骤教程。 华为Nova7怎么升级鸿蒙系统 重要的事情多说几遍,一定记得备…

什么牌子的护眼灯对孩子眼睛好?盘点五款护眼灯

现在生活节奏越来越快,夜间的学习和工作已经不可避免。很多人在劣质的光源下眼睛会出现各种问题。为了孩子、或者为了自己,选择一款优质光源的台灯保护眼睛极其重要。 那么我们该选择哪个牌子的护眼台灯呢?其实,选择哪个牌子的护眼…

哪个牌子的led灯质量好?2022LED护眼台灯最好的品牌有哪些

谈及led灯的品牌,就不得不提一些比较专业的厂商了,特别是在护眼照明领域,明基、南卡、飞利浦、松下等品牌都有不俗的实力,出产的led护眼台灯在业内都有广泛的知名度,在消费者领域也是好评连连。那么它们到底好在哪儿呢…

JUnit 5 –如何禁用测试?

JUnit 5 @Disabled示例禁用整个测试类或单个测试方法上的测试。 PS已通过JUnit 5.5.2测试 注意 您还可以根据条件禁用测试 。 1. @禁用方法 1.1测试

手机表格html5,手机上怎么做表格?

手机上怎么做表格?以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 手机上怎么做表格? 我的手机都是通过下载安装wps这个app程序,制作的表格。 就个人使用经验,手机制作表格,最好只做简单明了的,方便制作的…

ShuffleNetV2Plus-基于MindStudio的MindX SDK应用开发

目录 一、任务介绍 二、环境搭建与配置 1. Windows安装MindStudio 2. Windows安装MindX SDK 三、推理开发运行流程 四、ShuffleNetV2Plus模型推理介绍 五、Python应用开发(可参考代码) 1. 创建MindX SDK应用工程 2. 模型转换 3. pipeline流程文…

ba2plus android,BAPlus金融计算器

BAPlus金融计算器基于金融行业所开发的计算器软件,金融行业当中相关数据可以直接的通过这款软件来进行计算,对于金融行业的从业者来说这款软件相较于笔记本等来说更加的便利,所以有需要的话就快来下载这款BAPlus金融计算器! BAPlu…

研报精选230522

目录 【行业230522东亚前海证券】新能源行业深度报告:政策东风与海外需求共振,充电桩迎新一轮增长周期 【行业230522西南证券】人工智能专题研究:AIGC投资框架 【行业230522国信证券】传媒互联网行业周报:OpenAI推出移动版及网页端…

GPU受限,国内AI大模型能否交出自己的答卷?

继百度之后,阿里、华为、京东、360等大模型也陆续浮出水面,大模型军备竞赛正式开启。 4月7日,阿里云宣布自研大模型“通义千问”开始邀请企业用户测试体验。 4月8日,华为云人工智能领域首席科学家田奇现身《人工智能大模型技术高峰…

国产AI服务器分类、技术及产品(2023)

目前国产服务器主要品牌也就是浪潮、曙光、华为、超聚变、新华三、联想、风虎(科研服务器风虎信息、风虎云龙),也还有很多其他品牌,外国品牌惠普、戴尔、IBM等在国内还有不小的份额,其实核心部件大家都一样&#xff0c…