kaggle竞赛平台上数据集下载详解

引言 kaggle作为一个数据分析竞赛平台不仅可以上传代码和数据集,参与一些公开的竞赛,同时也可以下载别人上传的数据集。本文着重介绍如何注册kaggle账号,在本地机上安装kaggle API,以及从kaggle数据集界面上下载想要的数据集到指定位置。

文章目录

    • 1. 网站注册kaggle账户
    • 2. 本地安装kaggle API
    • 3. 加载数据集到本地机指定位置
    • 4. 总结

1. 网站注册kaggle账户

要想使用kaggle平台上的某些代码和数据集,首先需要注册成为kaggle平台合法用户,注册网站:https://www.kaggle.com/。
选择Register按钮,可以选择用google账户注册也可以选择邮箱注册,本人在文中用邮箱注册作为示例。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
注意 填写完邮箱,用户名和密码信息后出现一条提示信息Captcha must be filled out.,提示没有出现人机交互验证界面。解决此问题需要安装Header Editor插件。

  • Header Editor插件安装过程

在Microsoft Edge界面中,点击右上角的...菜单列表中的扩展选项,选择扩展管理
在这里插入图片描述
选择获取扩展,输入Header Editor搜索到该插件并选择获取
在这里插入图片描述

在这里插入图片描述
安装完插件后,刷新Microsoft Edge浏览器,会弹出人机验证界面。勾选人机身份验证接口进行验证。
在这里插入图片描述
注册成功可以登录界面搜索需要的数据集,完成下面的本地kaggle API安装操作后就可以下载数据集到指定文件夹了。

2. 本地安装kaggle API

(1)安装kaggle API
进入Anaconda Prompt界面,创建一个合适的项目环境并激活该环境。conda 命令的使用可以参考我写的另外一篇博文【博文链接】。注意: 如果本地机器安装了python软件,也可以从cmd命令提示窗口安装kaggle API。
在激活的环境中调用命令安装kaggle软件,

pip install kaggle

受网速影响pip直接安装比较慢,可以选择清华源镜像安装的方式。
‘’’
pip install kaggle -i https://pypi.tuna.tsinghua.edu.cn/simple
‘’’
在这里插入图片描述
成功安装kaggle API之后打开C:\Users\***\文件目录,没有发现.kaggle文件夹。

在这里插入图片描述

此时,可以在Anaconda Prompt界面调用命令:

kaggle competitions list

界面虽然会报错,主要原因是没有从网站上加载kaggle.json密钥文件到本地端,但是在C盘我们刷新界面后会发现已经有.kaggle文件夹。
在这里插入图片描述
在这里插入图片描述
(2)安装密钥文件绑定用户
将提示的kaggle.json文件从kaggle网站下载并放入.kaggle文件夹后就可以畅通无阻的使用网站进行业务处理。
如何形成属于自己的密钥文件呢?
点击kaggle网页右上角的用户头像,选择Settings设置,下拉界面到API部分,选择Create New Token,确认继续之后电脑会自动下载一个kaggle.json文件。
还没有完事!!!
需要将文件放置于C:\Users\***\文件目录下的.kaggle文件夹中。
在这里插入图片描述
在这里插入图片描述
调用刚才我们创建.kaggle文件夹的命令

kaggle competitions list

此时命令窗口中会显示最近的竞赛信息,说明我们已经完成了kaggle的API安装和网站绑定工作!!
在这里插入图片描述
在耐心的看完下一章节内容,你就会的心应手的使用kaggle下载数据集了。

3. 加载数据集到本地机指定位置

在kaggle网站的datasets界面搜索自己想要的数据集,进入提供数据集的用户界面中。按照图示的顺序点击Copy API command复制命令,粘贴到Anaconda Prompt命令行窗口中,同时可以追加-p选项,指定数据文件下载到本地机的具体位置。
在这里插入图片描述

下面的命令是从kaggle上下载casia 篡改照片数据集

kaggle datasets download -d sophatvathana/casia-dataset -p E:\tamper_dataset

命令展示界面
在这里插入图片描述
数据集就会下载到指定文件夹当中。数据集下载速度超快呦!!!

4. 总结

从kaggle 网站上下载数据集既保证了速度又避免了网络的不稳定造成下载失败问题。该平台也可以上传代码作为自己的代码库,不过本人更习惯将代码上传到github上。希望本人整理的kaggle库使用技巧能够帮助到正在阅读本博客的你。如果有帮助,记得点赞和收藏呦😊

此外还有一篇博客针对kaggle数据集下载问题的几个问题的相关文章进行了整理【博客链接】。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/419619.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯面试:说说6大Nginx负载均衡?手写一下权重轮询策略?

尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50)中,最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格,遇到很多很重要的面试题: 1.讲一下什么是负载均衡,什么是轮询策略、…

Vue/cli不同环境下打包后js文件没有添加hash值-会导致缓存问题-解决

环境变量 包文件判断是根据NODE_ENV=production,这时会对应打包加上hash值,所以在配置不同环境对应命令的时候,把NODE_ENV=production加上 全局的环境变量需要以VUE_APP_ 开头 process.env.VUE_APP_ENV 会读取不到值 .env 文件配置 NODE_ENV=production 才会按照hash模式去…

一、selenium自动化简介selenium工具集

文章目录 一、简介二、组成部分三、selenium工具集3.1 Selenium IDE3.2 Selenium WebDriver3.3 Selenium Grid3.4 Appium 一、简介 官方网站 Selenium 是支持 web 浏览器自动化的一系列工具和库的综合项目。 它提供了扩展来模拟用户与浏览器的交互,用于扩展浏览器分…

如何通过商品id商品链接来获取淘宝商品主图详情图等数据?

在电子商务领域,获取商品信息,尤其是商品的主图、详情图以及其他相关数据,对于商家进行竞品分析、价格监控、商品上架前的信息整合等场景至关重要。淘宝作为中国最大的电子商务平台之一,其商品信息的获取更是众多商家和开发者关注…

Windows环境利用VS2022编译 libvpx 源码教程

libvpx libvpx 是一个开源的视频编码库,由 WebM 项目开发和维护,专门用于 VP8 和 VP9 视频编码格式的编解码处理。它支持高质量的视频压缩,广泛应用于视频会议、在线教育、视频直播服务等多种场景中。libvpx 的特点包括跨平台兼容性、硬件加速…

【Python】数据可视化之核密度

KDEPlot(Kernel Density Estimate Plot,核密度估计图)是seaborn库中一个用于数据可视化的函数,它基于核密度估计(KDE)这一非参数统计方法来估计数据的概率密度函数。KDEPlot能够直观地展示数据的分布特征&a…

《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》Chapter 1课件2024

每一轮备课都有新的感悟。 禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》 禹晶、肖创柏、廖庆敏《数字图像处理》资源二维码

位运算技巧总结

一、常见位运算操作 1、基础位运算 & 按位与 有0则0 | 按位或 有1则1 ^ 按位异或 相同为0 不同为1 2、确定数n的二进制位中第x位是0还是1 目的:是0返回0,是1返回1 (n >> x) & 1 思路:1除了第一位其他位都是0&a…

Docker 部署 Kafka (图文并茂超详细)

部署 Kafka ( Docker ) Kafka对于zookeeper是强依赖,保存kafka相关的节点数据,所以安装Kafka之前必须先安装zookeeper [Step 1] : 部署 Zookeeper -> 拉取 Zookeeper 镜像 ➡️ 启动 Zookeeper 容器 docker pull zookeeper:3.4.14 docker run -d --…

Qt/C++编写的Onvif调试助手调试神器工具/支持云台控制/预置位设置等/有手机版本

一、功能特点 广播搜索设备,支持IPC和NVR,依次返回。可选择不同的网卡IP进行对应网段设备的搜索。依次获取Onvif地址、Media地址、Profile文件、Rtsp地址。可对指定的Profile获取视频流Rtsp地址,比如主码流地址、子码流地址。可对每个设备设…

matlab读取NC文件(含group)

matlab读取NC文件(含group): NC文件数据结构: 代码: % 打开 NetCDF 文件 filename your_file.nc; % 替换为你的文件名% 使用 netcdf.open 函数打开文件 ncid netcdf.open(filename, NC_NOWRITE);% 查看文件中的组 …

手把手教你使用亚马逊云服务器创建EC2实例

陈老老老板🤴 🧙‍♂️本文专栏:生活(主要讲一下自己生活相关的内容)生活就像海洋,只有意志坚强的人,才能到达彼岸。 🧙‍♂️本文简述:如何使用亚马逊云服务器创建EC2实例。 🧙‍♂…

钢琴灯哪个牌子好?五款学生钢琴灯测评

在这个快节奏的时代,孩子们都面临着长时间用眼的问题,而长时间处于室内不良的光线环境很容易对孩子的视力健康产生影响,对于目前有娃的家庭,很多家长都在给孩子寻找可以提高室内光学环境的钢琴灯,钢琴灯作为一种通过专…

【分支-快速排序】

【分支-快速排序】 1. 颜色分类1.1 题目来源1.2 题目描述1.3 题目解析 2. 排序数组2.1 题目来源2.2 题目描述2.3 题目解析 3. 数组中的第K个最大元素3.1 题目来源3.2 题目描述3.3 题目解析 4. 库存管理 III4.1 题目来源4.2 题目描述4 .3 题目解析 1. 颜色分类 1.1 题目来源 7…

如何使用QT完成记事本程序的UI界面布局

每日QT技巧查询表-CSDN博客 会持续更新记事本编写的全部过程,关注不迷路 一、相关控件 ①水平和垂直布局 ②按键 ③文本框 ④水平弹簧 ⑤标签 ⑥Widget 二、控件使用方法 1、PushButton 拖出三个按键,并对其进行命名,两处地方命名可以不一…

数据结构——线性表(顺序存储结构和单链表结构)

线性表的定义 线性表(List):由零个或多个数据元素组成的有限序列。 (1)它是一个序列,也就是元素之间有个先来后到的; (2)若元素有多个,则第一个元素无前驱…

[数据集][目标检测]人脸口罩佩戴目标检测数据集VOC+YOLO格式8068张3类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):8068 标注数量(xml文件个数):8068 标注数量(txt文件个数):8068 标注…

Spring Boot实现文件上传和下载

1.背景 项目中经常会有上传和下载的需求&#xff0c;这篇文章简述一下springboot项目中实现简单的上传和下载。 2.代码工程 实验目标 实现简单的文件上传和下载 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://…

JDBC:连接数据库

文章目录 报错 报错 Exception in thread “main” java.sql.SQLException: Can not issue SELECT via executeUpdate(). 最后这里输出的还是地址&#xff0c;就是要重写toString()方法&#xff0c;但是我现在还不知道怎么写 修改完的代码&#xff0c;但是数据库显示&#…

Android 10.0 mtk平板camera2横屏预览旋转90度横屏拍照图片旋转90度功能实现

1.前言 在10.0的系统rom定制化开发中,在进行一些平板等默认横屏的设备开发的过程中,需要在进入camera2的 时候,默认预览图像也是需要横屏显示的,在上一篇已经实现了横屏预览功能,然后发现横屏预览后,拍照保存的图片 依然是竖屏的,所以说同样需要将图片也保存为横屏图标…