如何下载Kaggle中的数据集

2024-03-21 22:56:14 星期四

1. 在Kaggle官网直接下载

登录官网下载,过程略。

2. 用Windows+R使用Kaggle API下载

附上参考的博文:

kaggle注册以及数据集下载全流程

Kaggle注册问题,不FQ也能有人机验证

windows从kaggle中下载数据集

从kaggle上下载数据集方法(亲测有效)

3. 在Colab中使用Kaggle API下载

参考教材:《Python深度学习》(第2版)

Colab网址:https://colab.google/

前面获取kaggle API的步骤同2。

身份验证。登录Kaggle网站,进入账户设置界面,找到API。 单击Create New API Token,生成一个 Kaggle.json 密钥文件。

在Colab中下载Kaggle数据集。 这里开始与2不同:

步骤1:选择刚刚下载的kaggle.json文件,把文件上传到Colab本地运行。该文件自动上传到content文件夹下。

# 将API密钥的JSON文件上传到Colab会话中

from google.colab import files

files.upload()

步骤2:创建~./kaggle文件夹,自动创建在root文件夹下,并将密钥文件(此时在content文件夹中)复制到~./kaggle文件夹下。

# 创建~/.kaggle文件夹

!mkdir ~/.kaggle

# 将密钥文件kaggle.json复制过去

!cp kaggle.json ~/.kaggle/

# 确保该文件只能由自己读取

!chmod 600 ~/.kaggle/kaggle.json

步骤3:下载数据集,自动下载到content文件夹下。

# 下载要使用的数据,在 Colab 单元格中运行命令

!kaggle competitions download -c dogs-vs-cats

步骤4:解压数据集,自动解压到content文件夹下。

# 最后,用静默方式(不向屏幕输出任何信息)解压训练数据,注意逐层解压。

!unzip -qq dogs-vs-cats.zip

!unzip -qq train.zip

恭喜顺利完成!