- 测试数据集:t10k-images-idx3-ubyte.gz(1.57 MB ,包含10,000个样本)。
- 测试数据集标签:t10k-labels-idx1-ubyte.gz(4.43 KB,包含10,000个样本的标签)
- 训练数据集:train-images-idx3-ubyte.gz (9.45 MB,包含60,000个样本)。
- 训练数据集标签:train-labels-idx1-ubyte.gz(28.2 KB,包含60,000个标签)。
参考文章:https://blog.csdn.net/bwqiang/article/details/110203835
- 6万条训练数据集里真正用来训练的只有5.5万条数据,还有5千条数据用来验证训练效果
使用TensorFlow读取数据集
import tensorflow.examples.tutorials.mnist.input_data as input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=False)
print(dir(mnist))
print("MNIST数据集的类型是: %s'" % (type(mnist)))
print("训练集的数量是:%d" % mnist.train.num_examples)
print("验证集的数量是:%d" % mnist.validation.num_examples)
print("测试集的数量是:%d" % mnist.test.num_examples)'''
['__add__', '__class__', '__class_getitem__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__match_args__', '__module__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmul__', '__setattr__', '__sizeof__', '__slots__', '__str__', '__subclasshook__', '_asdict', '_field_defaults', '_fields', '_make', '_replace', 'count', 'index', 'test', 'train', 'validation']
MNIST数据集的类型是: <class 'tensorflow.examples.tutorials.mnist.input_data._Datasets'>'
训练集的数量是:55000
验证集的数量是:5000
测试集的数量是:10000
'''