[深度学习入门案例1]基于Keras的手写数字图像识别

文章目录

 一、工具与环境

二、深度学习环境的搭建

1.安装Anaconda

2.创建虚拟环境

第1步:打开Anaconda的命令窗口,即Anaconda Prompt

 第2步:使用命令创建指定版本的python环境(这里以py36命令环境名称举例)

3.切换环境

4.下载项目所需的工具包

 5.设置Pycharm的环境为创建好的环境

三、基于Keras的手写数字图像识别项目运行与测试

1.核心代码

2.识别的手写图片集合

3.识别的基本原理

4.运行与测试

 四、分析与小结

 参考文章


 一、工具与环境

  • Pycharm 2022.1.4
  • conda version : 4.5.4
  • python version : 3.6.5.final.0
  • platform : win-64

二、深度学习环境的搭建

1.安装Anaconda

        Anaconda是一个开源的Python发行版本,用来管理Python相关的包,使用anaconda可以很方便的切换到不同的python环境,使用不同的深度学习框架来开发项目,非常高效!

具体下载与安装步骤,请参照这位大佬的文章

史上最全Anaconda安装与使用教程icon-default.png?t=N4P3https://blog.csdn.net/wq_ocean_/article/details/103889237?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168594896716800180669116%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168594896716800180669116&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-2-103889237-null-null.142^v88^control_2,239^v2^insert_chatgpt&utm_term=Anaconda%E5%AE%89%E8%A3%85&spm=1018.2226.3001.4187

2.创建虚拟环境

第1步:打开Anaconda的命令窗口,即Anaconda Prompt

Anaconda安装成功后会附带,在开始栏处

 第2步:使用命令创建指定版本的python环境(这里以py36命令环境名称举例)

conda create -n py36 python=3.6

3.切换环境

        默认环境是base,我们需要创建一个指定版本的环境供我们使用,可以理解为开发一个项目所需要创建的指定环境,这样不同项目之间环境是相互隔离开的 。使用命令activate +环境名即可实现环境的切换。

activate py36

切换到py36环境后,输入conda info 命令,出现如下信息即表面环境创建成功!

4.下载项目所需的工具包

        在成功切换到py36(自己创建的环境)之后,依次在Anaconda Prompt中执行下面的命令来下载所需工具包,注意:由于默认下载源在国外,所以下载速度会很慢,我们可以使用国内的一些镜像来下载,速度很快。只需要在下面每一个命令后面加上 -i 镜像地址 即可。

我使用的是清华大学的镜像源: -i  https://pypi.tuna.tsinghua.edu.cn/simple

pip install scipy -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install matplolib -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install scipy -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install keras==2.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install tensorflow==1.14.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

 5.设置Pycharm的环境为创建好的环境

点击Pycharm右下角Add Interpreter

如下图所示,选择Anaconda安装目录下 Scripts文件夹下的conda.exe

(有些也会出现在根目录下,选择根目录下的conda.exe也行,根据Pycharm不同版本会有区别)

 

 Pycharm切换解释器之后,至此,环境准备工作完成了


三、基于Keras的手写数字图像识别项目运行与测试

1.核心代码

train_cnn.py

#步骤01 入所需要的模块
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
import numpy as np
np.random.seed(10)#步骤02 下载mnist数据集、读取数据集
(x_Train, y_Train) , (x_Test, y_Test) = mnist.load_data()#步骤03 将图像特征值转化为6000,28,28,1的4维矩阵
x_Train4D = x_Train.reshape(x_Train.shape[0], 28, 28,1).astype('float32')
x_Test4D = x_Test.reshape(x_Test.shape[0], 28, 28, 1).astype('float32')#步骤04 进行标准化
#将像素范围设置在【0,1】
x_Train4D_normalize = x_Train4D / 255
x_Test4D_normalize = x_Test4D / 255#步骤05 label进行一位有效编码转换
#将标签转成读热码
y_TrainHot = np_utils.to_categorical(y_Train)
y_TestHot = np_utils.to_categorical(y_Test)#=>建立模型
#步骤01 定义模型
model = Sequential()#步骤02 建立卷积层1
model.add(Conv2D(filters=16, # filter = 16 建立16个滤镜
# kernel_size = (5,5) 每一个滤镜是5 × 5的大小
kernel_size=(5,5), # padding = 'same' 设置卷积运算产生的图像大小不变
padding='same', 
#输入的图像形状为28*28,1代表单色灰度,3代表RGB
input_shape= (28, 28, 1),
# activation设置激活函数为relu建立池化层1
activation='relu'))#步骤03 建立池化层1
model.add(MaxPooling2D(pool_size=(2,2)))#缩减采样,输出16个14*14图像#步骤04建立卷积层2
model.add(Conv2D(filters=36,#建立36个滤镜
kernel_size=(5,5),#每一个滤镜是5 × 5的大小
padding='same',#Convolution完成后的图像大小不变
activation='relu'#输出36个14*14的图像
))#步骤05 建立池化层2,加入Dropout避免Overfitting
model.add(MaxPooling2D(pool_size=(2,2)))#图像大小变为7*7
# 加入DropOut(0.25),每次训练时,会在神经网络中随机放弃25%的神经元,避免过拟合建立神经网络(平坦层,隐藏层,输出层)建立平坦层
model.add(Dropout(0.25))#步骤06 建立平坦层
model.add(Flatten())#长度是36*7*7个神经元#步骤07 建立隐藏层
model.add(Dense(128, activation='relu'))
# 把DropOut加入模型中,DropOut(0.5)在每次迭代时候会随机放弃50%的神经元,避免过拟合
model.add(Dropout(0.5))
# 建立输出层,一共10个单元,对应0-9一共10个数字。使用softmax进行激活
model.add(Dense(10, activation='softmax'))
# 查看模型摘要
print(model.summary())#=>进行训练
#步骤01 定义训练方式
# 定义训练方式compile
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])#步骤02 开始训练
train_history = model.fit(x = x_Train4D_normalize, y = y_TrainHot,
validation_split=0.2,
#将80%作为训练数据,20%作为测试数据
epochs=10,#执行10个训练周期
batch_size=300,#每一批300项数据
verbose=2#参数为2表示显示训练过程
)

train_cnn_model.py

from keras.datasets import mnist
from keras.utils import np_utils
import numpy as np
np.random.seed(10)(x_Train, y_Train) , (x_Test, y_Test) = mnist.load_data()x_Train4D = x_Train.reshape(x_Train.shape[0], 28, 28,1).astype('float32')
x_Test4D = x_Test.reshape(x_Test.shape[0], 28, 28, 1).astype('float32')x_Train4D_normalize = x_Train4D / 255
x_Test4D_normalize = x_Test4D / 255
y_TrainHot = np_utils.to_categorical(y_Train)
y_TestHot = np_utils.to_categorical(y_Test)from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2Dmodel = Sequential()
model.add(Conv2D(filters=16, kernel_size=(5,5), padding='same', input_shape = (28, 28, 1), activation='relu'))
# 参数说明
# filter = 16 建立16个滤镜
# kernel_size = (5,5) 每一个滤镜是5 × 5的大小
# padding = 'same' 设置卷积运算产生的图像大小不变
# input_shape = (28, 28, 1) 第一二维代表输入图像的形状是28 × 28,第三维因为是单色灰度图像,所以最后维数值是1
# activation设置激活函数为relu建立池化层1
model.add(MaxPooling2D(pool_size=(2,2)))
# 输入参数为pool_size=(2,2),执行第一次缩减采样,将16个28 ×28的图像缩小为16个14 × 14的图像建立卷积层2,将16个图像转化为36个图像,不改变图像大小,仍为14 × 14
model.add(Conv2D(filters=36, kernel_size=(5,5), padding='same', activation='relu'))
# 加入池化层2,并加入DropOut避免过拟合
model.add(MaxPooling2D(pool_size=(2,2)))
# 执行第二次缩减采样,将14 × 14图像转换为7 × 7图像
model.add(Dropout(0.25))
# 加入DropOut(0.25),每次训练时,会在神经网络中随机放弃25%的神经元,避免过拟合建立神经网络(平坦层,隐藏层,输出层)建立平坦层
model.add(Flatten())
# 将之前步骤建立的池化层2,一共有36个7 × 7的图像转化为一维向量,长度是36 × 7 × 7 = 1764, 也就是1764个float数,对应1764个神经元建立隐藏层,一共128个神经元
model.add(Dense(128, activation='relu'))
# 把DropOut加入模型中,DropOut(0.5)在每次迭代时候会随机放弃50%的神经元,避免过拟合
model.add(Dropout(0.5))
# 建立输出层,一共10个单元,对应0-9一共10个数字。使用softmax进行激活
model.add(Dense(10, activation='softmax'))
# 查看模型摘要
print(model.summary())
# # 进行训练
# 定义训练方式# # 加载之前训练的模型
try:# model.load_weights("SaveModel/minist_model.h5")model.load_weights("SaveModel/minist_model_graphic.h5")print("加载模型成功!继续训练模型")
except :print("加载模型失败!开始训练一个新模型")model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])# 开始训练
train_history = model.fit(x = x_Train4D_normalize, y = y_TrainHot,validation_split=0.2, epochs=10, batch_size=300, verbose=2)# model.save_weights("SaveModel/minist_model.h5")
model.save("SaveModel/minist_model_graphic.h5")print("Saved model to disk")

predict_one_img.py

import cv2
from keras.models import load_modelimg = cv2.imread("./pic/6.jpg")
print(img.shape)
grey_img = img[:,:,0:1]
print(grey_img.shape)
shape_img= (grey_img.reshape(1, 28, 28, 1)).astype('float32')/255# model = load_model('SaveModel/minist_model.h5')  #选取自己的.h模型名称
model = load_model('SaveModel/minist_model_graphic.h5')  #选取自己的.h模型名称
prediction = model.predict_classes(shape_img)
print('该手写数字图像为:'+'%d'%prediction[0])

2.识别的手写图片集合

 

3.识别的基本原理

        采用的数据集是MNIST数据集。在该数据集中每张图片由28x28个像素点构成,每个像素点用一个灰度值表示。如下是数字1的一个例子,我们的目的是做出一个模型,将这784个数值输入这个模型,然后它的输出结果就为1。

4.运行与测试

  • 先读取数据集

  •  训练数据模型

  • 识别手写数字图像

 四、分析与小结

        本次通过基于Keras手写数字图像识别这一经典案例,初步学习了机器学习中另一个重要的分支领域——深度学习的内容,采用的数据集是MNIST数据集。在该数据集中每张图片由28x28个像素点构成,每个像素点用一个灰度值表示。首先是要使用pip命令行下载程序所要导入的工具包,同时使用activate py36 指令将python环境切换到我们创建并导入相关工具包的环境下,编译器采用pycharm,将程序跑起来。首先要进行数据集的训练,然后再用训练好的模型去识别6.jpg这个手写数字图像,控制台打印出识别的结果。

        经过这个入门案例的学习,让我对机器学习领域产生了浓厚的学习兴趣,本质上是用海量的数据作为输入,让计算机去训练分析出一个模型,我们可以将其视为一个函数,一个“黑盒子”,然后用它去识别指定的数据,给出分析的结果,该过程类比于人脑总结以往经验,来预测未来指导行动的过程是异曲同工的,非常奇妙!!

 参考文章

深度学习实例——Keras实现手写数字识别icon-default.png?t=N4P3https://blog.csdn.net/yjw123456/article/details/103811112?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168594730916800222827149%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168594730916800222827149&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-103811112-null-null.142^v88^control_2,239^v2^insert_chatgpt&utm_term=Keras%E6%89%8B%E5%86%99%E6%95%B0%E5%AD%97%E5%9B%BE%E5%83%8F%E8%AF%86%E5%88%AB&spm=1018.2226.3001.4187【深度学习实战—1】:基于Keras的手写数字识别(非常详细、代码开源)icon-default.png?t=N4P3https://blog.csdn.net/qq_42856191/article/details/121420268?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168594730916800222827149%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168594730916800222827149&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-2-121420268-null-null.142^v88^control_2,239^v2^insert_chatgpt&utm_term=Keras%E6%89%8B%E5%86%99%E6%95%B0%E5%AD%97%E5%9B%BE%E5%83%8F%E8%AF%86%E5%88%AB&spm=1018.2226.3001.4187

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/32121.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

发布变更又快又稳?腾讯运维工程师经验首发

导读| 如何让功能缺陷修复快速上线?版本发出问题时怎样快速回退?效率提升后质量掉队?为解决这些常让运维工程师头疼的事情,本栏目特邀腾讯知名运维工程师袁旭东,讲述对象存储COS的发布演进过程,为各位开发者…

国内外人工智能AI工具网站大全(非常详细)从零基础入门到精通,看完这一篇就够了

国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具 2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移除2.4、AI图片无损调整2.5、AI图片优化修复2.6、AI图片物体抹除 三、AI音频工具四、AI视频工…

解析软件测试未来的发展潜力

大家都知道最近 ChatGPT 爆火,国外巨头争相宣布自己的相关计划,国内有点实力的企业也在亦步亦趋地跟进。不出意料的是,关于测试职业要被淘汰的话题又(为什么要说又?)在扎堆出现,内容跟之前还是大…

软件测试现状以及行业分析

大家都知道最近 ChatGPT 爆火,国外巨头争相宣布自己的相关计划,国内有点实力的企业也在亦步亦趋地跟进。不出意料的是,关于测试职业要被淘汰的话题又(为什么要说又?)在扎堆出现,内容跟之前还是大…

基于OpenGL的地形建模技术的研究与实现

毕业论文 基于OpenGL的地形建模技术的研究与实现 诚信声明 本人郑重声明:本设计(论文)及其研究工作是本人在指导教师的指导下独立完成的,在完成设计(论文)时所利用的一切资料均已在参考文献中列出。 本人签…

国际web短信软件平台开发定制接口通道分类|移讯云短信系统

国际web短信软件平台开发定制接口通道分类|移讯云短信系统 平台外放接口介绍 支持接入CMPP接口,支持SMPP通道接入,支持外放CMPP接口(其他平台可以通过CMPP接入我平台),支持HTTP API JSON 接口,支持HTTP A…

短信API接口

一、关于短信API接口 第三方短信服务商提供短信API接口,短信一般是编辑好内容,调用接口发送即可。我们这里提供一个注册好的账号,其中短信API服务器地址为: https://itdage.com/kkb/kkbsms 参数列表为: key&#xff1a…

国际短信系统平台发送接口说明方法|网页短信平台开发搭建-移讯云短信系统

国际短信系统平台发送接口说明方法|网页短信平台开发搭建-移讯云短信系统 此接口为发送接口可直接通过pos直接调用 直接发送,源码短信平台搭建平台时 包含此功能,在客户端中可查看API接口文档 接口名称:自定义短信发送接口 接口方式&#x…

短信平台哪个好用?记录短信接口使用感受

目前市场上的企业短信平台众多,主要分为三大类,即国内三大运营商、云短信平台和专一短信平台服务商。那么哪些短信平台更好用呢? 其实没有最好的短信群发平台,只有最适合的短信群发平台,不同类型的短信平台都有自己的…

各大短信平台接入方法

短信平台有哪些 最为著名的三大平台:华为短信、阿里短信、腾讯短信;根据各家官网的接入文档进行使用 短信平台接入流程 需要具备哪些信息 各家所需信息不太相同,大致如下: 1.app key 2.app 秘钥 3.app 签名 3.发送者id 4.模版&…

发送短信工具类(亿美短信平台接口)

 一般我们都是需要接入第三方短信平台,我这边是接入亿美的短信平台sdk,在我们的项目中只需要导入emayclient.jar就可以使用发送接口,当然前提是你有账户和密码,就涉及到购买了。不过其他不多讲&#xff0…

国际web短信软件平台开发搭建后台功能|移讯云短信系统

国际web短信软件平台开发搭建后台功能|移讯云短信系统 特色功能模块功能列表 1:通道路由模块 1.1:通道地区设置 1.2:通道关键词分流 1.3:白名单独立通道设置 1.4:通道分组设置 1.5:通道分组分配 1.6…

调用Android短信软件进行短信群发

最近想做一个可以群发短信的功能,但又不想自己做一个发短信的界面,之前也做过利用Intent调用系统发短信功能,这个网上也有大把人发过。 String mobile "18900000000" Intent intent new Intent(Intent.ACTION_VIE…

短信接口平台

最近忙着弄短信接口的平台程序,现在已经基本做完,跑起来看着还挺顺的。我简单介绍一下。 详细说明 中国电信和中国移动的短信协议要求客户端主动连接到网关收取信息,并且接受的连接只能有一个。因此客户端的接收程序必须尽快处理收到的信息…

什么是短信平台api接口?

自从人类诞生了手机,短信便随之而来,虽然后来有了更多的即时通信工具,如QQ和微信,个人用短信的机会已经很少了,但是对于企业公司来说,短信一直是非常方便的信息传递工具。 那些带有营销性质的企业和商家会通…

营销短信API,免费接口

接口地址: https://api.kertennet.com/live/sms 返回格式: json 请求方式: GET 请求示例: https://api.kertennet.com/live/sms?text短信代发&sign可腾代发&phoneNum1782016XXXX 请求参数说明: 返回数据:

关于origin简单作图

1.首先将要分析的数据放入表格中。 2.其次打开origin作图软件,点击File----import—Excal 导入表格 3.点击箭头所指图标 4.双击图中的数据黑点既可以调剂点的形状和数据 5.x,y轴的调节同上。

R语言中作图的一些基本代码

文章目录 利用par()函数设置公共绘图参数(重点)在已有的plot图像中如何添加线条做出三维表面图控制坐标轴显示的区域在指定坐标中做注释标题和xy的标签标题中的字体通过title()对图形的坐标轴名称和图形标题进行编辑(重点)是否显示坐标轴是否显示坐标刻度…

Excel作图时,将一列设置为横坐标

原始需求 原始数据如下 直接选择两列数据作图会变成这个样子(不是想要的效果) 正确做法 1、先选择纵坐标数据 2、插入折线图 3、右键横坐标选择数据 4、点击笔的按钮 5、点此按钮,选择相应数据,回车 6、就达到想要的效果了 7、添…