Skip to content

一、使用卷积神经网络识别手写数字任务简介

1、任务简介

  • 什么是识别手写数字?比如说你在纸上写了一个数字,拍了一张照片传到我们的模型里,然后我们的模型就可以判断你写的这个数字是 0-9 的哪个数字。
  • 这项任务看似简单,其实非常非常的困难,我们人去看图片识别数字是一件非常简单的事情,这个小朋友都可以做到。
  • 但是对于计算机来说,处理这种非结构化的数据,也就是图片是非常困难的,比如说我们写的数字稍微偏一点儿、歪一点儿、长一点儿、短一点儿,对计算机来说都是完全不一样的信息。且我们的图片最后会变成一个个像素值传还给计算机,对计算机来说,识别出来的内容随时都有可能是不一样的数字。
  • 那么计算机它如何处理这种千变万化的状态呢?这就要用到卷积神经网络了。

2、操作步骤

  • 加载 MNIST 数据集 —— 第一步还是加载数据集,这次我们要加载的是 MNIST 数据集,这个数据集其实就是一张巨大的雪碧图,在这个雪碧图里面将会有非常非常多的手写数字。
  • 构建卷积神经网络并训练 —— 将会介绍卷积神经网络它都包含哪些层,每个层大致的原理是什么样的,以及功能是什么样的。
  • 使用Canvas绘制数字并预测 —— 用鼠标在canvas画板上写数字,之后把canvas的数据转换成图片,然后把图片转化为Tensor,最后会把这个转化后的 Tensor 输入到模型里面进行预测。

更详细内容请点击:https://pzfqk98jn1.feishu.cn/wiki/J1qvw2LQHiEqvLk2rXkca5O0n8d?from=from_copylink

Released under the MIT License.