一、卷积神经网络(CNN)

(一)应用领域

1、2012年深度学习起来后,计算机视觉(CV)错误率大幅下降,2015年已经低于人类,之后便不再深入了

2、卷积神经网络应用领域

传统神经网络 中间矩阵特别大 速度慢,于是提出了卷积神经网络

  • 检测任务:追踪图像,例如yolov8系列

  • 分类与检索:图像分类,拍照搜图(淘宝、电商之类的)

  • 超分辨率重构:图像优化(wifu2x、去马赛克之类的)

  • 医学任务:细胞检测、人体透视图动态分析(看病变)、OCR、车牌识别

  • 无人驾驶:

  • 人脸识别

(二)卷积的作用

1、卷积神经网络与传统网络区别

  • 输入参数传统的是一列特征,而卷积的是直接输入原始的(多维)

  • 整体架构:输入层、卷积层(提取特征)、池化层(压缩特征)、全连接层

2、卷积做了什么

  • 对原始图像分割成同样的小区域,每个小区域的特征是不一样的

  • 选择一种计算方法,对每个小区域计算应该的特征值

(三)卷积特征值计算方法

1、图像颜色通道(RGB三个通道)

  • 三个通道分别计算特征值,然后相加,记得有个偏执项

(四)得到特征图表示(feature map)

  • 可多尺度多粒度 用多个filter去卷出特征图

(五)步长与卷积核大小对结果的影响

  • 多层堆叠卷积,
  • 卷积设计参数
    • 滑动窗口步长:步长:1、2、3…,越小细粒度越高,越大越粗糙,得到特征越粗糙
    • 卷积核大小:最小3x3的
    • 边缘填充
    • 卷积核个数