第 3 章 图像分类
作者: 张伟 (Charmve)
日期: 2021/06/13
- 第 3 章 图像分类
- 3.1 数据驱动方法
- 3.1.1 语义上的差别
- 3.1.2 图像分类任务面临着许多挑战
- 3.1.3 数据驱动的方法
- 3.2 k 最近邻算法
- 3.2.1 k 近邻模型
- 3.2.2 k 近邻模型三个基本要素
- 3.2.3 KNN算法的决策过程
- 3.2.4 k 近邻算法Python实现
- 小结
- 参考文献
- 3.3 支持向量机
- 3.3.1 概述
- 3.3.2 线性支持向量机
- 3.3.3 从零开始实现支持向量机
- 3.3.4 支持向量机的简洁实现
- 3.4 逻辑回归 LR
- 3.4.1 逻辑回归模型
- 3.4.2 从零开始实现逻辑回归
- 3.4.3 逻辑回归的简洁实现
- 3.5 实战项目 3 - 表情识别
- 3.6 实战项目 4 - 使用卷积神经网络对CIFAR10图片进行分类
- 小结
- 参考文献
- 3.1 数据驱动方法
图像分类是计算机视觉中一个核心的任务,人脑和计算机中对图像的描述在语义上不同,图像在计算机中以 channel * height * width 的形式描述,如下图3.1所示。
图3.1
- 视角变换 Viewpoint variation
- 背景混乱 Background Clutter
- 光照条件 IIIumination
- 遮挡 Occlusion
- 变形 Deformation
- 类间差异 Intraclass variation
图像分类器不像排序算法,知道每一步该做什么
分为train和predict两步,用大量的图像数据进行训练,再使用训练得到的模型进行预测,具体为:
- (1) 收集图标和标签的数据集
- (2) 使用机器学习训练一个分类器。
- (3) 使用分类器测试新图片。
最初始的分类器:最近邻算法,下一节将会详细介绍。