Skip to content

Latest commit

 

History

History
108 lines (69 loc) · 4.84 KB

chapter3.1_data-driven-approach.md

File metadata and controls

108 lines (69 loc) · 4.84 KB

GitHub 微信公众号 知乎 B站 CSDN

第 3 章 图像分类

作者: 张伟 (Charmve)

日期: 2021/06/13


3.1 数据驱动方法

3.1.1 语义上的差别

图像分类是计算机视觉中一个核心的任务,人脑和计算机中对图像的描述在语义上不同,图像在计算机中以 channel * height * width 的形式描述,如下图3.1所示。

image

图3.1

3.1.2 图像分类任务面临着许多挑战

  • 视角变换 Viewpoint variation

image

  • 背景混乱 Background Clutter

image

  • 光照条件 IIIumination

image

  • 遮挡 Occlusion

image

  • 变形 Deformation

image

  • 类间差异 Intraclass variation

image

3.1.3 图像分类器

图像分类器不像排序算法,知道每一步该做什么

image

image

3.1.4 数据驱动的方法

分为train和predict两步,用大量的图像数据进行训练,再使用训练得到的模型进行预测,具体为:

  • (1) 收集图标和标签的数据集
  • (2) 使用机器学习训练一个分类器。
  • (3) 使用分类器测试新图片。

最初始的分类器:最近邻算法,下一节将会详细介绍。

image