计算机视觉中的交通标志检测与识别:从传统方法到卷积神经网络
1. 计算机视觉问题的通用范式
解决计算机视觉问题的通用范式是使用更具信息性的向量(特征向量)来表示原始图像,并在从训练集中收集的特征向量上训练分类器。从分类的角度来看,有几种现成的方法,如梯度提升、随机森林和支持向量机,能够准确地对非线性决策边界进行建模。因此,解决计算机视觉问题主要取决于特征提取算法。
常见的特征提取方法包括尺度不变特征变换(SIFT)、方向梯度直方图(HOG)、Gabor滤波器组、局部二值模式(LBP)、特征袋和Fisher向量等。这些方法通常分几个步骤创建特征向量。例如,SIFT和HOG首先计算图像的梯度,然后在不同区域上池化梯度幅度并将它们连接起来,以创建最终的特征向量。同样,特征袋和Fisher向量从提取图像上显著点周围区域的特征向量(如HOG)开始,然后再次池化这些特征以创建更高级别的特征向量。
然而,尽管计算机视觉界付出了巨大努力,但上述手工设计的特征无法很好地对大量自然物体类别进行建模。卷积神经网络(ConvNets)、大型数据集和并行计算硬件的出现改变了计算机视觉的发展方向。与手工设计特征向量不同,卷积神经网络学习一种复合特征变换函数,使物体类别在特征空间中线性可分。
2. 卷积神经网络的崛起
近年来,卷积神经网络在自然物体分类和交通标志分类等不同任务中已经超越了人类。取得巨大成功后,卷积神经网络已成为从训练数据中学习特征的首选方法。
汽车行业是受卷积神经网络影响较大的领域之一。行人检测、汽车检测、交通标志识别、交通灯识别和道路场景理解等任务现在很少再使用手工制作的特征。