小物体检测和交通标志检测

小物体检测和交通标志检测: History

View Latest Version

Please note this is an old version of this entry, which may differ significantly from the current revision.

Subjects: Computer Science, Artificial Intelligence

Contributor:

Zi Yan

交通标志的检测容易受到天气变化、部分遮挡和光照强度的影响，增加了自动驾驶实际应用中安全隐患的数量。

small object detection
multi-scale feature fusion
loss function
data

1. 简介

交通标志检测系统是智能交通系统的重要组成部分。它可以有效地为驾驶员提供当前的道路交通信息，也可以保证智能车辆控制系统的运行安全。近年来，由于该技术对交通安全的深远影响，这一领域被许多研究人员深入研究。

传统的交通标志检测算法主要集中在颜色分割上，结合形状和轮廓等特征进行特征提取，然后通过分类器完成特征分类，实现交通标志的识别[1，2，3，4，5，6].传统技术中的手工制作特征是人类疲惫不堪，缺乏足够的稳健性来应对复杂多变的交通环境。近年来，基于深度卷积神经网络的交通标志检测算法得到了广泛的发展。它们主要分为两类：以基于区域的卷积网络（R-CNN）系列[7，8，9]为代表的两阶段目标检测算法，以及以你只看一次（YOLO）系列[10，11，12]和单次多盒检测器（SSD）系列[13，14]为代表的单阶段目标检测算法。].两阶段算法在准确性方面取得了显著成果，但缺乏实时性意味着难以将大多数方法应用于实际检测任务。研究人员更关注单阶段算法，因为它可以预测对象类别并同时生成边界框，能够胜任具有高实时要求的检测任务。Zhang等[15]介绍了一种基于YOLOv3 [10]算法的多尺度空间金字塔池块，旨在精确实现交通标志的实时定位和分类。该算法在清华-腾讯100K（TT100K）数据集[16]上的平均精度（mAP）令人满意，但仅检测到每秒23.81帧（FPS）。Wu等人[17]提出了一种基于SSD [13]结合感受野模块（RFM）和路径聚合网络（PAN）[18]的交通标志检测模型，在德国交通标志检测基准（GTSDB）数据集[95]和CSUST中国交通标志检测基准（CCTSDB）数据集[4]，但对设备的存储容量和算力要求很高。Yan等人[95]提出了一种基于YOLOv9的辅助信息增强YOLO算法，该算法在TT19K数据集上实现了20.21%mAP和5.84 FPS的检测速度，但其对极端天气和照明变化等复杂场景的鲁棒性尚未得到验证。

在雾、强光、光线不足等恶劣环境下交通标志检测的研究引起了众多学者的关注。Hnewa等人[22]提出了一种新的多尺度域自适应YOLO框架，该框架从模糊的远距离图像区域中提取域不变特征，并对雾图像数据集具有显着影响。Fan等[23]提出了一种基于注意力机制的多尺度交通标志检测算法，可以有效降低光照变化对交通标志检测的影响。Zhou等人[24]提出了一种基于高分辨率交通标志分类的注意力网络，以克服冰雪环境的复杂因素。然而，上述方法使用的是单个场景，无法有效地应用于多场景检测任务。

2. 小物体检测

通常有两种方法可以定义小对象。一个定义指出，对象大小必须小于原始大小的 0.12% 才能被视为小对象。本文以此为参考。另一种是绝对大小定义，即对象大小必须小于 32 × 32 像素。因此，小物体检测一直是物体检测领域难以解决的课题。目前，多尺度融合、感受野角、高分辨率检测和情境感知检测是小目标检测的主要方法。在高分辨率检测中[26，27]，建立并预测高分辨率特征图以获得精细细节，但上下文信息会丢失。此外，为了获得对象的上下文信息，有几种方法[28，29]使用自上而下和自下而上的路径来融合不同层的特征，这可以大大增加它们的感受野。本文以特征金字塔网络（FPN）[30]+PAN作为网络的特征融合模块，在模型骨干中引入多注意力机制，增强上下文学习，拓展感受野，有效提高小目标检测精度。

3. 交通标志检测

交通标志检测的关键是提取可区分的特征。由于计算机能力和可用数据集大小的限制，传统方法的性能取决于手动提取特征的有效性，例如基于颜色的方法[31，32]和基于形状的方法[33，34]。这些方法也容易受到极端天气、光照变化、可变拍摄角度、障碍物等因素的影响，只能应用于有限的场景。

为了促进真实场景中的交通标志检测，许多作者发表了优秀的交通标志数据集，如智能安全汽车实验室（LISA）数据集[35]，GTSDB，CCTSDB和TT100K。由于TT100K数据集涵盖了部分遮挡、照明变化和视角变化，因此它比其他数据集更接近真实场景。随着深度学习技术的发展，以及几个优秀的公共数据集的发布，基于深度学习的交通标志检测算法的性能相比传统的交通标志检测算法有了显著的提升。Zhang等人[36]使用级联R-CNN [8]结合样本平衡法检测交通标志，在CCTSDB和GTSDB上都取得了理想的检测结果。Sun等人[37]提出了一种特征表达式增强型SSD检测算法，该算法在TT81K和CCTSDB上分别实现了26.90%和52.100%的mAP。然而，该算法的检测速度仅为22.86 FPS和25.08 FPS，无法实现实时性能。Liu等[38]提出了一种对称交通标志检测算法，该算法通过降低网络的计算开销来优化时延问题，同时提高复杂环境下的交通标志检测性能，例如规模和照明变化，在CCTSDB数据集上实现了97.8%的mAP和84 FPS。然而，多个模块的整合导致全球信息获取不足。

This entry is adapted from the peer-reviewed paper 10.3390/s23115307

© Text is available under the terms and conditions of the Creative Commons Attribution (CC BY) license; additional terms may apply. By using this site, you agree to the Terms and Conditions and Privacy Policy.