目标检测作为计算机视觉中最基本和最具挑战性的问题之一,近年来受到了极大的关注。它在过去二十年的发展可以看作是计算机视觉历史的缩影。如果我们把今天的目标检测看作深度学习力量下的一种技术美学,那么时光倒流20年,我们就会见证冷兵器时代的智慧。本文根据其技术演变广泛回顾了 400多篇目标检测论文,跨越了四分之一个世纪(从1990年代到2019年)。本文涵盖了许多主题,包括历史上的里程碑探测器、检测数据集、指标、检测系统的基本构建、加速技术以及最新最先进的检测方法。本文还综述了一些重要的检测应用,如行人检测、人脸检测、文本检测等,并深入分析了近年来它们面临的挑战和技术改进。
目标检测是一项重要的计算机视觉任务,用于检测数字图像中特定类别的视觉对象(如人类、动物或汽车)的实例。目标检测的目的是开发计算模型和技术,提供计算机视觉应用程序所需的最基本的信息之一:哪些对象在哪里?作为计算机视觉的基本问题之一,目标检测构成了许多其他计算机视觉任务的基础,例如实例分割、图像字幕、对象跟踪等。从应用角度来看,目标检测可以分为“一般目标检测”和“检测应用”两个研究课题,前者旨在探索在统一框架下检测不同类型目标的方法,以模拟人类的视觉和认知,后者则指特定应用场景下的检测,如行人检测、人脸检测、文字检测等。近年来,深度学习技术的快速发展为目标检测带来了新鲜血液,取得了显著的突破,并推动其成为前所未有的关注研究热点。目标检测现已广泛应用于许多实际应用中,如自动驾驶、机器人视觉、视频监控等。图1显示了过去二十年中与“目标检测”相关的出版物数量不断增加。
• 与其他相关综述的区别
近年来发表了许多关于一般目标检测的综述。本文与上述综述的主要区别总结如下:
• 目标检测的难点和挑战
尽管人们总是问“目标检测的困难和挑战是什么?”,但实际上,这个问题并不容易回答,甚至可能过于概括。由于不同的检测任务具有完全不同的目标和限制,因此它们的难度可能各不相同。除了不同视点下的物体、光照、类内变化等其他计算机视觉任务中的一些常见挑战外,物体检测的挑战包括但不限于以下几个方面:物体旋转和尺度变化(例如小物体)、准确的物体定位、密集和遮挡物体检测、检测速度等。在第4节和第5节中,我们将对这些主题进行更详细的分析。本文的其余部分组织如下。在第2节中,我们回顾了20年来目标检测的进化历史。第3节将介绍一些目标检测中的加速技术。第4节总结了最近三年的一些最先进的检测方法。一些重要的检测应用将在第5节中回顾。在第6节中,我们总结了本文,并对进一步的研究方向进行了分析。
责任编辑:木真 来源:星辰大海 AI领航