跳转至

运用 Harris 深度学习技术寻找红灯

原文链接: https://www.nv5geospatialsoftware.com/Learn/Blogs/Blog-Details/finding-red-lights-with-harris-deep-learning

14380 评价此文章:

5.0

运用 Harris 深度学习技术寻找红灯

Barrett Sather 2018年2月9日,星期五

差不多过了一年,我终于有时间训练一个神经网络,来执行在图像中寻找红色交通灯的任务,使用的是我们称之为 MEGA 的机器学习技术。在 2016 年底的一篇文章中,我以训练过程的示例标注和样本提取作为开始,今天我想讨论一下这个过程及其结果!

在用红灯示例以及更多非红灯示例对图像进行标注之后,MEGA 神经网络会使用从图像中裁剪出的图像块进行训练。随着时间的推移,MEGA 训练器利用卷积网络来猜测它认为每个训练样本是什么。无论猜测正确与否,网络的权重随后都会被调整,使得模型随着训练的继续而变得更加准确。这可以被看作是一个非常精巧的“猜想与验证”过程。

一旦网络训练完成,你就可以给它从未见过的全新图像进行分类。下面是我们将要使用的测试图像,它并未用于训练过程(否则就是作弊了)。

图片

这是红灯的分类结果图像,其数值单位是每个像素是红灯的十进制概率(0.0 – 1.0)。

图片

这是叠加在原始图像上的热力图。你会注意到图像的边缘没有被分类,因为图像卷积的每一步都必须有一个完整的图像块,因此图像边缘的半个图像块宽度区域未被分类。在这个模型中,我使用了 31 像素的正方形图像块大小。

图片

该模型正确地识别出了场景中的所有红灯,但也识别出了图像中另外几个看起来相似的特征。具体来说,它识别出了黑色车辆上的红色尾灯以及一个橙色施工标志的一角。为了改进模型,可以将这些示例添加到“非红灯”类别中并重新训练。

根据我的经验,创建一个能找到目标的模型,远比创建一个能找到该目标的模型省时。将我们称为“混淆项”的特征从分类结果中剔除出去需要一些时间。

基础特征提取与深度学习之间的准确性而言,深度学习在此具有优势,因为基础特征提取会将“禁止红灯右转”标志上的红色圆圈也识别出来。

如果您有兴趣了解更多关于Harris 深度学习技术的信息,请通过 GeospatialInfo@NV5.com 与我们联系。

构建自定义工作流变得更简单 ENVI 与 ArcGIS® Pro 集成