跳转至

熔岩、火山羽与机器学习

原文链接: https://www.nv5geospatialsoftware.com/Learn/Blogs/Blog-Details/lava-plumes-and-machine-learning-oh-my

13105 为本文评分:

4.5

熔岩、火山羽与机器学习

Zachary Norman 2018年11月13日 星期二

最近,我从GBDX下载了一幅DigitalGlobe WorldView2影像,恰巧覆盖了基拉韦厄火山近期喷发的夏威夷区域。更巧的是,影像获取时(2018年5月23日)火山正处于活跃喷发期,因此当我最终打开图像,亲眼目睹这次喷发的威力和破坏性时,着实感到震撼。直接覆盖喷发区域的影像子集如下所示:

作为参考,这里是一幅地图截图,显示了该影像的地理位置以及原始场景的概览:

当我初次查看这个场景时,除了满目疮痍的景象,我并未想到它会引领我在ENVI中创建一些有趣的分析和分类器。最初,我只是检查图像的RGB波段。当我切换到CIR(彩色红外)视图,想仔细查看近期熔岩流旁边的一些植被时,我注意到一些熔岩开始发出光芒:

看到这个现象后,我决定观察仅由较长波长波段组成的彩色合成图像,看看还有什么会显现出来。由于使用的是WV2数据,我有8个波段可选,其中包含两个近红外波段和一个红色边缘波段。当我检查NIR2(950 nm)、NIR1(833 nm)和红色边缘(725 nm)波段的RGB合成图像时,熔岩区域真正地“跳”了出来!

看到这幅图像后,我开始思考:能否提取出炽热熔岩、冷却熔岩以及正在释放的气体羽流的位置?我决定尝试使用最先进的机器学习算法来实现这一目标。如果你不熟悉创建机器学习分类器的工作流程,它大致如下:

  1. 提取训练数据
  2. 生成分类器
  3. 将分类器应用于图像,并根据性能(可选)迭代调整训练数据

如果你之前创建过分类器,可能会知道第一步和第三步可能会非常耗时,具体取决于所使用的特征和算法。尽管这可能是事实,但我决定采用的机器学习算法是一种基于像素的算法。为什么这很重要?这意味着我们可以在几分钟内非常快速地提取训练数据并为我们的数据生成分类器。此外,一些基于像素的机器学习算法非常稳健,即使在类间差异巨大(如此例)的情况下,对于卫星、航空和无人机数据采集平台也能表现出色。在深入探讨算法之前,让我们先退一步,谈谈那些使我能够成功并从DG影像中提取所需特征的技术。

  • ENVI + IDL: 通用的文件输入/输出和数据校准。也用于使用QUAC进行辐射定标、全色锐化和大气校正。
  • IDL-Python桥接: 使能将来自scikit-learn的机器学习算法集成到ENVI中的关键技术。
  • Pythonscikit-learn中可用开源机器学习算法的核心接口。

借助这些工具,我能够创建一个“极端随机树”分类器,它是随机森林的一个“极端随机”版本。这里有一个更详细描述的链接:http://scikit-learn.org/stable/modules/ensemble.html#extremely-randomized-trees。极端随机树算法性能相当好,支持多线程,并且非常易于使用(仅有两个参数可以针对你的解决方案进行调整)。我喜欢将决策树算法用于图像分类的原因之一是它们**完全不需要**迭代。神经网络很大一部分工作在于必须确定分类器训练所需的周期或迭代次数,这可能需要非常长的训练时间并涉及大量的参数调优。一旦确定了要生成的算法,我便使用IDL的ENVI任务API来提取感兴趣区域的训练数据、创建分类器并对栅格进行分类。对于分类器生成,以下是在ENVI Modeler中展现的简单工作流程,它包含了上述列表中的步骤1和步骤2:

工作流程运行完成后,我们得到两个输出:一个分类器和一个JSON文件,后者描述了我们的分类器,包括训练数据的准确性指标。对于这个例子,训练数据包含770,013个像素。令人惊讶的是,极端随机树分类器**正确分类了每一个像素**。下面看看表明其性能的混淆矩阵信息:

现在分类器已生成,接下来我们需要做的就是使用单个ENVI任务对原始栅格进行分类。对于这幅场景,在我的机器上总共花费了大约10分钟来分类约2.8 GB的图像。分类完成后,我们的工作流程并未完全结束。我们将更进一步,从结果中提取一些有意义的信息。具体来说,我们将创建一个关于到火山气体羽流距离的邻近图。为实现这一点,我们使用了缓冲区任务(ENVI 5.5.1新增功能)和栅格颜色切片来提取距离信息。最终的分类结果和邻近图如下所示:

如果你观察左侧的分类结果,会发现它在提取我们感兴趣的特征方面做得非常好。唯一可能改进的区域(也许难以实现)是尝试提取那些火山羽流较薄、可以看透的区域。值得指出的一点是,分类器能够区分云和火山羽流,这表明它们在光谱特征上彼此不同。

祝您使用愉快!

利用OpenStreetMap数据增强ENVI中的图像分析 应对时代的洪泛区测绘——建模、减灾与预防