深度学习在雷达遥感中的应用
当前,合成孔径雷达(SAR)凭借其全天时、全天候、高分辨率成像的特点,已经被广泛应用于地球科学、全球变化研究、环境和地球系统监测、海洋资源利用、行星探测、战场感知侦察等领域,具有很高的民用价值和军用价值。但遥感大数据时代下的SAR图像解译是一个极大的科学应用挑战。发展先进的SAR智能信息获取方法显得十分迫切。基于此,复旦大学电磁波信息科学教育部重点实验室徐丰等人将深度学习运用在SAR目标识别与地物分类中,取得了一系列显著成效。
深度卷积网络示意图
深度学习算法变革了计算机视觉领域,而深度卷积网络(CNN)作为计算机视觉领域中最常采用的算法,是一种特殊结构的深度神经网络。其前几层由卷积层(convolution layer)与池化层(pooling layer)交替构成,后面若干层是全连接层。其工作原理是由卷积层学习不同的特征,由池化层将空域形状汇聚到高维特征空间,多层交替的卷积+池化可以学出层次化的特征表征。最后的全连接层的作用则是在高维特征空间学习一个分类器。与传统依据统计或者物理特性进行手动设计的算法不同,CNN凭借自动学习数据分层特征已经将其取代,并取得了一系列突破。在2012年ImageNet大规模视觉挑战赛(ILSVRC),Krizhevsky等人采用深度卷积网络取得了15.3%的错误率,远远超过以往最好的水平。在2014年,Szegedy等人提出了一个包含22层的GoogleNet,将前五项错误率降至6.67%。在2015年,He等人提出152层的残差网络(ResNet)并取得了3.57%的整体错误率。2016年,中国公安三所团队在ILSVRC中取得第一名成绩,错误率已降至3%以下。
CNN在业界所取得的巨大成功得益于算法的改进、海量数据的获得、图形处理单元(GPU)等高性能计算资源的普及几方面。其中算法的改进是深度神经网络出现飞跃式发展的关键因素。改进的网络结构传统神经网络层与层之间采用全连接形式。这一独特的网络结构可以有效地从海量数据中学到层次化组合的特征,对视觉信息进行高效地表征。另一个重要改进就是采用ReLU激活函数。改进的激活函数ReLU的梯度在右侧恒等于1,其梯度在累乘后保持稳定,这是深度网络能够有效学习的重要原因。对于分类应用,还采用了改进的目标函数,即首先在输出层采用Softmax结构,使得最终输出为归一化的概率。其次通过输出概率与标签概率的交叉熵作为目标函数进行学习。这一组合有效避免了梯度回传时的非线性失真。
由于SAR图像数据比较少、对观测条件敏感,直接用SAR数据来训练CNN很很容易出现过拟合(Overfitting)的问题。值得注意的是,CNN中绝大部分的可训练参数都包含在全连接层。一些实验结果表明,网络的层数对于CNN的性能具有最重要的影响。因此,他们通过用卷积层取代全连接层,而不是大量地减少网络的层数,来减少需要训练的参数。这在一定程度上也大大减小了过拟合。
实数卷积神经网络结构图
十类军事目标示例 光学图像vs. SAR图像
徐丰团队在国际上首先将改进CNN应用到SAR目标识别,在标准MSTAR数据集上对10类目标取得了平均99%的识别准确率。该实验数据是由Sandia国家实验室(SNL)的SAR传感器采集的。数据的采集是由美国国防部先进研究项目局(DARPA)和空军研究实验室(AFRL)共同资助的,作为运动和静止目标获取与识别(MSTAR)项目的一部分。该项目采集了几十万张包含地面军事目标的SAR图像,其中包括不同的目标类型、方位角、俯仰角、炮筒转向、外型配置变化和型号变种的目标SAR图像。此外,在极化SAR地物分类中,他们为了利用极化SAR数据的相位信息将实数CNN推广至复数域,称为复数卷积网络(CV-CNN)。将CV-CNN在Flevoland数据集上进行分类实验,结果表明,在同等条件下CV-CNN相比传统实数CNN有更高的分类正确率。这些成果已在IEEE地球科学与遥感汇刊中发表。
复数卷积神经网络结构图
CV-CNN的整体结构图
最近,针对神经网络无法对未经过训练的目标进行分类识别的局限性,徐丰团队又采用深度生成神经网络对SAR数据集进行自动表征建模,通过表征学习自动建立SAR目标本征特征空间,该本征特征空间由已知目标支撑。然后通过训练一个逆向CNN将SAR图像映射到连续的本征特征空间中,由此建立一个准无监督SAR目标识别器,任意一个新目标SAR图像输入到该识别器中即可以得到该新目标在本征特征空间中的分布,并由此解读目标的物理特征。该成果已接收在2017年国际地球科学与遥感年会中汇报。可以看出深度学习技术对雷达遥感的重要意义。虽然如此,研究人员仍在不懈努力,争取
- 利用USART实现单片机与PC通信(10-31)
- 基于SAR系统的无人机定位导航系统的设计(09-25)
- 基于GPS的双基地SAR大斜视角成像算法研究(04-29)