近年来,随着AlphaGo在围棋上碾压人类棋手,人工智能技术家喻户晓。人工智能(1956年提出)是一门关于知识的学科——如何表示知识以及如何获取和使用知识的科学。如果一台机器能够通过图灵测试,就可以认为它具有人类的智能。深度学习简介人工智能经过六十年的发展,进展缓慢,可以说已经达到了弱人工智能(智能在某个狭窄领域具有人类智能),距离人工智能还有很长的路要走通用人工智能和强人工智能。好样的。早期采用专家系统的方法,但需要很多行业的专家考虑各种规则,规则表过于复杂,得到的结果也不理想。后来,从数据中学习知识的方法(机器学习和统计学习)逐渐取代了专家系统,取得了很好的效果。机器学习方法主要有kNN、随机树、人工神经网络、支持向量机、随机森林等。其中,人工神经网络经历了多次起起落落,直到近几年再次迎来复兴,只不过更名为深度学习。深度学习源于Hinton在2006年提出的深度信念网络DBN,通过逐层无监督预训练,成功训练出一个深度神经网络,称为深度神经网络。学习过程称为深度学习。在业界,深度学习在计算机视觉和语音领域的巨大突破是其复兴的标志。2011年,Hinton将深度学习引入微软工程师,在语音识别领域取得巨大突破。2012年,Hinton的学生Alex提出的AlexNet在大规模物体分类数据集ImageNet上的巨大成功,使得计算机视觉领域的所有任务都以深度学习为主。迄今为止,语音和图像两个领域最先进的算法都是基于深度学习的方法。Hinton20多年磨一剑,终于与Bengio和Hinton一起迎来了深度学习的第三次复兴。关于深度学习的来龙去脉,可以参考他们三人2015年在Nature上联合发表的综述。深度学习复兴的本质是大数据、算力和算法的三重奏。基于深度学习检测识别方法的计算机视觉任务种类繁多,大致可分为低级、中级和高级三类。低级计算机视觉包括分割、图像复原、超分辨率等,输出的是经过处理的像素。中级计算机视觉主要是指特征提取。高级计算机视觉主要包括检测和识别两个任务。计算机视觉领域使用的深度学习模型主要是卷积神经网络CNN。CNN包括交替的卷积层和池化层,以及几个完全连接的层。参数的数量减少了。那么深度对比传统方法有哪些优势呢?这里引用中科院计算所单世光的话,“深度学习的引入体现了端到端的、数据驱动的思想:尽可能少地干预过程,让尽可能少的尽可能的假设。”它最大的优点是可以自动提取最好的特征,而不需要像传统方法那样手动设计特征。计算机视觉和SAR图像计算机视觉(ComputerVision,CV)的目的是模拟人的眼睛和大脑来完成自动检测、识别和跟踪任务。计算机视觉领域特别有用,例如自动驾驶、智能安防、智能医疗、无人超市和移动互联网(各种移动应用程序,如美图、集梦、抖音、快手等,百度、腾讯、阿里巴巴、京东、滴滴、华为和小米对此类人才的需求也特别高)。每个领域都是千亿的巨大市场,所以研究特别活跃,社区发达,新算法和新想法层出不穷,很多都会提供开源代码。特别是最近发展迅速的无人超市和移动互联网,正在真正改变我们的生活。与CV领域相比,SAR图像方面的研究人员较少,社区不完善,研究进展较慢。主要原因是市场决定的,后者对应的是用户太少。现有的深度学习目标检测算法用于检测日常生活中照片中的物体,如图1所示。PASCALVOC数据集(CV领域专门用于训练和测试检测器的数据集)和SAR图像的两个示例非常不同于这些图像。图1PASCALVOC数据集和微波遥感数据集部分图片示例1.成像机制不同。光学成像属于被动成像,是通过接收物体反射的光信号而形成的。SAR成像属于主动成像。它接收发射的电磁信号,进行距离和方位压缩等操作,实现成像。逆反射系数大的物体在SAR图像上的亮度也大。通过这种亮度差异,单通道灰度图像,而SAR图像具有特殊的相乘相干散斑噪声。这和光学成像是两个完全不同的学科,有着本质的区别。2.拍摄角度不同。PASCALVOC是从水平视角拍摄的自然图像。光学遥感和SAR遥感都是从俯视角度观察和成像,会产生不同的图像,容易受到天气、光照和视角的影响。SAR图像对观测角度极其敏感,因为散射信号的强弱取决于物体不同部位的散射系数,观测角度的微小变化都可能导致散射强度的剧烈变化,而无光学遥感给识别带来了很大困难。3.SAR图像目标稀疏且尺寸小,输入图像巨大,存在相干散斑噪声,训练数据相对稀缺。基于深度学习的SAR图像目标检测与识别方法SAR图像目标检测与识别算法的发展与计算机视觉领域类似。传统方法也是手工设计的特点,多道工序分别优化。检测方法包括CFAR提取候选区域和识别两个过程。CFAR严重依赖于SAR图像的统计建模,实际场景的SAR图像千差万别,难以建立有效适用的模型。对于检测和识别这两个任务,SAR图像和计算机视觉领域使用的图像的共性多于异质性,因此我们应该多向CV领域的优秀算法学习。在进行基于深度学习的目标检测和识别之前,需要建立一个数据集。军用坦克识别数据集包括MSTAR。我们使用一些经典的CNNs(VGG/GoogLeNet/ResNet等)进行识别,发现准确率可以达到99.5%[1],而且实现起来非常简单方便。2017年上海交通大学针对船舶目标识别提出了第一个包含十类目标的OpenSARShip数据集,但是类别间的样本数量极不平衡,很难训练出更好的分类模型,所以需要一个好的数据集出现。针对SAR图像舰船目标检测任务,我们建立了第一个(据我们所知)公共数据集SSDD[2],该数据集已被十余所大学和研究所(中国科学院电子研究所,中国科学院遥感研究所、清华大学、中国电科38所、南开大学、中国科学技术大学、复旦大学、中国地质大学、武汉大学、国防科技大学、电子科技大学中国航天大学、北京航空航天大学、哈尔滨工程大学、航天一院等)。虽然数据集比较简单,但填补了该领域的空白,提供了统一的数据集和测试标准,促进了该领域的健康发展。我们在数据集上做了一些工作,验证了FasterR-CNN和SSD等检测器相较于传统方法的惊人性能,并根据SAR图像中舰船目标的具体特征改进了算法。图2是检测效果。第一行是FasterR-CNN的检测效果,第二行是SSD[3]的检测效果,第三行是使用旋转框的检测效果。详情将在下一篇文章[4]中解释。从效果图中我们可以看出,基于深度学习的目标检测算法可以适应所有场景。深度学习目标检测方法优点优点:***,虽然训练过程比较繁琐,但是预测只需要一次前向传播,经过CNN压缩和加速操作后速度会非常快;第二,深度学习的引入体现了End-to-end,data-driven的思想:尽可能少的干预过程,尽可能少的人为假设,可以显着提高分类和检测的性能。第三,可扩展性强。如果需要检测和识别新的目标,只需增加其样本并重新训练即可,无需改变结构或设计特征。四是适应性强,不区分大海域和对接目标,能适应各种复杂背景。我们认为,基于深度学习的目标检测与识别算法是未来SAR图像智能解译的主要手段,尤其是近年来人工智能领域的资金投入巨大。学习资源和交流讨论机器学习课程是必须的。比较好的课程是斯坦福大学吴恩达的CS229课程,比较好的深度学习课程是斯坦福大学李飞飞CS231和吴恩达deeplearning.ai(网易云课堂手机app有视频和中文字幕)。Facebook人工智能研究院FAIR开发的Detectron和Google开发的TensorflowobjectdetectionAPI是两个比较优秀的目标检测框架,实现了大部分目标检测算法。参考文献1JianweiLi,ChangwenQuandShujuanPeng。基于改进的FasterR-CNN的SAR图像船舶检测。2017BIGSARDATA,北京.2邵佳琪、曲长文和李建伟。卷积神经网络模型在SAR目标识别中的性能分析。1-6。10.1109/BIGSARDATA.2017.8124917.3李建伟,曲长文,邵佳琪。基于深度学习的SAR图像舰船检测数据集及性能分析,第五届高分辨率对地观测学术年会。4JianweiLi、ChangwenQu和ShujuanPeng。使用门控特征金字塔网络和定向边界框在SAR图像中进行多尺度和密集排列的船舶检测。IEEE访问。
