计算机视觉关键技术及其在通信工程中的应用测量、天面验证等4个典型场景的应用方案及实现效果,以上应用实践将为通信工程行业数字孪生网络建设提供有益探索。1.引言计算机视觉(ComputerVision,CV)是指利用计算机模拟人的视觉系统,实现人的视觉功能以适应、理解外界环境和控制自身运动。数据、算力和模型是计算机视觉产业发展的三大基石。2000年以后,数据量的增加、计算能力的提升,以及深度学习算法的出现,推动了计算机视觉行业的快速发展。随着高性能智能终端的普及和图像采集设备成本的下降,通信行业在勘测、施工、优化、运维等领域逐渐积累了大量的非结构化图像数据;同时,图像处理器(GraphicsProcessingUnit,GPU的便捷应用)也为高强度并行计算提供了计算能力基础。本文首先总结了计算机视觉领域的重要关键技术和典型算法模型,然后介绍了这些技术在设备安装、施工验收、三维测量、天空验证等几个典型场景中的技术解决方案。通信工程领域,并提供应用的实施效果。2.计算机视觉领域的关键技术2.1重要的关键技术计算机视觉领域一般包括以下五类关键技术。(1)图像分类图像分类的主要研究内容是描述图像的特征。通常,图像分类算法通过人工特征或特征学习的方法对整幅图像进行全局描述,根据图像特征图的不同语义信息进行分类。该技术广泛应用于人脸识别、手写文档或印刷体识别、车辆识别等场景。.常用的图像分类模型包括:AlexNet[1]、VGG[2]、ResNet[3]、InceptionV4、MobileNetV3[4]、ShuffleNet等。(2)目标检测是计算机视觉的一个重要分支。目标检测的任务是找到图像或视频中的目标类别和目标位置。与图像分类不同,物体检测侧重于物体搜索,检测到的物体必须具有固定的形状和轮廓;而图像分类可以是任何对象,包括对象、属性和场景。目标检测在人脸识别、自动驾驶等领域取得了显著成果。经典的检测模型包括YOLOV3、SSD[t5]和FasterRCNN[6]。(3)图像分割图像分割是指将一幅数字图像细分为多个图像子区域(像素集,也称超像素)的过程。图像分割的目的是简化或改变图像的表示,使图像更易于理解和分析。图像语义分割是像素级的物体识别,即每个像素都需要判断自己的类别。MaskR-CNN[7]是一个经典的强度分割网络。(4)场景文本识别场景文本识别分为两部分。首先通过targetdetection检测出目标区域,然后通过CRNN-CTC模型将网络特征转化为文本序列。场景文字识别广泛应用于路标识别、车牌检测等领域。(5)图像生成图像生成是指使用对抗网络(GAN)从输入的随机噪声或向量生成目标图像。生成器和识别器是对抗网络(GAN)的重要组成部分。2.2典型算法模型近年来,计算机视觉领域的优秀算法层出不穷。下面简要介绍以下研究中使用的一些模型。(1)VGG2014年,牛津大学计算机视觉组和谷歌的研究人员共同开发了一种新的深度卷积神经网络,即VGGNet,并在当年的ILSVRC分类竞赛中获得亚军。VGGNet分为VGG16和VGG19:VGG16由13层3×3卷积网络和3层全连接网络构成,而VGG19由16层3×3卷积网络和3层全连接网络构成连接的网络。VGG19广泛应用于不同行业的图像特征提取领域。(2)Resnet深度残差网络(ResidualNetwork,ResNet)是近几年计算机视觉领域的开创性工作。除了图像分类之外,包括对象检测和人脸识别在内的许多计算机视觉应用程序都因其强大的表示能力而获得了性能提升。ResNet101是网络堆叠方法之一。101层网络是指卷积层或全连接层的总数。(3)SIFT尺度不变特征变换(Scale-invariantfeaturetransform,SIFT)是检测和描述图像局部特征的重要算法,由DavidLowe于1999年发表,2004年总结完善。SIFT算法主要用于处理两幅图像之间平移、旋转、仿射变换等情况下的匹配问题。(4)MaskR-CNNMaskR-CNN是华人学者何玉明提出的一种简单灵活的图像实例分割框架,用于判断图像中不同物体的类别和位置,可以进行像素级预测.该算法不仅可以有效地检测图像中的对象,还可以为每个实例生成高质量的分割掩码。3、在通信工程中的典型应用及效果3.1设备安装方式检测蓄电池是通信机房的重要基础设施。根据设备属性、机房空间等因素,蓄电池的安装方式可分为卧式和立式两种(图1)。在写字楼的设计中,需要因地制宜地制定安装方法;在施工验收中,要注意是否按图纸施工。通常情况下,安装方式的信息收集和现场核查都是人工判断并填入相应的信息系统,经常会出现填报错误的情况。图1.VGG19模型引入了通信机房电池安装方法(左:水平;右:垂直)。本文利用VGG19模型中的二值分类方法,基于一般分辨率的现场图像,设计了如图2所示的算法,可以有效识别这两种安装方式。标注100条样本数据时,置信度可达0.95以上;同时,还可以利用移动互联网在影像信息采集终端实现即时识别(图3),从而提高现场勘察人员信息填写的效率,降低人工填写的错误率。图2基于VGG19模型的电池安装方法检测图3 即拍即传后台自动填写采集端属性字段3.2施工过程图像质检业务发展进入快车道,并由“高速”向“高质量”转变。目前家庭宽带装维主要存在以下问题:人工抽检覆盖率低、成本高;人工质检靠的是经验,存在漏检、错检的情况,结果不可靠。可以利用计算机视觉技术为佳科构建智能质检手段(图4),对家庭宽带安装维护质量进行跟踪监督,自动识别安装结果是否合格,提高质检效率,减少人工成本,提高安装质量,提高家居品质。客户业务支持水平,最终实现降本、增效、提质的愿景。图4 居家安检图像质量检测智能化操作流程。以实际应用中效果较好的尾纤安装质量检测为例,传统的人工图像质量检测存在检测精度低、人工成本高等问题。利用基于深度学习的图像识别技术,基于VGG19模型构建了相应的检测算法模块(图5)。图5基于VGG19的尾纤质量检测基本算法基于样本图像(66张尾纤放置照片,典型照片如图6所示),进行二类标注:标准和整齐,VGG19图5所示的模型被训练;同时预留10张照片用于测试验证。图6右侧是随机选择的验证图片,置信度为0.954528,该方法是有效的。图6尾纤构建技术对比(左:标准;中:凌乱;右:验证)3.3全景图像3D测量3D全景是一种基于全景图像的实景虚拟现实技术。照片拼接成一张全景图,也可以通过单拍实现成像。通过拼接和一系列数学计算,可以得到其球面全景的立方体投影,最终通过计算机技术实现全方位互动观看的实景还原展示(图7)。图7基于便携式全景设备的3D显示与测量系统本文设计并实现了一种基于SIFT算法的3D全景图像测量方案(图8)。基于此方案,可以开发出机房内设施和空中设施的3D空间。对于距离测量(图9),三种测试场景的验证误差均在5%以内(测量结果见图9右上)。图8基于SIFT算法的3D距离测量方案和全景照片图9基于SIFT算法和全景图像的3D测量(左:柜高;中:地砖尺寸;右:杆高)3.4天线数量目标检测天空是5G网络建设的重要资源,也制约着5G工程建设的进展。在日常的勘测、优化和维护工作中,往往积累了大量的天面历史影响数据;通过引入图像检测算法,探索天面资源自动验证方法。本文采用MaskR-CNN算法设计了一种基于天空照片的天线数检测算法:首先,图像通过残差网络(ResNet101)和特征金字塔网络(FPN)结构提取多层特征图,然后然后通过区域选择网络(RPN)微调锚框(Anchor)对应的特征图的偏移量并将锚框分为前景或背景,然后对生成的感兴趣区域(ROI)进行排序输出相同大小的感兴趣区域。在训练阶段(图8),分类和掩蔽两个分支同时进行,其中分类包括类别、置信度和边界框回归,掩蔽分支用于分割目标;走分类分支,再走掩码分支。Figure10AntennanumberdetectiontrainingmodelFigure11Antennanumberdetectiontestmodel该方案使用所有交并比(IOU)阈值的平均精度(AP)来评估数据集的性能(表1)。验证结果表明,MaskR-CNN算法具有很强的鲁棒性,能够有效解决天线数量检测任务(图12)。表1天线目标检测结果图12天线目标结果个数示例4结论计算机视觉是通信和信息系统领域的一个重要发展方向。本文系统总结了在通信工程领域的初步探索,介绍了所采用的关键技术、方案要点和实际效果。未来将进一步推动相应研究成果在5G网络规划优化信息系统中的固化和规模化应用。迎接6G数字孪生时代的加速到来。【本文为专栏作家《移动实验室》原创稿件,转载请联系原作者】点此阅读更多本作者好文
