当前位置: 首页 > 科技观察

碎纸回收技术对航母毁坏带来的重要启示

时间:2023-03-21 11:31:25 科技观察

国际碎纸回收相关案例案例一:德国情报机构“斯塔西”文件恢复项目,试图寻找一种无人干预的新技术,那些绝密文件两德统一前夕被前东德情报机构撕成6亿多张纸(人工修复需400年)5年内可修复。[1]其中,德国弗劳恩霍夫设计技术研究所(FraunhoferInstituteforDesignTechnology)宣布研发出一种名为“E-Puzzler”的先进仪器,专门用于完成还原工作。该仪器能够精确识别纸张碎片的特征并重新组合,最多可还原文件内容的70%。据弗劳恩霍夫研究所称,如果德国政府批准“E-Puzzler”正式投入使用,完成全部工作的时间将缩短至5年,平均每年耗资700万英镑。案例二:美国国防高级研究计划局(DARPA)曾表示,军方经常在战场上收集撕碎的文件碎片,但恢复原始文件是一项艰巨而艰巨的任务,需要大量人工干预,效率极低,而有价值和重要的信息通常是有时间限制的。2011年10月29日,DARPA组织了一场碎纸回收挑战赛,旨在找到一种有效的算法来回收碎纸机处理后的碎纸。全美9000支队伍参赛,最终选出“AllYourShredsAreBelongToU.S.”的队伍。由来自旧金山的三名程序员组成。解决方案是:根据计算机视觉、图形、纸张碎片的边缘属性等特征,设计一种模拟算法,自动搜索最有可能匹配的纸张碎片,同时人工筛选可能的碎片。但考虑到实际问题的复杂性和安全保密管理要求的标准化,该方案未能投入军用。图1:DARPA碎纸复原挑战赛题及复原示意图碎纸复原研究现状及研究进展传统上,复原工作大多采用人工和半自动完成,精度高但效率低。随着计算机技术的发展,人们尝试开发碎纸自动拼接技术,以提高回收效率。虽然国内外对这项工作进行了一些研究,但由于碎纸自动修复技术应用背景的特殊性,目前可供参考的研究资料并不多。主要提出了两种解决方案:一种是基于轮廓拼接[2,3];第二个是基于内容的拼接[4,5]。其中前者研究较多。基于轮廓的片段自动拼装方法分为两个步骤:局部形状匹配分析和全局恢复重建(目前大部分研究主要基于第一步)。对于局部形状分析的研究,片段通常以等高线的形式表示,利用等高线的方法进行局部形状匹配分析。WolfsonH[6]提出了一种基于弧长与总转角图分析(ArclengthVersusTotalTurningAngleGraph)的形状匹配方法来解决工业中工件的自动装配和识别问题,这是一种字符串匹配的方法来寻找最大公共部分的方法。为了解决大型文物碎片的修复问题,Leit?oHC等人。[7]提出了一种多尺度二维片段拼接方法,该方法使用动态规划技术细化匹配对。布朗大学的KimiaB等学者[8]提出了一种基于弹性匹配的片段自动组装算法。该方法可以提高匹配效率,但对双对应曲线的采样分布有很强的依赖性。对于全局恢复重建方法,朱良佳、周宗坛和胡德文[9]提出了松弛法全局匹配方法,以实现最大的全局一致性。松弛法利用局部轮廓匹配产生的候选匹配,针对不同片段间的空间约束关系去除一些不合理的匹配,保留全局意义上较好的匹配,取得了较好的效果。何鹏飞、周宗坛、胡德文[10]提出了一种基于蚁群优化(ACO)的全局匹配算法,该算法采用基于ψ-s分析的局部轮廓匹配方法,利用多Agent间接通信,直接利用变化媒体,并基于ACO算法。在该框架下,将片段全局匹配问题看成是求解无矛盾拼接代价最小的优化问题。碎纸复原和复原的基本原理一般来说,碎纸的复原主要分为以下三个步骤:1.对纸张碎片进行预处理,即通过特征等一系列图像预处理过程将纸张碎片数字化检测和提取。2、图像片段匹配,即通过各种匹配算法模型找出匹配的图像片段。3.图像片段的组合,将步骤2中找到的匹配图像片段组合起来,得到最终的正确结果。10号文件主要对条粒式碎纸机碎纸的拼接和复原进行了分析和建模,讨论了单面和双面碎纸的复原。本文结合文献10的建模方法对以上三个步骤进行了简要总结。预处理包括特征提取、图像扫描、图像分割等技术手段。特征提取的关键技术是纸张轮廓提取,直接影响碎纸拼接结果的准确性和效率。利用碎纸轮廓的形状特征,通过轮廓信息找到轮廓形状的相似性进行局部形状匹配,进而逐步完成全局的恢复和重建。图像扫描技术的应用,文献10使用matlab软件对碎纸的两侧进行扫描,根据像素值提取一个0-1的矩阵(0代表有文字的部分,1代表空白的部分).通过纸张像素分析,选择至少有一面全部非零的纸张,放入单面打印纸;纸张的其余部分是双面打印。另外,对于图像分割的预处理技术,文献2提出了一种基于LevelSet方法的图像分割算法,然后对提取的轮廓进行链码提取操作,并根据纸张大小设置阈值来过滤掉Chaincode区域。小于阈值的区域,即得到的链码就是我们要提取的部分轮廓信息。(水平集方法是描述曲线以曲率相关速度演化的有效方法,已广泛应用于医学图像处理、自然现象模拟和计算机视觉等领域。)研究主要集中在步2—图像片段匹配算法模型研究。在完成数据0-1矩阵提取的前提下,10号文献建立了三种模型以适应不同类型的纸张碎片拼接,包括条形单面打印碎纸拼接模型和条形双面打印碎纸拼接模型印刷碎纸。芯片的拼接模型和颗粒封装正反面打印碎纸的拼接模型(集群模型)。前两种图像片段匹配模型的流程图分别如图2和图3所示。第三种模型基于颗粒双面拼接技术,利用聚类模型衡量矩阵相关性,将强相关矩阵对应的图像片段划分为一类,然后利用第二种模型进一步实现拼接.对于双面碎纸的情况,10号文件定义了可以拼接在一起的条件。满足条件1、2其中之一即可拼接成功:条件1:第i张碎纸a的右边界与第j张碎纸的右边界相同。第i张碎纸a面左边框拼接成功,第i张碎纸b面左边框与第j张碎纸b面右边框拼接成功论文成功;条件2:右边界与第j张碎纸b面左边界成功拼接,第i张碎纸b面右边界与第i张碎纸b面右边界成功拼接第j张碎纸a面的左边界。图2.单面印刷碎纸条拼接模型。该算法的核心步骤是Step3。计算左右边界之间的欧氏距离为公式(1);Ai表示第i张碎纸的左边界像素矩阵,Bj表示第j张碎纸的右边界像素矩阵。图3条形双面印刷碎纸拼接模型定义了碎纸的a面和b面,其中Ari表示第i张碎纸a面右边界对应的0-1矩阵;ali表示第i张碎纸a面左边界对应的0-1矩阵;Bri表示第i张碎纸b面右边界对应的0-1矩阵;bli表示第i张碎纸b面矩阵左边界对应的0-1;Jij、Lij、Mij、Nij为两张纸对应边界的差分矩阵;pij、qij分别表示a~a面拼接的匹配度和b~b面拼接的匹配度;代表2-范数。欧式距离计算公式:纸片对应边界差分矩阵公式:两张纸匹配度计算公式:图2:条形单面印刷纸片拼接模具图3:条形形双面印刷纸片在匹配算法模型中,一种比较创新的策略是基于群体智能优化的全局匹配算法实现图像匹配[11,12]。群体智能优化算法是一种针对离散优化问题的元启发式算法,它利用生物种群的行为优化机制来完成对问题的求解。通过优化搜索学习策略,将碎纸拼接匹配问题转化为优化问题,模拟种群生物的进化机制不断迭代,最终找到碎纸对匹配的最优解。在片段复原和复原的最后阶段,将匹配的图像拼接在一起,恢复图像的原始面貌。在这个阶段,有几点值得注意。考虑到片段丢失的可能性以及相应的虚拟重建问题,图像片段的拼接还需要保证匹配片段对之间匹配边界的紧密性。[13]同时,由于碎片在数字化过程中的位置不同,每个碎片与其原始位置的角度都发生了变化,即部分碎片的局部坐标系也不同。片段,需要根据共同的曲线或直线段的不同角度,将它们变换到同一坐标系中。思考与建议纵观目前国内外的碎纸标准,美国对碎纸有《NSA/CSS Specification 02-01,High Security Paper Shredder》标准,要求碎纸颗粒宽度不大于5mm,碎纸颗粒面积不大于5mm2;德国标准《DIN 63399》取代原来的《DIN 32757》标准,新标准定义了七个安全级别,其中最高级别P-7对应的建议如:具有非常机密数据的数据载体,材料颗粒,考虑使用最高安全防护面为5mm2,整齐的颗粒条宽度为1mm;国内一级碎纸标准应满足碎纸颗粒达到2mm*1mm的纸载体销毁要求,确保纸张及其同行载体的安全。此外,一般办公用碎纸机切碎的纸张粒度也可达2mm*0.8mm。碎纸机筒体一般可容纳1000张A4纸碎纸,一张A4纸按照2mm*1mm的标准碎纸后,产生31185张碎纸颗粒。因此,无论粉碎颗粒的大小或粉碎颗粒的数量,相似候选颗粒的计算机碎纸回收模型分析的复杂度呈指数增长。综上所述,基于当前碎纸拼接复原修复技术研究趋势分析,结合国家涉密载体销毁安全保密要求,针对涉密文件碎纸销毁提出以下安全建议:纸张:1.安全纸张销毁设备的研制迫切需要满足自主可控的信息化建设要求。依托国产化软硬件等安全可靠的支撑环境,开发符合系统建设和分级保护要求的纸张安全销毁设备,确保纸张全生命周期的安全防护措施和运维管理措施有效可控设备。2.明确载体销毁分级标准规范要求,确保涉密载体销毁过程安全可控,安全评估载体销毁失密风险。建议参照国外碎纸标准,按照分级销毁的技术要求,对不同密级的涉密载体和分级等中间过程产生的涉密载体进行销毁,防止信息可能被泄露。由于切碎不完整,通过拼接恢复。3、破碎过程中,严格执行安全保密管理措施,精简人工干预方式和干预时间点。结合碎纸拼接修复技术,修复仍需人工干预。相比之下,纸张的切碎和销毁过程中,人工干预对安全保密有着重要影响。4、从现实来看,很多碎纸自动拼接模型的仿真实验数据库与实际智能处理的大规模碎纸数据量存在较大差距。考虑到碎纸颗粒扫描速度、拼接候选等因素,利用碎纸自动拼接复原技术对大尺寸碎纸颗粒进行复原的难度较大。参考文献[1]Chunfeng,McGill.前东德情报机构撕毁的16000袋绝密文件将被修复[J].兰台世界月刊,2009(23):58-59.[2]张鑫,卜彦龙,朱良佳,等。物证还原系统中碎纸轮廓提取技术研究[J].计算机仿真,2006,23(11):184-187.[3]贾海燕,朱良佳,周宗坛,等。碎纸自动拼接中的形状匹配方法[J].计算机模拟,2006,23(11):180-183.[4]金明亚,孙丹雷,赵岩,等.算法实现[J].延安大学学报(自然科学版),2015,34(1):14-18.[5]陈丽丽,郭红军.基于文档内容的碎纸拼接技术[J].衡水学院学报,2014(4):34-37.[6]WolfsonH.论曲线匹配[J].IEEE模式分析和机器智能汇刊,1990,12(5):483-489.[7]Leit?oHCDG,StolfiJ.二维碎片物体重组的多尺度方法[M]。IEEE计算机学会,2002.[8]McbrideJC,KimiaB.使用曲线匹配重建考古碎片[C]//计算机视觉和模式识别研讨会,2003年。CVPRW'03。会议上。IEEE,2003.[9]ZhuL,ZhouZ,HuD.撕裂文档的全局一致性重建[J].IEEE模式分析与机器智能汇刊,2007,30(1):1-13.[10]王晨,曾谦.碎纸机碎纸拼接修复研究[J].大众科技,2014(3):15-17.[11]何鹏飞,周宗坛,胡德文。基于蚁群优化算法的碎纸拼接[J].计算机工程与科学,2011,33(7):67-73.[12]张亮,张亮。基于聚类优化模型的碎纸自动拼接方法研究[J].计算机应用与软件,2015,32(12):218-221.[13]廖敏宇、谢瑞成、余生宇。碎纸的自动拼接与修复[J].汕头大学学报(自然科学版),2018(1).