当前位置: 首页 > 科技观察

物联网安全领域机器学习方法的研究与展望

时间:2023-03-17 14:23:35 科技观察

摘要物联网对我们的生活产生了巨大的影响,体现在经济和商业的诸多方面。网络中的节点通常是资源受限的,因此成为网络攻击的重要目标之一。人们通常使用传统的加密方法来解决物联网网络中的安全和隐私问题。然而,物联网节点的特性使得现有方法无法支持整个物联网网络的架构。这种现象部分是由于资源限制。由于局限性和物联网设备产生的大量实时数据。机器学习和深度学习可以为物联网设备和网络提供智能解决方案,从而解决众多物联网安全问题。本文系统地回顾了物联网网络的安全要求、攻击向量和当前的安全解决方案。在现有解决方案的基础上,探讨了基于机器学习和深度学习的物联网安全的未来研究方向。一、背景物联网是通过有线或无线通信技术进行通信的互连分布式网络嵌入式系统,也可以说是物理对象或事物的网络。它具有良好的计算、存储和通信能力,通常以嵌入式电子设备(如传感器和执行器)、软件和网络连接为基础,物联网使数据能够在这些对象之间进行收集、处理和交换。物联网衍生的产品包括我们日常生活中常用的智能家居设备,如智能灯泡、智能适配器、智能电表,以及更复杂的设备,如射频识别设备、心跳检测器等。物联网的普及带来了新的挑战,例如对这些设备和数据量的管理、存储、通信、计算、安全和隐私等,而物联网技术商业化的基石是安全和消费者满意度。物联网设备产生的数据量巨大,大量数据可用于行为预测和评估。此外,物联网产生的数据也为当前的数据处理技术开辟了另一个方向。因此,为了利用物联网生成的数据的价值,我们需要新技术。在这种背景下,机器学习被认为是最适合在物联网设备中提供嵌入式计算的计算方法之一,它可以帮助机器和智能设备从生成的数据中推断出有价值的理论。机器学习已被用于分类、回归和密度估计等任务,并逐渐扩展到各个领域[1]。2.当前挑战安全和隐私是物联网服务应用商业化实施的两个主要因素。当前的互联网是最容易受到网络攻击的站点之一,从简单的黑客攻击到企业级安全漏洞,这些攻击对医疗保健和商业、物联网设备及其运行环境等不同行业产生了巨大影响。应用和设备安全带来了挑战。迄今为止,物联网领域的安全和隐私问题已经从通信安全、数据安全、隐私、架构安全、身份管理、恶意软件分析等不同角度得到广泛研究[2]。要成功实现万物互联,分析安全和隐私问题的根本原因至关重要。准确地说,物联网这个词已经从现有技术中去掉了,因此我们有必要了解物联网的安全挑战是新的挑战还是旧技术的继承。费尔南德斯等人。围绕物联网与传统设备所面临的安全问题的异同以及隐私问题,围绕软件、硬件、网络和应用进行论证。传统IT领域的安全问题与物联网领域的安全问题存在根本的相似之处,然而,物联网的主要问题是资源限制,这降低了物联网中已有的复杂安全解决方案的适应性。此外,解决物联网的安全和隐私问题需要跨层设计和优化算法,例如物联网设备由于计算能力的限制可能需要新的优化加密等算法来处理安全和隐私问题。3.机器学习的应用传统的机器学习方法广泛应用于物联网的各个方面(如应用、服务、架构、协议、数据聚合、资源分配、集群)和安全问题,但是物联网物联网是一种大规模部署,推动智能、稳健和可靠的技术,ML和DL在物联网中是有前途的应用。此外,IoT中的ML和DL应用程序可以更好地利用生成的数据,使IoT系统能够做出最正确的决策。考虑到我们在现实世界场景之间的实时交互以及智能设备与物理环境之间的实时交互,DL还可以用于物联网设备中以执行复杂的传感和识别任务,以启用新的应用程序和服务。与物联网安全相关的一些实际应用如下:用于取证的面部识别:姿势、光照、遮挡(眼镜、胡须)、化妆、发型等;安全加密的字符识别:不同的手写风格;恶意代码识别:识别应用程序和软件中的恶意代码。分布式拒绝服务检测:通过行为分析检测对基础设施的DDoS攻击[3];机器学习的方法有很多,这里就不一一介绍了。相关机器学习方法图如图1所示:图1机器学习方法4.机器学习在物联网安全中的应用监督学习算法与标记数据一起工作,在物联网中用于频谱感知、信道估计、自适应滤波、安全和本地化问题。有两种不同类型的方法,用于可用数据集的预测和建模的监督机器学习分类,以及用于预测连续数值变量的回归规则。SVM、朴素贝叶斯、随机森林和决策树是很少使用的分类算法。SVM使用一种称为内核的机制,用于查找两个独立类的两点之间的差异,支持向量机能够对非线性决策边界进行建模。然而SVM本质上是内存密集型的,很难确定合适的内核,并且很难对大型数据集进行建模。由于现实世界中所有的输入特征都是相互独立的,这使得随机森林算法成为对现实世界问题建模的理想模型,随机森林算法更容易实现并且能够适应可用数据集的大小。与SVM、NB等其他有监督算法相比,该算法需要更长的训练时间,但具有更高的准确率和更短的预测时间[4]。RL通过利用不同的阶段来学习,并在代理和环境之间开发奖励和行动机制。这种行为-奖励关系对于解决各种物联网问题非常有用,因为它不需要大型训练数据集。但是,这种方法需要有状态转移函数的基础,计算简单但收敛到稳定状态需要大量时间。这种缓慢的收敛和状态转换函数或最优策略的基础是在物联网动态环境中使用RL算法的关键挑战。DL依靠强大的函数逼近、评估和学习能力,从而为物联网的各个方面,包括安全和隐私问题提供更有效的解决方案。物联网设备由于资源限制可能无法运行通信、分析和预测等复杂计算任务,因此,与传统理论和技术相比,基于深度学习的算法具有更好的性能,而且DNN可以定位和定义低任何类型(文本、图像、音频)的维度表示。DRL及其变体用于异构物联网网络中的身份验证和DDoS检测。通常,主要用于安全和隐私的DRL算法包括:深度确定性策略梯度、连续DQN、优先体验重放、深度SARSA等[5]。五、机器学习在物联网安全应用中的局限性物联网流量通常具有容量大、多样性、速度可变和不确定性等特点。大多数传统的ML方法本身并不能有效地管理IoT数据,因此需要进行大量修改。此外,物联网数据存在固有的不确定性,很难消除这些固有的不可预测性。下面,我们讨论在IoT中使用ML的一些常见限制。首先是处理能力。机器学习算法本身就存在一些复杂性问题,例如内存、计算复杂度和样本复杂度。此外,传统的ML方法缺乏可扩展性,并且仅限于处理低维问题。物联网设备体积小,通常存在能源限制和处理能力有限的问题。因此,直接应用传统的ML方法不适合资源受限的环境[6]。其次是数据管理和分析。无线数据可以从不同的来源生成,包括网络信息系统、传感和通信设备。数据是物联网系统的关键,必须进行有效的分析才能从数据中获取有价值的信息。然而,大规模数据管理是一个严峻的挑战。IoT网络中生成的数据在类型、格式和语义方面具有内在差异,因此在句法和语义上表现出异构性。句法异构是指数据类型、文件格式、编码方案和数据模型的多样性,而语义异构是指数据含义的差异。这种异质性导致有效和统一的泛化。特别是在大数据的情况下。6.总结与展望物联网中的安全和隐私至关重要,在物联网的商业化过程中发挥着关键作用。传统的安全和隐私解决方案存在许多与物联网动态特性相关的问题。DL和DRL技术可用于使物联网设备适应其动态环境,这些方法可以支持自适应学习,还可以通过学习和处理来自周围环境的统计信息来优化系统的整体性能。这些方法本质上是分布式的,不需要设备和控制器之间的集中通信,但是,ML和DL算法所需的数据集仍然很少,因此基于ML和DL的安全解决方案的效率提升仍然是一个问题。一项艰巨的任务。在本文中,我们从安全和隐私的角度考虑ML和DL在物联网中的作用,为后续发展提供理论支持。参考文献[1]J.Lin,W.Yu,N.Zhang,X.Yang,H.Zhang,andW.Zhao,“Asurveyoninternetofthings:Architecture,enablingtechnologies,securityandprivacy,andapplications,”IEEE物联网杂志,卷。4,第1125–1142页,2017年10月。[2]M.Ammar、G.Russello和B.Crispo,“物联网:物联网框架安全性调查”,信息安全与应用杂志,卷。38,pp.8–27,2018.[3]D.E.Kouicem、A.Bouabdallah和H.Lakhlef,“物联网安全:自上而下的调查”,计算机网络,卷。141,第199-221页,2018年[4]M.bintiMohamadNoor和W.H.Hassan,“物联网(iot)安全的当前研究:一项调查”,计算机网络,卷。148,第283–294页,2019年[5]M.Mohammadi、A.Al-Fuqaha、S.Sorour和M.Guizani,“物联网大数据和流分析的深度学习:一项调查”,IEEE通信调查教程,卷。20,第2923–2960页,2018年第四季度。[6]王天,C.-K.Wen、H.Wang、F.Gao、T.Jiang和S.Jin,“无线物理层深度学习:机遇与挑战”,IEEE中国通讯,卷。14,第92–111页,2017年10月。