背景近年来,大数据技术在科学和工业领域的应用引起了业界的广泛关注。大数据在推动社会进步的同时,也带来了诸多问题和挑战,尤其是大数据治理和隐私保护问题。区块链技术具有去中心化、不可篡改、透明等特点,在提升大数据安全服务方面具有巨大潜力。在本文中,我们首先介绍了区块链大数据技术的概念和特点以及将两者结合的动因,然后介绍了区块链大数据在行业中的应用,最后分析了一些具有代表性的项目。区块链大数据概述区块链随着以比特币为代表的新型数字货币的快速发展,作为比特币底层支撑的区块链技术受到人们的关注。区块链的概念最早是在比特币白皮书中[2]中提出的。区块链本质上是一个共享数据库。与传统的中心化数据库相比,区块链采用分布式数据存储、P2P传输、共识机制、加密算法和智能合约等传统技术,使区块链具备去中心化、不可篡改、可追溯、多方参与的能力。维护、公开透明等[3]。基于这些特点,区块链奠定了坚实的“信任”基础,创造了可靠的“合作”机制,具有广阔的应用前景。大数据大数据技术起源于2000年前后互联网高速发展时期,随着时代背景下数据特性的不断演进,以及对数据价值释放需求的增加,大数据逐渐演化为多种数据特性供用户使用。大数据,以数据采集、存储、处理和计算为核心,支撑数据治理,数据分析、数据安全等周边技术相结合形成的一整套有助于释放数据价值的技术生态。如今,大数据技术已经发展成为一个覆盖范围巨大的技术体系。图1为大数据技术体系图及相关代表性大数据开源软件。图1大数据技术体系及主要开源框架大数据时代,客户更倾向于线上交易,每天都会产生大量的交易信息,数据的积累会呈指数级增长,创造了巨大的价值行业了解客户需求、购买模式和客户趋势的机会。新的机会。大数据具有体量大、时效性强、数据来源异构多样、价值高等特点。通过大数据技术分析各类数据信息,将产生巨大价值,指导国家和企业的决策。大数据技术在便利人类生活的同时,也带来了诸多问题和挑战,如数据隐私和安全问题、脏数据处理、数据源可靠性验证、数据共享等。区块链、大数据与激励相结合大数据技术具有巨大的解决当前许多问题的潜力。目前,政府和民营企业正大力投资建设部门大数据中心,以提升对外服务质量。区块链技术的许多独特特性可以用来解决上述大数据所面临的这些挑战。区块链与大数据技术相结合的动因具体描述如下:保障数据安全:区块链以不可篡改和可信任的公开透明性,让更多的数据安全流动。一个典型的案例就是区块链如何推动大数据基因测序。区块链大数据测序利用私钥限制访问权限,减少利用法律限制个人获取基因数据的限制,利用分布式计算资源高效完成测序任务,区块链的安全性解决了基因测序的产业化问题,促进了数据的安全流动。保障数据隐私安全:政府拥有大量高密度、高价值的数据,如人口数据、金融数据、医疗数据等,政府数据的正确使用将对发展产生不可估量的推动作用整个经济和社会。开放数据是大势所趋。然而,数据开放的主要问题是如何保护个人隐私。基于区块链的数据脱敏技术可以保证数据隐私,为隐私保护下的数据开放提供解决方案。数据脱敏技术主要采用哈希处理等加密算法。例如,基于区块链技术的Enigma系统可以在不访问原始数据的情况下进行操作,可以保护数据的隐私,消除数据共享中的隐私。安全。保证数据存储的安全性:区块链网络中的所有节点都参与计算并验证其信息的真实性以达成全网共识。区块链中的数据不可篡改,记录历史。修改区块链网络中的数据,至少需要修改50%节点的数据。区块链的不变性保证了存储在区块链网络中的数据是可靠的,使数据库的发展进入了一个新时代。保证数据完整性:数据访问者可能会篡改大数据中的记录,从而影响大数据分析预测的结果。区块链技术通过采用多重签名私钥、加密技术和安全的多方计算技术确保数据的不完整性。数据首先经过哈希计算,放在区块链上,然后使用数字签名技术。一方面,数据只对授权用户开放,用户通过签名验证数据的完整性。区块链大数据应用如图2所示。通过调研区块链技术在大数据环境中的应用,包括大数据的采集、存储、分析和隐私保护,区块链通过共识算法保证数据的完整性。接下来重点分析区块链大数据服务中的两个子领域应用,区块链大数据采集架构:移动众智(MCS)区块链,区块链大数据传输/共享架构:边缘网络区块链。图2区块链在大数据环境下的应用概述MCS区块链数据采集是数据处理生命周期中非常重要的任务。当前,数据源和通信链路正面临着各种恶意攻击和威胁。因此,安全的数据收集方法对于各种数据都至关重要,并且在世界范围内已经完成了多项关于数据收集安全的研究工作。例如,基于区块链的安全大数据采集方案应用于移动众智(MCS)项目。随着移动终端(mobileterminals,MT)、传感器等便携式智能移动终端设备的快速增长,MCS已有效应用于工业物联网。MCS服务器发布一些与传感器相关的数据集,并选择特定区域的MT。来完成特定的任务。该任务的主要挑战是MT中传感设备的发送数据范围以及MT之间数据的安全共享。刘[4]等。提出了一个基于区块链和强化学习(DRL)的框架来克服这些挑战。每个基于分布式区块链DRL方法的MT为传感设备提供多点传输功能和最大传输。范围。采用以太坊区块链平台保证数据的可靠性和安全性,MT共享数据。以太坊将维护一个安全的分类账,并在没有受信任的第三方的情况下与合作的MT共享数据。该框架还集成了防止各种攻击和处理常见设备故障的功能。边缘网络区块链区块链具有去中心化和不可篡改的特点,可以提供大数据的安全传输,支持可靠的数据共享。传输安全的关键在于如何解决传统传输协议的不足,如何防止数据被窃取和丢失。目前,国内外已有一些研究致力于利用区块链来支持大数据的传输和共享。随着边缘网络中数据量的不断增加,边缘网络中敏感数据的安全共享成为一项具有挑战性的任务。徐[5]等。通过共识算法提高边缘网络认证计算效率。另外,为了减少响应时间和存储开销,作者引入了基于区块链的无效交易过滤算法,让访问者可以通过缓存层访问数据。最后,作者提出了快速交易和空心快速交易来提高模型的网络传输效率。如图3所示,应用层将采集到的数据报告、数据库、社交媒体或辅助小工具数据,通过签名和哈希值加入到区块链中,采用共识共识算法和无效交易过滤算法进行处理,然后共享区块数据与数据分析服务。实时分析模块进行数据可视化和模型预测,相互配合保证计算结果的真实性和可靠性。图3区块链大数据安全传输/共享架构总结区块链被称为颠覆性技术,是一种数字分布式账本,本质上是一个以公开透明的方式记录比特币的共享数据库。交易加密货币等加密货币有很多优势。大数据是互联网时代的产物,区块链与大数据技术的结合成为当下的热门话题。本文主要介绍区块链和大数据的概念和优势。通过已有的相关调查,了解已有的关于区块链和大数据贡献的研究以及两者结合的动因,讨论目前区块链大数据在行业中的一些应用,最后对本文进行总结。参考文献[1]Deepa,N.,Pham,Q.V.,Nguyen,D.C.,Bhattacharya,S.,Prabadevi,B.,Gadekallu,T.R.,...&Pathirana,P.N.(2022)。大数据区块链调查:方法、机会和未来方向。下一代计算机系统。[2]中本聪(2008)。比特币:点对点电子现金系统。去中心化商业评论,21260.[3]沉鑫、裴清琪、刘雪峰。(2016)。区块链技术回顾。网络与信息安全杂志,2(11),11-20。[4]Liu,C.H.,Lin,Q.,&Wen,S.(2018).通过深度强化学习为工业物联网提供区块链支持的数据收集和共享。IEEE工业信息学汇刊,15(6),3516-3526.[5]Xu,C.,Wang,K.,Li,P.,Guo,S.,Luo,J.,Ye,B.,&Guo,M.(2018)。使大数据在边缘开放:基于资源高效的区块链方法。IEEE并行和分布式系统汇刊,30(4),870-882。
