当前位置: 首页 > 科技观察

如何让云端数据管理更专业?

时间:2023-03-15 10:05:38 科技观察

【.com快考】当CarolinasHealthCare系统肿瘤学家在肿瘤委员会审查之前讨论患者病例时,他们说他们正在寻求有关治疗计划和临床试验反馈的建议。医生在演示过程中展示了基因数据、病理报告、化验结果和医生的笔记。一切都只需点击一下手指即可完成,因为数据存储在Azure的Hadoop云中。这是非营利医院网络首次进入云计算,也体现了CHS对如何保护和管理其云数据的深思熟虑。该医疗机构拥有62,000多名员工,在东南亚经营着39家医院和900家其他医疗机构。对此,CHS信息与分析服务(IAS)副总裁ChrisDanzi表示,CHS需要解决的两大问题是网络和治理问题。管理内部数据和外部数据之间的一个显着区别是:在云中,数据可能位于数百英里之外。“你谈论的是长距离移动数据,所以你必须有一个电路和一个安全的网络来连接,”Danzi指出。仅需要千兆位的字来确保每晚将云数据完美地传输到云提供商。节的传输需要他们向电信运营商购买安全的医疗网络专线。在将数据迁移到云的一年中,CHS一直使用VPN与Azure建立专用连接。同时,该线也用于其Office365系统。“你必须考虑的另一件事是,我购买这条线路不仅是为了更好的速度,也是为了细分需要实时访问的交互式用户,以及将要完成的大容量文件传输,”Danzi解释道。他认为,在云中管理数据不同于在本地管理数据,包括在员工技能、如何设置数据治理程序以及如何启用部分技术基础设施方面。“从可能试图窃取你数据的人的角度来看,这些领域都必须完全重新考虑,”Danzi说。“我们已经很好地掌握了内部部署,现在我们正在传输数据并将其存储在不同的地方,所以我们必须重新考虑它。你必须不断反思,因为我们每天都会听到一些新的、更智能的数据破译方法。”越来越多的公司选择外部数据存储组织的IT和数据环境的组件。IDC数据集成软件研究总监StewartBond表示,最近的IDC调查显示,越来越多的组织正在将数据集成到混合和纯云环境中,而不是将数据严格保留在本地。“云端的数据可以是SaaS应用,也可以是PaaS系统,也可以是在IaaS中实现的数据库和文件服务器。”Bond表示,在SaaS应用程序中访问数据通常需要使用API,使用Web服务访问数据与使用SQL脚本和关系应用程序数据库有很大不同。“在PaaS环境中,实施将确定是否需要Web服务API,或者是否使用SQL或NoSQL方法来访问数据。”Bond说,在IaaS环境中,可以使用也可用于本地数据源的编程结构来访问数据。访问,前提是访问是通过安全的通信渠道进行的。无论如何,主数据管理技术有助于协调多个不同的数据孤岛。技术业务管理(TBM)委员会新任主席ErezYarkoni表示,在考虑如何管理云数据的步骤时,组织首先需要非常仔细地规划网络容量。“当我们数据中心的数据正确时,我们所了解的显而易见的事情正在发生变化,基本上扩大了你的网络足迹,你必须非常小心你的设计方式。”Yarkoni的另一个身份是Telstra和T-Mobile的CIO,“这增加了另一个因素,如果你不仔细规划环境的进出,从进出云本身以及人们如何与云交互,这可能会非常昂贵你放在云端的信息。”他说。Yarkoni表示,当他参与设计数据环境时,他尽可能避免将大量数据传输到云端,如果有必要,在一天中的特定时间。云供应商Forrester副总裁兼首席分析师AndrasCser表示:“如果您将信息从数据中心转移到云端,并且希望获得一定的服务质量保证,则必须保证这些位置之间的链接。”云提供商经过审核,但流程通常是脱节的。“我们看到大多数组织对他们计划存储数据的云提供商进行初步审计,但正在进行的审计很少。”这可能是由于其他优先级、流程的复杂性、存储在云中的数据量以及采用云的速度提高等因素。Forrester通常会看到公司要求获得ISO27001和SOC1/SOC2认证。CHS规定其云提供商将进行SOC2审计并有权访问这些结果。CHS的Danzi表示,CHS可以审核他们与计费相关的记录。通过适当的通知,CHS还可以检查其供应商的数据中心。但是,Azure的ExpressRoute和亚马逊的DirectConnect等产品在本地环境与其各自的云之间提供专用网络连接。“一旦数据在云端,IT部门就不再需要数据库管理工具来管理数据库,因为管理数据库性能、调整和设置的耗时过程都由云提供商处理。”经理唐娜伯班克说。“了解你的数据,知道它在哪里并保护它很重要,但很多日常管理都消失了,”她指出。云提供商现在监督性能和调整等任务,并检查服务器是否正在运行和是否正在进行备份。(换句话说,在一定程度上监控供应商是一种很好的做法)“保护云中的数据”在云中管理数据与在本地管理数据不同,尤其是在处理客户信息等敏感数据时)时间”伯班克说。当另一个实体控制个人信息时,她建议使用PCI数据安全标准和令牌化密钥。当公司利用云提供的效率时,“有很多假定的信任,但您仍然无法完全控制它。”Forrester高级分析师HeidiShey同意Burbank的观点,即安全令牌是保护数据的一种方式,但她的组织应该规定谁拥有数据,该组织表示,“一些安全解决方案包括加密作为这些控制措施之一,谁拥有它是关键问题。一些公司希望拥有自己的控制权,而另一些公司会信任供应商。控制你自己的密钥是可行的方法。这样做有时会增加另一层复杂性,因为你是管理员,但这是一个额外的层的控制。”除了保护云中的数据外,确保数据在传输过程中的安全也很重要。这可能需要VPN连接、HTTPS、SFTP/FTPS和其他安全通信方式。IDC的调查还显示,随着数据在云端越来越分散,信任变得越来越困难,主数据,尤其是关于组织关心的人、地点和事物的数据,由于某些形式的需求将需要最分散存在于每个应用程序中。然而,在2017年1月Forrester对美国和加拿大150名数据安全专业人士进行的一项调查中,只有31%的受访者根据其敏感性对云中的企业数据进行了分类。此外,只有大约三分之一(34%)的数据安全专业人员知道他们的云公司数据所在的位置。在这方面,Forrester的Shey认为还必须考虑云安全治理流程,以及使企业安全要求与合规性和隐私法保持一致,尤其是在涉及个人信息时。因为它是一个医疗保健实体,CHS正在寻找云中更复杂的安全性。CHS的Danzi解释说,人们在云中使用的许多Hadoop环境不如结构化关系数据库环境成熟。CHS正在为ApacheHadoop使用HDInsight,它有一个用于EnterpriseHadoop的安全层,ApacheRanger等产品使用它来管理和管理用户级访问。Azure支持两个版本的Hadoop实现。HDInsight的完全托管版本不支持Ranger和HDP的IaaS版本。“HDInsight符合HIPAA标准”但不具备Ranger的用户级安全功能,因此我们必须限制访问。丹子解释道。这是CHS早期吸取的重要教训,即确保云提供商支持公司正在使用或想要使用的软件版本。“你不能假设你为这些事情使用的所有安全协议和保护措施。“此外,”我们知道我们使用的Hadoop版本是全部或不管谁被授予访问权限。但CHS只想要它的信息和AnalysisServices(IAS)管理员可以访问其环境。因此,CHS在MicrosoftSharePoint中构建了一个安全应用程序,仅向肿瘤委员会的医生提供患者信息。在云中管理数据的另一个重要方面是数据驻留和数据传输,Shey补充说:“如果你有来自特定国家或地区的客户数据,你会看到GDPR发挥作用,但特定国家可能有自己的数据驻留要求。”GlobalDataStrategy的Burbank表示:“你需要知道数据的位置。数据无处不在,因为不同国家的法律不同。”其他云管理考虑因素Burbank指出,数据备份和恢复应该在云提供商的服务级别协议中明确说明,作为他们应该提供的关键优势之一。这些SLA应包括有关提供商是否有故障转移站点以及该故障转移站点所在位置的信息。“还要考虑您是否可以选择这些故障转移的位置。”“组织还应该考虑他们在云中管理的数据的格式。它可能在关系数据库、平面文件或电子邮件中。如果客户数据存储在大型数据仓库中,他们还需要考虑他们是否拥有内部管理能力。”Burbank指出,“如果你围绕数据做了很多清理和管理,那么这是需要考虑的事情,很多云技术并没有那么先进。但是,如果你有可以轻松扩展和迁移的原始数据,它非常适合云,因为它不需要大量管理。”“因为这项技术太新了,管理云数据所需的技能可能很难获得。”IDC的必要技能将取决于数据是SaaS、PaaS还是IaaS模型,Bond说。在技??术层面上,IT人员可能需要熟悉Web服务、SSL、安全FTP和RESTfulAPI等互联网技术。他们可能还需要熟悉IaaS架构,例如虚拟机、对象存储、可用性区域和子网。在业务层面,用户需要了解管理数据输入和维护的策略,以及跨多个系统的数据复制的延迟问题。计划应急CHS的Danzi说,他们发现CHS的一些“热心的数据科学家”刚刚开始运行用R编程语言编写的模型来研究再入院风险。因此,在Azure中,IAS团队编写了脚本,在晚上不需要计算时关闭模型。“云就像一个膨胀的气球,你必须告诉它把空气放出去,它让你有能力降低服务器的脚本。这叫做弹性,你要确保你的云提供商可以有弹性上下,只有当你使用资源时,资源才会被付费。”他还建议受监管的组织应该拥有具有良好法律技能的人员,“你和第三方服务提供商必须确保所有HIPAA合规性和良好的商业协会协议。”许多云供应商为潜在客户提供分析产品和基准测试,Danzi认为,您需要确保这些供应商在将数据提供给您的行业同行时将其匿名化。组织可能不会考虑的另一个问题是,如果他们编写算法在Azure上,他们可能希望保护该算法的知识产权,以便其他人无法在云中使用它。根据Danzi的说法,所有数据将在15年内托管在云中。管理云数据时需要做很多额外的工作,但这是值得的,“虽然新环境需要更多的持续警惕,但您可以访问这项惊人的技术。”原标题:管理你的云数据的专家秘诀,作者:EstherShein【译稿,转载请注明原译者及出处.com】  更多热点新闻,请关注《科技新闻早报》专栏!