当前位置: 首页 > 科技观察

基于大数据优化构建面向未来的企业

时间:2023-03-13 21:46:31 科技观察

引言构建面向未来的企业不是基于“预测未来”,而是为未来做准备。大数据的真正价值在于为未来做准备,帮助企业规避风险。戴尔提供专为大数据目标设计的端到端架构,帮助企业通过大数据获得业务洞察力,为未来做好准备。正如NateSilver在他的畅销书《信号与噪声》(信号与噪音)中所写,预测未来是困难的,因为“我们有选择地忽略最难以衡量的风险,即使这些风险对我们的生活构成最大威胁”。用大数据获得商业洞察力面向未来在商业领域,商业领袖往往希望通过“预测未来”来赢得竞争。他们不厌其烦地说服自己和他人,确实有一些具有前瞻性的人可以“seefartothefuture”,而这些人本身就是企业的领导者和管理者。但正如戴尔在构建“面向未来的企业”(FRE)战略中所倡导的那样,构建面向未来的企业(FRE)并不是立足于预测未来,但着眼于为未来做准备——设计和实施灵活、高效的系统架构,让企业响应更灵敏,变革更果断。面向未来的企业力争成为典范开放性——愿意接受新想法、新流程,尤其是开放式IT架构,它可以避免僵化和传统并促进创新和灵活性。这也应该是企业对待大数据的态度。客观地说,大数据确实蕴含着有价值的商业信息。通过对大数据的分析,企业管理者可以有效、直接、准确地了解企业的??运营状况、潜在问题和商业优势,但在未来预测方面,大数据更多的是提供预测和预警的蓝图以避免错误。换句话说,大数据分析甚至实时分析提供了侧重于为未来做准备或及时发现问题以避免业务风险的功能。它似乎不再那么实用了。但这并不意味着大数据没有价值。对于企业运营而言,避免错误和遗漏可以说为企业维持正常运营贡献了一半以上的价值。大数据对于企业运营的价值必将大幅提升,这也是人们要求对大数据进行更快、更准确的实时分析的重要原因之一。在企业运营过程中,大数据产生价值至少需要三个组成部分,缺一不可:第一,承载大数据的平台足够可靠、足够快,能够快速将大数据供给数据处理,分析平台保证“持续的数据供应”;第二,数据处理和分析的架构是高效可信的,这就要求整体架构(尤其是软件平台)不仅分析速度快,而且响应时间短,更要求任何数据分析平台可以快速集成到企业现有的数据平台或数据源/流中;第三,数据备份和恢复仍然很重要。随着实时数据分析成为企业的关键业务,一旦出现数据丢失、损坏等原因导致无法向实时分析平台提供数据,就相当于关停关键业务,这是不能允许的.在戴尔大数据和数据分析的技术蓝图中,戴尔强调“提供端到端的架构”,专为大数据目标而设计,利用软硬件上的数据分析和数据管理一体化来实现最终效果。彻底改变数据业务运营效率,推动业务转型。在企业客户的应用中,“分析速度最多可提升70倍,预测分析响应时间可加快60倍”。那么,戴尔是如何做到的呢?硬件加速让运行速度提升100倍作为所有大数据解决方案的基础,硬件平台所能提供的速度是任何软件优化都无法比拟的,正如国内很多互联网公司的DBA都为闪存付出了巨大的努力近年来,技术,尤其是PCIe。对SSD的追求远不止他们对SQL语句和数据结构优化的热情。硬件平台是提升所有速度最直接、最根本的途径。针对这一市场需求,戴尔与Hadoop领域的No.1Cloudera合作,打造了ClouderaEnterprise的集成内存应用,戴尔(Cloudera)In-MemoryAppliances,该平台基于戴尔的PowerEdgeC系列服务器,结合戴尔和英特尔合作的性能和安全调优解决方案和高性能网络,借助Cloudera针对Hadoop和Spark工作负载的部署、配置和调优技术,建立一个高性能、可靠的大数据平台。与MapReduce相比,该方案运行工作快100倍,与传统磁盘方案相比,内存速度快10倍。同时,这个单一平台可以支持多种框架,包括Hadoop和Spark。简化操作、降低成本并完全基于横向扩展技术构建。此外,近两年戴尔针对数据存储和大数据需求不断优化硬件平台性能:提升13GPowerEdge服务器能力,特别推出FX2、R730/R730xd、R530xd等高性能适用于大数据环境的计算系统;针对闪存功能进行性能优化的DellStorageSC系列存储系统;Force10系列高性能、高密度和低延迟网络交换机为大数据优化解决方案提供了完整且现成的硬件平台。让预测和分析变得简单将数据转化为洞察力在数据处理、分析、价值提取、预测,并进一步将数据转化为洞察力之前,首先要将数据从外部迁移到内部,并进行数据整合,构建具有足够广的覆盖面和足够大的数据量级,这至少包括两个任务:在数据集(如数据库)之间复制和迁移数据,以及在应用程序之间迁移。例如,在数据集实现数据迁移方面,目前大数据主流的数据集平台是Hadoop和Greenplum,而企业业务系统和原始平台中的结构化数据往往是基于Oracle数据库或SQLServer构建的,这意味着企业需要从Oracle数据库迁移到Hadoop或Greenplum。这就是DellSharePlex的作用。在其客户网秦的应用过程中,SharePlex帮助网秦消除了各应用系统在软件升级或迁移过程中的服务停滞时间,实现了软件系统的在线升级。另一方面,QuestSharePlex高效支持异构IT平台,可帮助数据库管理员实现高效集成,轻松完成数据采集和分发,将网秦的数据管理效率提升10倍。在应用程序之间同步数据也可能是一件令人头疼的事情。为了消除在使用遗留中间件、设备或自定义代码时与集成和维护集成相关的成本,企业客户搜索了许多解决方案,但归根结底,他们需要的是一种简化软件和设备的方法,并且在本地或云中同步的关键业务应用程序(例如Salesforce)之间连接数据。也就是说,企业需要一个连接内部传统IT架构、内部私有云、外部混合云、公有云的数据连接和同步解决方案。使用直观的拖放界面即时创建集成,自动建议准确的映射并轻松映射应用程序之间的数据字段;使用Boomi功能丰富的基于Web的仪表板监控和维护已部署的集成。BoomiAtomSphere的价值在于数据映射的建立只需简单拖拽即可解决,可视化设计的界面避免了复杂的编码工作,“封装”了所有的复杂性,可以集中管理和监控所有集成过程,“跟踪整体集成性能以及单个流程的执行指标”。具有行业特色的服务和解决方案更专注、更可信的商业洞察基础设施准备好了,数据采集准备好了,顺理成章地来到第三步,也就是大数据真正创造价值的部分:统计数据、过程数据、分析数据,形成有关业务的有效结论,并将数据转化为见解。DellStatisticaBigDataAnalytics是这一步的关键。StatisticaBigDataAnalytics是一个先进的内容挖掘和分析解决方案,完全集成了自动化配置和云功能,可以将自然语言处理、机器学习、高级搜索和可视化结合在一起,并可以与Hadoop结合帮助各种规模的企业处理数据更高效。最新的Statistica13简化并改进了企业将预测模型直接部署到数据源的过程,无论这些数据源是在防火墙内、云端还是合作伙伴生态系统中。作为无需编码且与开源R无缝集成的易于使用的解决方案,DellStatistica提供全面的数据融合、数据发现和高级预测分析工具,帮助企业利用所有数据预测未来趋势、发现新客户和销售机会,探索“假设”场景,并降低欺诈和其他业务风险的可能性。值得一提的是,新的本地分布式分析(NDA)功能允许用户直接在数据所在的数据库中运行分析,更有效地利用庞大且不断增长的数据集。NDA功能将预测算法建模和评分功能直接推送到数据源。这消除了将数据拉取到中间服务器或桌面的耗时过程,并规避了数据绑定过程,允许所有分析处理直接在数据库内进行,并使企业能够充分利用Hadoop集群、数据库设备和其他高性能数据库。性能平台的力量。但戴尔在大数据方面的业务准备不仅限于软件和硬件。随着戴尔服务继续加强其在高级分析和数据科学领域以知识产权为主导的服务产品,一系列新的BPO服务已经正式推出,包括欺诈、浪费和滥用。管理、拒绝可能性评分和预测分析、客户流失管理/客户保留服务和戴尔服务台分析,以创建早期警报和文本分析,戴尔帮助客户跟踪和监控各种记分卡或预测分析模型的性能模型健康追踪器.此外,戴尔深刻理解“大数据具有行业特征,行业需要解决的是具有行业特征的大数据”。戴尔服务在高级分析领域拥有50多个解决方案,包括关注人口健康和患者再入院。针对风险分层和健康等关键问题的医疗保健分析产品;专注于在线交易和欺诈检测的金融分析产品;以及保险相关产品,专注于通过嵌入LifeSys的分析来降低客户风险,LifeSys是戴尔的保险理赔处理平台。流走。高性能的数据保护和恢复是保证大数据可靠性和可用性的最后一步。为了确保大数据的可靠性和可用性,数据保护、备份和恢复,甚至灾难恢复在戴尔面向未来的企业技术蓝图中非常重要。组件、AppAssure备份、复制和恢复软件+NetVaultBackup就是这样做的。在此解决方案中,企业客户可以在单一解决方案中统一备份、复制和恢复,以保护物理、虚拟和云环境中的数据;几乎瞬间恢复系统运行,恢复时间目标(RTO)仅为分钟;在事故发生后提供近乎不间断的数据访问,确保不间断的业务连续性,但戴尔在这方面的能力绰绰有余。RapidRecovery在戴尔的数据保护产品组合中是一个值得记住的名字,因为该产品不仅集成了AppAssure,而且还是一款专为云恢复而开发的产品,例如从云存档中恢复。BareMetalRecovery(BMR)与加密的RapidRecoveryRepository(R3)和基于经过验证的快速数据访问(RDA)的客户端重复数据删除——实现更快的快照复制、缩短从云传输数据的时间和更高的规模提供了技术基础。此外,RapidRecovery还包括两大功能:1.RapidSnapforApplications技术,可以捕获整个应用程序和相关状态,实现完整的应用程序和系统恢复,具有接近于零的RTO和积极的RPO;2.快速SnapforVirtual功能基于DellvRanger技术,可为扩展的VMWare环境提供可扩展的无代理保护,并自动检测和备份在ESXi主机上配置的虚拟机。RapidRecovery的高性能、大规模和云适应性可以为大数据提供可靠、可用和有效的保护,而这是四步大数据优化的最后一步,仅次于基础设施、数据收集、数据洞察和数据保护。通过四步优化,大数据才能真正顺利地在企业中发挥其应用价值,为面向未来的企业的商业洞察和业务发展提供全面的大数据准备。