随着互联网+时代的推进,网页和移动端产生的海量数据对企业的大数据获取和分析能力带来了新的挑战。调查显示,78%的企业用户在互联网+转型过程中会积极制定大数据战略,寻求数据经济带来的价值。自今年年中曙光“数据中国”战略启动以来,将大数据作为未来的核心,实现服务转型。曙光在2011年成立了Hadoop研发团队,目前已经发布到第三版。自2013年以来,一直密切关注社区的先进技术,每年都会更新一个版本。通过数据中国战略,曙光正积极从传统的“硬件设备制造商”向“数据服务商”转型,形成基于“云计算+大数据”的整体服务体系。“数据中国”初期,曙光以硬件起家,大数据战略主要偏向于数据存储和数据处理。XData大数据一体机是曙光大数据能力的代表。曙光大数据总经理宋怀明博士曙光大数据总经理宋怀明博士告诉记者,XData是曙光打造的大数据品牌。它不是单一的产品,而是针对不同行业和应用的数据处理需求而开发的一系列产品。曙光Hadoop发布版大数据一体机为XDataSDH;一体机并行数据库机XData-MPP、面向教学的实验系统EDU等,依托XData品牌打造曙光大数据系列产品。XData-SDH集成曙光运维服务管理软件,为Hadoop生态提供预装和配置管理监控功能。通过分布式大数据平台处理多样化的海量数据,降低部署和管理成本,降低数据风险。.XData-MPP并行数据库一体机面向海量数据查询分析应用,实现高速数据存储和查询服务,适用于数据密集型行业应用,降低人员和技术成本,实现高可用性、高可靠性、高性能和易用性,灵活快速的数据体验。并行数据库一体机的核心是并行数据库中间件。在整合底层资源的基础上,将多个独立的数据库通过中间处理处理成一个大的数据库镜像。因此,对数据库的品牌没有限制。例如,对本地化有明确要求的用户,可以根据需要选择国产或开源数据库;如果原生产系统使用Oracle,不想改变数据结构,也可以选择商业公司的数据库。XData-MPP并行数据库一体机与商业数据库深度合作。不同于曙光的服务器产品线是按需定制,每台服务器的配置都不一样,一体机的受众用户对部署周期的要求比较高。因此,大数据一体机系列产品细分为多种标准化配置,如半配置、单柜全配置、多柜级联等。数小时内完成安装、部署、调测、在线配置。除了XData,围绕数据存储硬件,曙光拥有高、中、低各种型号的磁盘阵列,以及独立的大数据分布式存储软件和集群NAS软件。存储软件作为大数据分布式存储解决方案的组成部分,是大数据存储和处理的核心技术。在应用领域,曙光将传统广电收视行为分析与新兴的广电行业互联网用户画像技术深度融合,构建光电行业大数据分析体系。根据观看数据、用户属性、广告点击、运维数据等信息,生成实时统计报表。协助广电行业优化业务。曙光大数据研发中心经理郭庆先生(左)、曙光大数据总经理宋怀明博士(右)接受记者采访。据曙光大数据研发中心经理郭庆先生介绍,此前发布的在线运维平台EasyOP为用户提供了在线系统数据的实时分析,广电行业大数据分析系统分享了这一点时间在底层技术方面很常见。EasyOP直接复用广电行业大数据平台解决方案中的服务器内存、操作系统日志等基础数据,对整个运维环境进行监控。广电行业大数据分析系统更进一步。除了对基础运维数据进行管理和分析,还采集机顶盒收视行为数据,对应用数据进行分析和画像。两个团队之间也有比较密切的交流和联合研发。在大数据转型过程中,曙光去年提出了超融合架构的概念。未来,大数据和中科曙光在超算领域的优势将从架构上融合。随着用户应用与底层架构的结合越来越紧密,如何通过一个系统支持多种应用,对曙光软件模块的开发提出了更高的要求。在下一个路口,早日实现数据中国梦。
