当前位置: 首页 > 后端技术 > Node.js

数据创新的四大陷阱

时间:2023-04-03 21:23:57 Node.js

简介:数据的重要性在今天不用多说。所有企业都意识到数据的重要性,都希望用数据驱动业务发展。然而,很多企业信息化管理者对数据智能化、数据驱动化仍然存在一些误解,而这些误解会把企业的数据利用推向深渊。陷阱一、应用还没有搭建好,没有考虑数据利用。当我们和一些企业信息化管理人员聊天,说要尽快考虑数据的利用,对数据进行统筹规划时,经常会听到这样一句话。“我的生意还没开始,还没到考虑数据利用的时候”这句话代表了企业对数据利用的很大一部分理解,即数据利用从已有数据开始,数据是存放在应用建好之后再建数据库,所以先建好应用,数据入库后再考虑如何使用数据。听起来这个逻辑是完全正确的。但实际上,这是很多企业对数据利用的首要误解:“先做应用,再考虑数据利用”。如果用这种思路去建设,一年之后,往往公司马上就会提出新的问题,“多个应用系统之间的数据不连通,不对齐,不一致,数据不能用”。这种误解是由于根本无法完全理解数据利用的两个本质:第一,数据是客观存在的,不取决于你建不建应用。业务只要在运行,即使不建任何系统,它的数据也是实时产生的,只是你没有采集。数据是数字世界中业务的组成部分。业务流程和行为会一直产生各种数据,而不是构建和应用这些数据。例如,当快递员收到快递单时,发件人、收件人、货物类别、送货地点、送货地点、运输方式、距离等都已经生成,并将驱动这条快递的方向。有没有信息系统的支持,只是改变了记录和传输这些数据的手段是一张纸还是网络。这些数据是客观存在的,不会被信息系统本身改变。我们需要从本质上认识到,数据是业务在数字世界的投影模型,是业务的镜像,是客观存在的。只要有业务,就会有相应的数据。应用程序只是通过软件将数据收集到存储设备中。其次,数据利用的规划应早于应用程序和流程的构建。在建造房屋之前,我们必须进行总体设计,规划建筑物的各种使用场景。只有这样,才会没有进不去的房子。现在,每个企业都意识到数据是企业的核心资产,而应用程序则是收集和利用这些资产的工具。为了充分利用收集后的数据,每个企业都必须在应用程序和流程的规划之前完成数据利用的规划。这包括企业数据资产目录的规划设计,企业数据利用场景和数据存储的规划,以及处理和分析这些数据的技术平台的需求规划等。数据优先,当系统还没有尚未建成,做好数据蓝图规划,完成各应用系统的数据分布全景图,使企业避免数据孤岛的存在。所以,如果您还没有构建应用程序,那么恭喜,这是规划数据利用蓝图的最佳机会,所以现在就开始吧。陷阱二、没有大数据,不考虑数据利用。“我们现在的数据很少,只能说是小数据,谈不上数据利用。”这也是典型的数据利用误区。我第一次听到这个短语是在B2B2C零售业务中。的确,以经销商为主要渠道的传统品牌商往往没有建立自己的电子商务系统,因此无法获得最终的消费者行为数据。他们有的是SellIn的数据,而SellIn的数据往往体量不大,维度也不多,所以利用价值有限。但是,公司现在做的是通过小程序、小应用与终端消费者、客户建立各种联系,从而获取各类数据。它很大,维度很少,但是当所有这些点连接在一起时,就构成了丰富多样的用户数据全景图。该企业业务负责人坚信,在数字时代,谁拥有更多的数据场景,谁的竞争优势就会更强。这个例子充分说明,也许你现在的商业模式决定了你没有丰富的数据,但你仍然需要通过各种应用创新,多渠道获取用户和消费者数据。以及构建什么应用,获取什么数据,获取到的这些个体点状数据之间如何形成联系,从而结合数据场景的价值?这意味着在构建应用之前需要进行数据规划,勾勒出一张数据场景图,从而沿着这张图构建一个中小型应用。陷阱三、数据利用就是数据分析和挖掘。交易应用系统不使用数据技术。过去,应用系统分为OLTP和OLAP,在线交易系统和在线分析系统。因此,经常会看到应用程序本身就是一个交易软件。按照传统的架构,它是一个OLTP系统,所以一些OLAP技术往往用不到。然而,现在的情况已经发生了翻天覆地的变化。以网约车调度系统为例,按照传统的划分,这是一个典型的交易系统,创建订单,分配司机。但是,如果要能够支持每秒几万个订单的调度和分配,用人工分配是不可能的。该调度系统需要具备实时数据分析能力,定价和路线规划部分需要参考历史数据分析结果。这样,这个典型的交易应用就是由数据驱动的,它的底层和核心其实就是批量数据分析和实时数据处理。未来所有的应用都是这样,就是OLAP在支持OLTP系统的每一个决策和行为,从而成为一个智能应用。数据技术正在逐步重构所有传统流程应用,将其转变为数据驱动的系统,并变得更加智能。陷阱4.最重要的是算法,所以软件工程公司不能做数据科学的项目。提到数据项目,很多人首先想到的就是算法模型。好像只有做研究、做算法、做人工智能的人才是做数据的。所以现在有一种观点认为,信息技术行业分为算法和软件,只有做算法的人才是在做人工智能和数据。这是将算法与软件工程区分开来的典型误解。就像前不久,一个长期合作的客户,用“Staywalker不是做人工智能”的固有印象,否定了我们的一个机会。这是对人工智能应用的误解。我们用下图来体现算法和人工智能(数据科学)的关系。人工智能的底层是由各种算法组成的。但是,业界大家常用的算法都是公开的,真正研究和生产这些算法的是学术研究机构。人工智能分为两个领域,一个是前沿研究领域,一个是应用领域。作为从事工业生产和商业经营的企业,后者才是需要的。后者最重要的是利用软件工程能力,将合适的算法应用到有价值的场景中,从而为业务赋能。在算法之上,人工智能的应用更重要的是要有足够的高质量数据集,以及将算法和数据开发成具有良好用户体验的智能软件的工程化能力。因此,优秀的人工智能企业除了具备调优调用公共算法和代码的能力外,还具备业务创新和软件工程能力。总结与启示通过一一分析数据智能的四大陷阱,我们可以得出以下启示:1、数据规划应优先于业务系统建设,构建统一一致的数据全景图,避免应用鸿沟.2.构建完数据全景之后,再一个一个构建小应用,沿着地图收集填充这些数据,从而构建自己的数据资产。3、所有的应用软件都将被数据技术赋能,成为数据驱动的智能应用4、人工智能应用到业务最重要的是场景创新能力和软件工程能力