简介:在DTCC2021大会上,阿里云数据库事业部产品与解决方案部总经理王伟民(昵称:伟民)发表主题演讲《云原生数据库2.0,一站式全链路数据管理与服务》,并接受了IT168Enterprise&ITPUB执行主编老鱼的专访。本文内容整理自现场采访。受访嘉宾:阿里云数据库事业部产品与解决方案部总经理王伟民(化名:伟民)采访人:IT168企业&ITPUB执行主编老余DTCC2021大会)记者:请介绍一下,您目前负责阿里云数据库的日常工作。王为民:首先让我自我介绍一下。曾在甲骨文、微软、华为等公司工作过。我一直在这些公司从事数据库相关的工作,担任过不同的职位。我今年加入阿里云,目前主要负责四个方面的工作。第一部分是产品管理,和我之前的工作完全一样。主要是以市场和客户需求为导向,看我们需要开发哪些产品。第二部分是解决方案,负责产品的商业成功,包括行业、区域和国际市场。第三部分是产品体验,包括文档、体验设计等,主要是为了让用户有更好的体验,更高效地使用我们的产品和服务。第四部分是品牌与生态。品牌方面包括对行业产品建设的持续影响。就生态而言,数据库是基础软件。在PaaS层,不像计算、网络存储、安全这些是大家需要的通用能力;他们也没有像SaaS应用程序那样有自己的流量入口。因此,单独推广数据库效率不是特别高。我们需要以生态的方式进行营销和推广,并与合作伙伴一起将其更快地推广复制到主要的应用场景中。以上是我目前在阿里云的工作。记者:相当于OLAP、OLTP、NoSQL。研发针对各自的产品进行整合开发,你的身边变得产品化。王为民:对,客户的需求来我们团队。我们将根据产品规划的路线图进行产品规划、研发承接需求、投入资源、推动产品上市。此外,产品的商业模式和定价等GTM工作也由我们团队负责。记者:您今天演讲的主题是“云原生数据库2.0,一站式全链路数据管理与服务”。为什么选择这个主题,您认为这个主题能给参会者带来哪些好处?王为民:我们首先强调“一站式”。这个“站”的意思是“OneStop”,而不是“技术栈”的“栈”。这称为“堆栈”。我们现在做的是云服务。多款发动机上架,实现多元化供应;每个产品或引擎都针对特定的用户场景进行定制和优化,这也是经典的通用(GP)和特殊用途(SP)之间的权衡。有很多公司试图用GeneralPurpose解决所有问题,但到目前为止,它可能在某些场景下是最优解,但在所有其他场景下都是次优解。当然,通用有一个优势。对于产品研发团队来说,它的ROI是最高的,持续投入打造一个产品是为了解决所有的场景。但实际上有一个问题。我们看到有很多针对特殊场景设计的产品,比如缓存、嵌入式物联网场景、边缘场景、多模等,这些都是GP产品无法很好解决的。迄今为止,已有数千个行业在进行数字化转型和上云。从哲学上讲,这是一种理想状态,不可能用一个产品解决所有问题。我们想用的方式就是用产品和产品组合来满足各种业务场景的需求,相当于我们的GP+SP模式。所以这就是我们选择这个主题的原因。其次,要强调“全环节”。我们研究发现,在大多数企业中,各种产品和解决方案非常复杂,但它们之间的衔接和协调还存在很大问题。我们或许可以通过使用云来解决“烟囱”问题,但实际上只是解决了资源的“烟囱”,业务和数据之间仍然没有联系。由于数据是一种新的生产资料,因此需要数据操作系统。我们想用DMS来实现DataOS。这是我们的想法,也是我们一直努力的方向。迄今为止,丰富的业务场景和不同的业务负载特性,很难用一个产品最终解决所有问题。这是我们最大的领悟。所以我们希望带来真正的改变。记者:刚才你提到这个观点,和我下面问的趋势是一样的。在专用数据库和多模式数据库方面,很明显你的专用数据库类似于亚马逊的,而不是微软的“一揽子”——一套产品适用于所有场景。现在各个厂商其实都在讲云原生。你们的云原生架构在演进过程中和其他厂商的架构有什么区别吗?王卫民:首先像微软和甲骨文,他们的品牌比较集中和统一,但实际上是GP和SP的结合体。Oracle有很多品牌,比如缓存场景的OracleTimesTen,高可用场景的Oracle。RAC,所以Oracle有一线品牌和二线品牌。同样,微软有SSIS、SSAS、SSRS做分析、报表、集成等,还有AzureCosmosDB做多模;所以我觉得大家之所以选择了“走向云原生2.0”这条路,最核心的原因是大家看到了。负载的多样性对底层基础软件的设计挑战太大,不可能用一种架构和一套代码覆盖所有。说到和朋友的不同,在过去的云原生1.0时代,大家其实已经完成了产品化和服务化,基本完成了基础设施池化。在管控方面,多租户,按需使用,并且以体积来衡量,可以进行不同程度的扩展和收缩。云原生2.0时代,更注重产品与服务的联动。在刚才的分享中(第十二届中国数据库技术大会),我提到了七个客户案例,没有一个是单一产品解决的。为了满足客户的转型需求,基本上有交易型、分析型、实时数据入库、分仓集成等多种需求,需要实现数据发现、洞察和价值实现。在我们看来,云原生2.0时代可能会朝两个方向演进。一是继续巩固提升单项产品差异化竞争力。二是多产品高效协同,提升体验。记者:在单品方面,我们要不断强化自己的优势。整体上,你也会强调整体解决方案的优势,无论是OLTP、OLAP还是NoSQL,所有产品都寻求更好的协同。王为民:我们现在有一个想法,就是将解决方案商业化。例如,如果客户想要一个在线电子商务系统,我们可以直接提供一个现成的系统,就像一个带有缓存和交易的小型数据仓库,中间有链接。因为一开始可能没有那么多数据,这个数据仓库是可扩展的。虽在云上,亦纵也。业务是烟囱,资源是横向拉动的。这就是我们正在努力做的。解决方案产品化,其实业内很多公司都做了。我们可能只能做一个大概的方案,结合行业的knowhow做起来可能还是比较困难的。记者:如果要用比较简单的方式,一两句话来描述“云原生数据库2.0”,应该怎么说?让别人一下子明白“云原生数据库2.0”的概念。王为民:“一站式全链路”还是一个比较专业的名词。如果用业务来讲,应该是多个引擎的高效组合,以满足客户多样化的业务负载。另一种说法是“全场景”、“全数据生命周期”,但这些都是比较营销的说法。记者:是的,对于非技术人员来说,理解起来还是有点晦涩难懂。下一个问题其实来自TiDB的黄东旭提到的一个观点。他认为,所谓的云原生数据库并不是真正的云原生,能够回归线下部署的也不是云原生的。您如何看待这个观点?王为民:这个观点很新奇,我以前从来没有听说过。我们遇到过一类客户上云,要求数据随时回流上云。客户之所以有这种诉求,核心原因是他们担心云是超级锁,担心“我在你的云上,除非我挂了,这辈子都在你的身上”。在与客户沟通的过程中,会发现有些客户对差异化特性比较抵触,担心因为差异化特性而依赖某个厂商。当然,这方面有很多不同的技校。一些客户在编写SQL时不使用特定于数据库的语法。中间有一个抽象层,可以适配底层的MySQL,或者用SQLServer或者Oracle代替。他看不见。其实业界也有这样的产品,比如SourcePro,可以屏蔽底层数据库与上层应用的差异,所以我不认同这种说法。数据库产品化和云化应该是两个阶段。它可以是一个产品。该产品可以在本地或云端配置,但云端可以利用许多特定于云端的功能,例如资源的弹性扩展,但不仅限于云端。比如RDSMySQL能不能上云?它必须能够上云。按照刚才的标准,不是云原生数据库。但是如果解耦了,变成像AWSAurora,计算和存储解耦了,Aurora就很难下来了。是否属于“云原生”,应该根据客户的业务场景和需求来考虑,而不是从技术实现上来判断。毕竟,许多客户有不同的要求。比如提着包入住酒店,今天入住这家酒店,明天入住那家酒店,但酒店不能阻止客人离开。记者:您认为他的说法是根据国外市场得出的结论吗?是不是像你说的能涨能跌是国内市场的独特需求?或者这是全球市场的需求?其实最近看到一篇文章,观点是“国外不用distributed,国内用distributed”。王为民:关于你提到的,国内市场是不是有特殊情况?我觉得未来公有云成为主流的时候,肯定会有用户如何考虑平台中立和云中立的问题。现在我们已经看到很多类似的需求,比如客户的主站在A云上,容灾在B云上;另一个是交叉连接,一些业务生产在A,备份或备用在B,另一部分业务主站点在B,备用在A。未来客户需求可能会不断变化,我们的理念是“客户至上”,这是我们必须要考虑的。Tunghsu的观点目前比较新,但是你觉得TiDB可以离线部署吗?这绝对是可能的。关于最近看这篇文章,指的是InfoQ最近才实现了底层数据库的分库,以前都是单库。就产品及其架构而言,首先,云厂商本身有一个目标市场可供选择。比如AWS不做线下市场,不做on-premise部署,最多只有一个Outposts边缘部署,只能提供有限的能力。,可能是他的客户选择的问题。记者:东旭的观点比较超前。他们的许多客户都在国外。国外市场对公有云的拥抱程度很高。对于金融和电信等行业的主要贡献者来说,云的拥抱程度更高,至少相对而言。王为民:对于公有云的大趋势,我的判断和东旭是一样的。对于国内的金融、电信行业来说,大量的业务负载还没有放在公有云上。我觉得可能有两个原因:一是国内对信息安全、行业监管、合规等方面的政策要求;二是云端客户对系统软件运维管理的自主可控要求。其实你说在公有云上不安全?不确定。美国国防部100亿的JEDI项目全部在公有云上。美国最大的银行CapitalOne100%在公有云上,没有使用私有云。在我看来,公有云的未来还是比较乐观的。许多行业都需要一个过程。上云可能需要十几年,赛道很长。记者:因为在国外不使用分销,分销就没有意义和应用价值吗?王为民:这又是一个值得讨论的问题。我认为复杂性是一种保护问题。在国外,比如GitHub,以前没有用过分布式,但不代表这部分工作不会做。可能在应用层和中间件层完成;但是从数据库的角度来说,我们希望把复杂的交给数据库,把简单的交给应用。我们希望分布式数据库可以像单机一样进行应用开发和管理维护,让应用不需要关注底层数据库容量、事务、伸缩扩展、一致性等问题备份。事实上,国外数据库的并发用户数和用户规模并不如国内突出。毕竟,我们有人口红利。比如阿里的双十一“剁手节”,支付系统Oracle数据库能支持吗?肯定是可以的,底层用Oracle替换OceanBase也是可以的,但是TCO太高了。所以,是用分布式产品来解决,还是用分布式方案来解决,又是另外一个思路。例如,连接到分布式中间件(如ShardingSphere)的应用程序和底层的单机数据库可以做同样的事情。国外不用的话我觉得不是没有意义,但是要看这些投入的水平。比如我觉得从产品的角度来说,随着使用量的增加,边际成本在不断下降,所以我觉得这样做是非常有意义的,比如可以让应用不关心灵活的交易,业务的调整等等,这个复杂度是在数据库层面处理的,所以我觉得分布式数据库还是很有意义的。在国外可能不需要使用分布式数据库,但是分布式数据库可以降级为单实例,在OracleRAC中只用一个节点,是没有问题的。记者:以前一直认为国内云厂商中,华为在数据库方面的生态是最好的,经常看到有谁加入了它的生态合作伙伴圈。阿里是第一个在云上吃螃蟹的,所以阿里云一直保持着一定的先发优势。同时,阿里也有一些类似于双十一的极端场景,这让其积累了技术。当然,这只是我个人的看法。在您看来,阿里云数据库相比其他竞争对手在技术、产品、业务、生态等方面有哪些优势?王为民:首先,对于我们的产研团队来说,我觉得第一个优势就是组织上的高度团结一致,我们可以全力以赴。李飞飞不仅是阿里云数据库事业部的第一人,也是达摩院的数据库和存储实验室的第一人,相当于领导着所有的产品、研发和预研团队整个阿里巴巴系统的数据库。产品策略、传播、营销等战术高度一致,这是第一优势。其次,阿里确实有先发优势。我们很多客户都不是新上云的,比如基于IDC的,刚上云。但第一天在云端成长,在云端诞生,在云端成长。第三,我们专注于产品。我们没有很多产品。我们的产品分为三类:开源托管、商业产品托管和自研产品。核心就是围绕这三类产品。我们有不同的策略。例如,开源托管侧重于易用性、安全性、可靠性和成本效益;商业产品主要使用其开放的生态系统。在这方面,我们主要解决多元化业务合规生态的问题。我们与SQLServer和MongoDB直接相关。对于业务合作,这些都需要阿里云继续遵守规定;自研产品,我们主要集中在PolarDB、AnalyticDB、Lindorm、Tair四大类上,分歧不是很大。说到生态,其实每个厂商做生态的方式都不一样。有的朋友虽然是做数据库的,但是不想把数据库作为一个独立的行业来做。通过创建第二个平面来解决“卡脖子”问题也是非常了不起的,我们也需要这样的技术。阿里在做生态,尤其是我们希望用“一体化”的方式来做。生态要开放繁荣,最重要的是能够与合作伙伴共享利益。如果做不到这一点,我觉得这个生态是行不通的。所以我们一直在探索如何让生态参与者加入我们把蛋糕做大,同时看看如何更好地照顾各方。在生态方面,我们也一直在不断投入,比如分销合作伙伴、SaaS集成、ISV、交付合作伙伴、培训和认证等,但确实我们在这方面的投入需要不断加强。记者:我在上个月的阿里媒体沟通会上采访了李飞飞。他提到你们要进入线下市场,因为他觉得线上的格局已经基本定型了。对于线下市场数据库领域的高端客户,比如金融政企,有朋友比阿里有优势吗?阿里现在要发力线下市场,他要干什么?你的差异化优势在哪里?王卫民:首先,线下市场的需求是刚性的,这是客观存在的。目前,我们已经积累了包括运营商、金融行业、政府在内的众多客户。每个人都在讨论一个问题。如果再来一次,是照原样改变平台,还是在原有基础上改造升级?目前,我们看到包括运营商在内的客户有一个共同的需求。今天也分享了一个运营商的案例,他的业务系统(包括老板系统)直接云化了。在这个过程中,他们要结合很多概念,包括“云”、“泳道”切入上层应用、微服务、整个运维开发。我认为这个替换不是简单的替换。不要拿产品,而是用解决方案代替它。其次,我们认为在政企市场直接与甲骨文竞争可能会产生误导,比如性能。因为性能并不是用户选择机型的唯一因素,还有很多其他因素。我们希望DBStack可以用于敏捷交付和无缝集成,这样一个可以部署在客户本地的轻量级云可以把用户可能使用的所有数据引擎都放在上面。现在,广东移动、安徽移动等客户都在使用这些产品。与竞争对手相比,他们可能有他们的灵活性,我们也有自己的差异化特点。比如友商明确表示不想做私有云,就会释放很大一部分市场,势必会有很多友商来填补这个市场的空白。对于李飞飞提到的这一点,我理解我们之所以要去做,核心原因有两个:第一,这是高端市场,也是一个标杆,是一个明确的刚性市场需求。表面。其次,这些业务场景和业务负载对于驱动产品的研发、测试、持续提升产品的稳定性和可靠性非常有帮助。我想结合这两个因素,我们一定会坚定不移地去做。记者:就像您提到的“云原生数据库2.0时代一站式全链路数据管理与服务”,这也是我们看到的现实。针对不同的场景,需要不同的数据库来解决问题。没有所谓的“一站式酷宝打天下”。我们看到的所谓趋势,比如云原生+分布式、软硬件一体化、湖仓一体化、HTAP等,本身就是一种融合,背后是用户简化需求的推动.对于用户来说,管理一个数据库和同时管理四个数据库的复杂度和难度肯定是不一样的。在趋势中,大家都希望简化,但是我们看到大家还是针对一个专用的场景,使用一个专用的数据库。这是不是有点自相矛盾?王为民:我们要解决的很多问题其实都是多变量的。首先,把所有变量都考虑进去是很有挑战性的,如何对这些变量进行优先级排序,比如可靠性、开发、管理、运维等一系列因素都要综合考虑。其次,既然通用产品不能满足需求,那么用“通用+专用”的组合来降低复杂度,怎么办?我们采用DAS、DMS等技术手段解决问题。我们希望DAS能够利用AI技术解决传统DBA的补丁升级、日常巡检、参数配置或调整、备份告警等日常工作。现在有一个特别好的趋势。我们积累了大量的数据库负载、水印、慢SQL治理等最佳实践,可以为我们做这些工作提供借鉴。像深度学习,90年代杨立坤先生最先提出的时候,90年代只能检测美国邮政的邮编。不像今天,它的用途非常广泛,主要是数据和计算能力的增加。回到刚刚提到的问题,这个矛盾在过去可能是无法克服的。但是今天,我们看到了解决的机会,我们可以用AI4DB来解决。这样人们就可以更专注于ApplicationDBA、逻辑设计、数据放置等高价值的工作,日常工作可以通过程序自动化,将两者有机地结合起来。记者:我们在之前的新闻稿中提到,阿里云将全面进军线下市场。线下市场,大家其实都在关注金融行业,尤其??是银行。我观察到,银行做分布式改造是必然趋势。李飞飞之前也提到,在云栖大会上,你们开源了一个分布式数据库,比如PolarDB-X。我可以理解为你进入线下市场的组合?王为民:对,可以理解为重点动作之一。国内数据库开发各方积极性高,厂商众多。但是对于很多公司来说,他们很担心你的公司有多大?我们会贡献您收入的50%-60%吗?他们其实很担心数据库公司的可持续性,这其实是一个信任的问题。在我看来,开源包括两个方面:第一,以开放的心态、开放的心态解决开放的问题和挑战,吸引更多的人参与;第二,开源相当于智力众筹;此外,开源还表达了信心,是用户检验质量的一种方式,可以大大减少建立信任过程中的挑战。最后当然我们也希望这样发展生态,比如应用的生态,人才的生态。记者:那么,开源只是一种策略,并不是决定数据库企业和厂商能否在未来竞争中脱颖而出的必要条件?王为民:对,不是。开源产品有很多,可能会流行,但不一定会流行(商业上的成功)。也有很多产品一直没有受到好评,没有流行起来,就是没法继续玩下去,只好开源了。我们希望这样继续做下去,但不代表一定会成功,因为开源的项目确实太多了,但最终商业化其实是不成功的。不仅在数据库领域,在其他领域也是如此。比如以前有OpenOffice和OpenSolaris。即使我们认真的做OpenSource,还是有很多地方需要学习,需要避免的陷阱,这段时间要做的事情也很多。记者:国内数据库的应用越来越多,但实际上更多的是存在于边缘业务,核心业务相对较少。在部署国产数据库的同时,很多企业还在更新Oracle数据库,甚至到现在,两条线并驾齐驱。出现这种现象,究竟是客户心中的顾虑——担心国产数据库支撑不住,还是目前国产数据库在承接高端、核心业务方面确实存在一定的问题?王为民:这两个因素都有,而且不止这两个。诚然,很多客户在继续使用商业数据库产品的同时,也在尝试使用更多的供应商,包括国内的数据库厂商。这是目前的现状。有几个原因:首先,商用数据库经过几十年的发展和海量(百万)用户长期真实业务负载的考验,无论在企业级特性、稳定性、商业模式、服务等方面都非常优秀。尝试和测试。无论使用什么产品,用户业务系统都能高效运行。目前,国内很多厂商无论是在研发投入、产品成熟度,还是产品信息、生态、人才等方面,与商业数据库相比还存在差距。这是客观事实,我们也应该正视这个客观事实。他们干了五十年,我们干了十年。投入比别人少很多,想要超越他们是不可能的。这不符合客观规律。第二,确实有很多业务场景不需要这么高端的产品。这句话有两层意思。一是目前很多产品在企业功能、特性、完备性、性能、稳定性等方面存在差距(与商业数据库相比),但这并不意味着差距是不可逾越的,只是需要时间来克服。.二是在很多业务场景中,很多商业数据库的功能和特性其实用不到,也不需要用到。统计数据表明了这一点。记者:我之前了解到,绝大多数使用Oracle的公司,可能连一半的功能和性能都用不上。对于很多公司来说,性能问题可以通过很多架构很好的解决。王卫民:很大程度上,我们的产品对于很多核心业务场景和典型业务负载来说已经足够了,但是我们产品的稳定性或者其他方面可能还有很长的路要走。需要接受大量用户长期持续的负载测试。记者:我能理解吗?目前国内的数据库都有了,但是离好用还有一定的距离?之前看到国内数据库的目标分为技术目标和市场目标。市场目标,一是实现自主可控的本土化,二是走出去。在技??术目标上,分为四个目标:别人有我没有,别人有我有,别人有我有,别人有我有。在您看来,目前整个国内数据库市场在技术目标和市场目标上处于什么阶段?王伟民:我觉得从技术目标和功能特性上来说,可能有一些特性是别人没有的,但是我们还处于追赶和补充很多共同特性和共性的阶段。”或者“我有每个人的一小部分”,不同的厂商在榜单的完善程度不同,市场差得远。如果算上线上和线下市场,阿里云已经做到了中国第一的位置,超越甲骨文。但如果我们回到全球范围来看,2020年Gartner统计,微软全球第一,甲骨文第二,阿里云全球第七。在ToB、云和数据库市场,我们还有一个与龙头企业的差距很大,比如甲骨文一个季度的净利润几乎超过100亿,即使数据库只占40%,除去它的标准服务,也可能有数十亿,这是一个不可思议的数字图中国软件百强企业的净利润加起来可能没有那么多记者:目前在帮助客户上O、到MySQL、到Teradata等,会面临哪些挑战?通常帮助客户?王为民:目前最大的挑战是生态层面。任何客户的业务系统都无法做到直接替换。北方可能是应用端,垂直方向是数据集成,南方可能是操作系统、硬件等一系列适配。当你要更换的时候,很多客户会说,“你不仅要更换这个产品,还需要保留原来的控制、开发、运维、应用等一系列的流程连接。”因此,生态方面是一个很大的挑战,其次是人才,很多公司在人才方面需要一定的专业积累,改变产品可能需要一个学习的过程,对人才来说,学习曲线的斜率应该降低,学习成本不应该太高。所以我们在兼容性方面,还有很多工作要做。兼容性方面的工作是一个动态的移动目标。今天已经达到了一定的程度,兼容对象向前推进了,而且还需要继续做兼容性工作,做到90分和80分差别不大,但是90分到95分的工作量巨大,从95分到100分几乎不可能。所以我们在思考是否要遵循,哪些方面应该遵循,哪些方面我们要用其他的方法来替代——或者根本不考虑兼容性等等,这些都是要考虑的问题。当然,中间的选择是非常困难的。记者:今天的采访到此结束,谢谢王总接受采访。原文链接本文为阿里云原创内容,未经允许不得转载。
