当前位置: 首页 > 科技观察

基础软件+开源,为什么是现在?

时间:2023-03-16 15:48:30 科技观察

2020年以来,全球经济环境疲软,部分赛道脱颖而出,为长线资本和创业者带来结构性机会。  一个趋势是,此前在中国市场被低估的开源和数字基础设施项目,成为众多科技赛道投资人关注的焦点。  这里的数字基础设施指的是云计算基础设施、基础层数据存储和处理、云原生的代表技术,而这些公司和产品大多以开发者为用户,即在toD市场,开源是常见的模式。  尽管外部环境惨淡,一些国内外“数字基建”项目仍频频传出逆向融资消息。  2020年4月,物联网大数据平台陶思数据宣布完成逾千万美元A轮融资,这是其今年第二轮融资;云管理软件和服务商千云科技也在2020年第一季度完成了两轮融资。  人工智能、5G、物联网等技术创新不仅带来应用层的创新,更带来应用层的技术变革数据感知、传输、存储、处理等基础层。在数字基础设施领域,更容易出现普遍的机会。  算法的投资热潮正在过去,基础软件的投资热潮即将来临。  这背后也是整个AI和数据技术的投资逻辑的转变。  在今天的文章中,我们将分析导致这种转变的各种因素。  1。又跟风?中国VC一直有跟风美国的“习惯”。目前基础软件在国内也因为这个因素而流行起来。  先来看看美国蓬勃发展的基础软件市场现状及其上升环境。  美国市场经历了彻底的信息化、云化、智能化浪潮,在软件基础设施领域涌现出不少公司。  上市公司中,MongoDB和Elastic这两家明星开源公司股价一路飙升。  数据库公司MongoDB于2017年10月上市,截至2020年5月26日,其市值已超过126亿美元,2020财年营收已超过4.2亿美元。即使在疫情期间美股遭受史诗般的损失时,MongoDB仍然保持着20多倍的PS(市销率)。    2019年4月,MongoDB还斥资3900万美元收购了面向应用程序的开源数据库Realm,以扩展其用于移动解决方案的工具库。  数据搜索公司Elastic于2018年10月在纽交所上市,市值已超过50亿美元。Elastic成立于2012年,最著名的是其开源搜索产品Elasticsearch。  私营公司也表现出色。  2020年5月,开源数据库CockroachLabs获得8700万美元D轮融资。迄今为止,CockroachLabs已累计融资超过1.951亿美元。  开源平台Confluent也在2020年4月完成了2.5亿美元的E轮融资。截至目前,Confluent累计融资额已超过4.559亿美元,成为中国非上市公司中累计融资额最高的公司。行业。  HashiCorp,成立于2012年的云计算自动化平台,2020年3月获得1.75亿美元E轮融资,估值51亿美元。  HashiCorp表示,其营收连续四年同比增长超过100%,客户数量也在每年翻番。超过100《财富》世界500强企业正在使用他们的产品。HashiCorp有85%的员工在全球范围内远程工作。  美国市场的繁荣离不开大数据和云计算的背景。可以说整个基础设施的增量和变化都是美国领先的。  Google在2003年和2004年发表的GFS和MapReduce论文,全面揭开了大数据时代的序幕。  亚马逊最早进军云计算,AWS上线16年。  云的广泛应用带来了程序运行环境的升级,随之而来的是一波又一波的技术革新,包括集群技术、流计算、数据库、容器技术、机器学习等。  第一个趋势是云计算基础设施,主要集中在容器和kubernetes技术上。  容器就像是IT世界中的“海运集装箱”。迁移到云的第一步是虚拟化物理资源。在容器技术出现之前,虚拟化是通过虚拟机来完成的。容器是轻量级虚拟化。最常见的容器引擎是2013年出现的Docker。  除了用Docker创建容器,还需要工具来编排容器,kubernetes就是这个工具。Kubernetes起源于Google内部的Borg项目。谷歌用Go语言重写并命名为Kubernetes,并于2014年6月开源。之后,在众多厂商和开源爱好者的共同努力下,Kubernetes迅速崛起。  同时,作为基础设施的数据处理框架也在完善中。  Google的论文诞生了大数据计算框架Hadoop,Spark诞生于伯克利大学AMPLab实验室,Kafka诞生于LinkedIn,Facebook也开源了大数据查询引擎Presto。  也是一个深度学习框架和配套工具。在研究热潮下,开源的深度学习框架层出不穷,比如谷歌在2015年开源的深度学习框架Tensorflow,以及Facebook开发的PyTorch和Caffe。中国的互联网公司也推出了自己的框架,比如百度的PaddlePaddle、小米的MACE、腾讯的ncnn。  从资本的角度来看,一个重要的触发点是前两年开源原厂和IaaS大厂的长期矛盾,甚至近几年还发生了一些纠纷。  例如,云服务商“一哥”亚马逊接二连三被多家创业公司质疑,而去年还发生了开源创业公司“六门围光明顶”的事件——4月2019年,七家初创公司在硅谷召开会议,讨论如何对亚马逊提起反垄断诉讼。  原因是亚马逊复制了其他科技公司创建的软件并将其集成到AWS中。AWS本身作为IaaS厂商收了钱,但成本并没有分摊到原厂。  也处于这种长期的矛盾之中。很多开源原厂商修改了开源许可证,从开源变为“源代码可用”,无法集成到云服务中。目的是防止云服务商“偷羊毛”。  IaaS厂商与原始开源厂商之间的博弈以及上述游戏规则的变化,一方面导致大厂商开始自行研发数字基础设施技术,但另一方面也出现了创业公司的福利——开源基础软件的开发退出窗口突然打开,因为大厂商开始通过“买买买”的方式来补充生态。  有实力的买家,首先是IaaS大公司。比如,微软以75亿美元收购了GitHub,IBM正在以334亿美元收购Linux巨头RedHat(红帽)。  另一类买家是瞄准云转型的toB巨头,例如Salesforce此前以65亿美元收购综合平台服务商MuleSoft。  其实一直以来,开源软件在做大之后,对大公司有很好的并购价值。最典型的案例就是AndroidforGoogle。  如今,基础设施的革新,对于创业公司和VC来说,是新一轮的基础软件机会。  2。中国的机会  转眼看中国市场,基础软件创业的热潮,确实有全球趋势的因素,但也有本土的逻辑。  与世界接轨,云计算的普及和开发者数量的增加也是中国市场不可阻挡的趋势,中国的发展速度和未来空间都是全球最高的。  根据IDC发布的报告,2019-2023年中国公有云IaaS的年复合增长率将达到46%,预计到2023年中国IaaS市场规模将达到2087亿元。  到2024年,50%的中国大型企业将依赖第三方服务商进行容器、开源、云原生应用开发。  此外,开源项目的商业价值也逐渐被中国资本市场所认可。  这是因为欧美成功的商业模式已经用完了。  目前开源的收费方式一般有以下三种:  第一种是提供技术支持和咨询服务,比如RedHat(红帽)。该公司成立于1993年,主要销售基于开源Linux操作系统的软件和服务。主要盈利方式是红帽公司免费提供开源软件,但向客户收取维护、支持和安装等服务费用。  但是,这种商业模式是项目制,难以规模化,“红帽模式”也不易复制。  比较常见的方式是Open-Core,即核心代码开源,商业版套件收费。  由于大多数企业客户在下载源代码后需要购买附加功能才能大规模使用,这种方式相当于用免费代码吸引开发者来代替传统软件行业的营销投入,并且然后出售付费的其他功能。  最后一种是云服务的Hosting模式——开源厂商将他们的服务托管在公有云平台上,开发者向IaaS厂商付费,IaaS厂商再将部分分发给原来的开源厂商。  这种模式的问题在于,其实作为渠道的IaaS厂商一开始太强大了。比如AWS改了源码,说是“新产品”,自己收钱。但在原厂商的强烈抵制后,云托管逐渐标准化,成为行业惯例。  数据公司Databricks、开源软件服务公司Acquia都是这种模式。  开源项目得到中国资本市场认可的另一个原因是,国内主要的IaaS公司也愿意收购开源项目。  例如,早在2017年,阿里巴巴就投资了欧洲开源数据库MariaDB。有分析称,这是阿里巴巴“在海外领域最引人瞩目的云交易”。  当地利好因素之一是中美贸易摩擦下的国产替代。  中国市场每年进口超过3000亿美元的基础技术。自主可控和进口替代为基础技术投资带来机会。  比如数据库领域的国产替代如火如荼,甲骨文数据库霸主地位正在被蚕食。  在数据库技术社区摩天论的国产数据库排行榜中,PingCAP开发的TiDB、阿里体系下的OceanBase、PolarDB等国产数据库开始占据重要份额。  莫天伦国内数据库排行除了关系型数据库,在新型图数据库、向量搜索引擎、深度学习框架等领域也涌现出一批中国基础软件团队。  AmongthemisZilliz,adataprocessingcompanywhosefounderhasjustbeenelectedasthenewchairmanoftheboardofdirectorsoftheLinuxAIFoundation.他们目前的主要产品是向量搜索引擎Milvus;开源深度学习框架OneFlow的一流技术即将发布;Kyligence,一家由ApacheKylin项目核心团队创建的AI增强型数据仓库公司;淘思数据,今年三个月内完成两轮数千万美元融资的物联网数据服务商;新一代云数仓连技术;  处理和存储知识图谱的图数据库Neo4j;容器PaaS服务商DaoCloud、灵雀云、飞之云、食宿云;专注于IaaS层的私有云服务商EasyStack和ZStack。…  另一个是“新基建”的政策红利。  “新基建”概念于2018年底首次提出,2020年4月20日明确范围。信息基础设施包括:以5G为代表的通信基础设施、以云计算和人工智能为代表的新技术基础设施,以及以IDC为代表的算力基础设施。  各路互联网巨头摩拳擦掌。阿里云今年4月20日刚刚宣布,未来3年将投入2000亿元,用于云操作系统、服务器、网络、芯片、数据中心建设等核心技术的研发。  一个月后,腾讯云也在5月26日宣布,将在5年内投资5000亿元,瞄准新基建。  在昨天(5月28日)公布的最新腾讯AI新基建架构中,包含全局安全和加速网络的“云化支撑”层,以及包含核心算法框架的“云化支撑”层和深度学习工具组件。“算法平台”层对应数字基础设施建设。  腾讯云公布了AI新基础设施的总体布局,即“一云三平台”架构,一云即腾讯云,三平台包括算法平台、服务平台和开放平台。  5G也是中国市场的一个变量——5G可能带来无人驾驶、VR/AR、远程医疗、工业物联网等新应用,以及数据感知、传输、贮藏、加工。改变。  大数据时代开源在美国市场繁荣,AI、5G、IoT等浪潮对中国来说是一个机会。  3.昨天的算法,今天的基础软件  基础设施公司创业浪潮,也展现了近两年AI风投的趋势:从应用层向基础层迁移。CSDN论坛,alice_tl:《AI 的架构与核心》  在2016年开始的AI创业浪潮中,中国市场最初最受以算法为核心的公司追捧。  大多是从通用算法起家的,比如商汤科技、旷视科技是从人脸识别起家的,云知声、Smart是从语音技术起家的。  但是,从商业的角度来看,在走向市场的过程中,算法本身也面临着很大的挑战。  这首先是因为目前的深度学习还是弱人工智能,其性能对数据环境的依赖性很强,AI训练测试数据与实际场景中的数据差距很大,导致事实上,预训练算法确实在实现特定场景时,并不能“开箱即用”,需要根据不同场景的数据特性调整参数。  所以做通用算法的公司很难开拓新的市场,除了一些个别场景——比如安防领域的大规模人脸识别——等等。  而当AI企业迫于生存和市场压力,从通用算法转向深度场景,扎实发展行业产品和服务后,面临难以复制和规模化的瓶颈。  因为除了核心算法能力,AI公司还要处理场景中的混沌数据,开始“定框架、喂数据训练、调整参数、喂训练数据、再调整”的循环parameters”,派遣工程师到Field,支持大量实施、部署、服务部门。  这直接影响到AI公司的毛利率。  硅谷顶级风投机构AndreessenHorowitz(A16z)发现,低毛利率几乎是全球AI公司的一个共同特征——AI公司的毛利率通常在50-60%,远低于SaaS公司60-80%的毛利率。  另一方面,算法能力不再稀缺。  各大科技巨头和学术会议每年都会产生大量的开源通用算法——在自然语言处理(NLP)领域,谷歌2018年发布的BERT预训练模型取得了优异的成绩在许多任务中;”科创板第一股AI股的计算机视觉算法提供商虹软科技在2018年推出虹软视觉开放平台时也宣布永久免费。  可以说是算法的起步up公司确实偏离了资本最初对平台化、通用化发展机会的预期。这中间,是投资人上当了,还是从业者自己看雾里看花?  相比之下,数据理解、数据处理等更基础的环节,理论上可以催生跨行业的通用机会。这也是大家开始“跟风”看这个领域的原因之一。  然而,处于发展初期的中国基础软件市场也面临诸多不确定因素。  不确定性首先在于中国的toD市场还很不成熟。  ToD其实可以看成是toB的一个子类,虽然用户是开发者,但是支付方还是开发者的机构。  中国市场上支付能力最强的机构是政府和大企业,包括很多国有企业。他们更喜欢私有云或者行业云,对公有云上开源系统的安全性有顾虑。  另一方面,基础软件创业也受到我国信息化水平低的限制。  从比例上来说,与美国相比,中国开发者的数量还是很低的。据波士顿咨询集团发布的一份报告显示,美国每万人人工智能人才的集中度约为中国的72倍。  我们在与阿里云业务负责人交流时提到,除了互联网和金融,国内其他行业的信息化水平与国外“完全不同”。  比如国内Top3的大型钢铁企业,能做IT开发的人很少,这在国外大型制造企业是不可想象的。  因此,虽然“基础软件+开源”在国外有先例,但能否在国内复制,还是值得商榷的。  其次,基础软件创业公司的成长周期长,是对公司持续融资能力的考验。  因此,活跃在该领域的投资机构大多是长期美元基金。  总的来说,这条过去很少有人走过的路,正吸引着跃跃欲试的人才和资本,有很大的想象空间。