人工智能落地的最大驱动因素是基础设施的升级。近年来,大数据分析、人工智能等领域备受瞩目,时常出现引人瞩目的融资事件。美国数据科学公司Databricks在今年8月底刚刚完成16亿美元的H轮融资。其最新估值高达380亿美元。一亿美元。Databricks是“红”,随之而来的是“深巷中的酒”——数据科学越来越受到关注。数据科学虽然是一门复杂的学科,但现在已经进入了金融、工业乃至上千个行业。这个过程其实就是AI从“好用”到“好用”的一个缩影。“人工智能落地的关键是要展示其价值,找到合适的商业化实施路径。”九丈云集DataCanvas董事长方雷指出,“过去,人们认为算法可能是一道坎。但随着技术的快速迭代,开源开放,事实证明算法并非高不可攀,而且人工智能落地的最大驱动因素是基础设施的升级。”AI基础设施升级刻不容缓。当前,我国正处于企业数字化转型时代的转折点。回顾信息化发展史可以发现,从1980年到2000年,这是基础信息化时代,服务器、存储、操作系统、数据库等基础设施软硬件发展迅速;2000-2020年,进入数字化进程时代,云计算普及,云成为基础设施,各种SaaS应用百花齐放;2020年之后,市场将进入一个以“智能决策”为标志的新阶段,相关领域包括数据科学平台、云原生数据仓库、开源技术等机会智能决策的实现需要一个“智能基地”,也就是常说的AI基础设施,通过AI的不断完善和升级,基础设施,AI应用落地的效率会更高也更容易。“AI基础设施的价值在于让企业可以在上面自主开发AI应用,”方磊总结道。AI落地的探索源于算法的创新,而后涌现出一批AI公司,致力于为客户提供定制化的端到端AI应用开发。这无形中为AI落地创造了高门槛。随着各行各业对智能化的需求越来越迫切,AI已经成为众多行业众多顶级客户的刚需。但是,这些顶级客户不仅规模大,而且非常复杂,需求也各不相同。如果仍然沿用过去“千人千面”的定制化端到端应用开发模式,将难以快速满足这些头部客户的业务需求,AI应用的门槛是仍然居高不下,客户永远无法掌握主动权。“从各行业顶级客户的需求来看,他们更愿意围绕自己的业务开发自己的AI应用,这需要独立可控的基础设施。”方磊表示,“依托AI基础设施,企业自主研发AI应用,锻炼形成自主AI能力,是市场主流,也是AI应用落地的内在动力。”Databricks之所以受到市场的追捧,正是因为它从最好的流数据处理出发,向上奋进。发展机器学习和建模,向下构建数据湖和数据仓库的融合,不断扩展和完善AI基础设施,为顶层AI应用提供优化承载平台,即AIFoundation。来源:Databricks事实上,目前业界对AI基础设施并没有统一明确的定义。但从应用实践和Databricks等标杆公司的实践来看,AI基础设施至少包括两个基石,即“数据”和“算法”。以前,大多数应用程序都是离线的,例如获取营销列表。但是现在,客户对在线应用的需求越来越迫切。很多时候模型建好了,却发现数据“供大于求”。可见,AI应用离不开一个实时数据库,此时AI基础设施的重要性就凸显出来。四年前,九丈云集DataCanvas开始构建支持高并发的实时数仓。现在,经过品牌升级,推出功能和性能更加完善的HSAP(HybridServing/AnalyticalProcessing)实时数仓产品DingoDB。这是九丈云集DataCanvas眼中AI应用不可或缺的数据库。谈及AI基础设施的门槛,方磊表示:“算法是技术门槛,但我们已经实现了突破。我们的自动机器学习产品在性能等指标上不亚于国外同类产品,甚至更强。”其实更高的门槛还是在客户或者应用层面,目前自建AI基础设施的需求主要集中在各个行业的顶级客户,作为AI厂商,要有服务的意愿和能力这些顶级客户很好。我公司自2014年以来一直专注并深耕这一领域。》像九丈云集DataCanvas和Databricks?不像?从市场大趋势来看,正是智能决策时代的到来,让Snowflake和Databricks如Snowflake和Databricks以数据为驱动,创新AI为支撑基础设施,有数据应用的企业成为资本市场的宠儿,就在2013年Databricks成立的时候,同样崇尚数据科学的九丈云集DataCanvas也在国内顺势而为,虽然地点不同,但是两者有很多相似之处尤其是在能力建设和商业模式愿景方面,九丈云集DataCanvas和Databricks有着默契,这是巧合吗?还是他们有着相同的目标?首先,两家公司的定位是相似的,同为数据科学的开发者、应用者和推广者,都在关注AI基础设施的升级。但是,由于差异出发点不同,细分技术领域不同,Databricks最早以流式数据处理着称,而九丈云集DataCanvas开源,擅长自动机器学习,所以在构建AI基础架构时,两者选择的路径不同.其次,从产品线来看,虽然在细节上略有差异,但从整体能力建设来看,两家公司不同的产品可以说是如出一辙,既涵盖了分析,也涵盖了数据。分析部分,九丈云集DataCanvas享受到DataCanvasAPS这个在业界广受好评的开源机器学习平台。平台包括算子仓、模型训练、数据处理、自动机器学习等,在数据层面结合DingoDB实时数仓,构建数据实时计算分析闭环。除了大家熟知的Spark,Databricks还有同样知名的数据湖仓库集成DeltaLake,以及机器学习、数据测试与管理、数据解释与建模等产品。两家公司通过不断创新,都致力于让AI基础设施更加“厚实”,可谓是志同道合。来源:九丈云集DataCanvas》在数据科学领域,我们与Databricks有着相似的愿景、目标和战略,我们也想做同样的事情,那就是构建AI基础设施,充分利用计算电源和网络。”方磊说,“我们很荣幸被称为‘中国的数据砖’,这是对我们的一种认可。但我们也清醒地意识到,人工智能基础设施市场空间巨大,并且有还有很多“细活”要做,这也是我们继续快速前进的动力。《将AI??嵌入云端,任何一家想要有所作为的企业,都绝对不会满足于“做别人”。九丈云集DataCanvas同样如此,成为“中国的Databricks”并不是终点,“做你自己”成为独一无二的存在才是最终目标。事实上,由于中美两国在市场和竞争环境上存在差异,小到企业的AI应用需求。两块不同土地上长出的幼苗可能属于同一种类型,但个体会有明显差异,比如在美国市场,AWS、Azure、GoogleCloud一直以“三朵云”为主,无论是Snowflake还是Databricks,都在增长关于这“三朵云”然而,在中国,云计算市场差异很大,云的碎片化现象很明显,不同的地区、不同的行业可能造就了千千万万的云。虽然从角度来看在AI应用落地方面,中美客户的需求不同。有差异,但在具体的路径选择和实施方式上还是有自己的倾向和习惯的。方磊坦言,现阶段九丈云集DataCanvas将主要聚焦于各行业领先的客户群体,为他们打造AI基础设施。因为这些客户的需求是最迫切的,他们有资金和技术能力实现AI的自主研发。基于对中国未来人工智能产业生态发展的预测,九丈云集DataCanvas建设性地提出了“云中云”战略(AnAICloudintheClouds),即将AI基础设施和相关AI能力嵌入到各个产业链中。云、区域云、企业云、联盟云等千种云。为了满足不同云生态的需求,九丈云集DataCanvas必须让自己的解决方案更加灵活高效的交付。“云中云”显然是事半功倍的方法,可以很好的借力将九丈云集DataCanvas的AI能力用云端输出。来源:九丈云集DataCanvas对于AI基础架构,很多行业用户一开始的认识比较模糊,还需要继续教育。不过,一些行业龙头企业已经从AI基础设施的升级上进行了尝试。甜头来了。例如,在银行业,过去需要几天才能完成审批的贷款,现在可以实时审批;在制造业,工业质检能力的提升,设备预测性维护的实现,都得益于AI的应用……这样的案例应用比比皆是。“在构建AI基础设施的基础上,用户可以有数据、有场景、有预算、有团队,开发自己的AI应用。”方磊表示,“原来用户习惯于‘伸手’向厂商寻求‘交钥匙’的AI解决方案。但这种单独定制的解决方案并不是长久之计。”例如,某大型钢铁企业在全球拥有300多条生产线,每条生产线所使用的设备和供应商都不尽相同。.如果没有一个统一的平台来支持其建模、分析、应用开发和管理,系统将不堪重负。归根结底,用户还是要依靠自身AI能力的提升,使用通用技术,自主掌握AI应用开发。在这种情况下,人工智能基础设施是必须的。这也是九丈云集DataCanvas的一个商机。竹鱼在千朵云生态的AI基础设施建设上事半功倍,这是DataCanvas的商业定位;而打造国内首个开源数据科学平台是DataCanvas的初衷。两者并不矛盾。相反,数据科学和AI基础设施在九丈云集DataCanvas上从学科和业务应用两个不同的维度实现了平衡和统一。很长一段时间,数据科学都是平庸的。在国内,像九丈云机DataCanvas这样长期致力于数据科学领域的厂商屈指可数。Databricks可以说是世界上第一家跑出数据科学的公司。它的高人气至少证明了数据科学市场是大有可为的。新基建、云原生、数智升级、开源,在这些有利因素下,再加上Databricks这样的瑰宝,以及九丈云集DataCanvas等公司多年来的深耕,数据科学的未来值得期待.
