当前位置: 首页 > 科技观察

从系统看中国人工智能发展现状

时间:2023-03-12 20:51:37 科技观察

第四次工业革命正在迅速兴起。人工智能是这次工业革命的核心内容之一。构成工业革命的创新都是革命性的创新。这种创新具有特别高的不确定性。人工智能前沿工作的发展,包括基础研究、应用研究和初创企业,都属于这种性质。这类创新的未来在于大量的研究和初创企业。最后,通过市场优胜劣汰的过程,产生技术和市场最好的结果。在此之前,即使是相关领域成功的专家和企业家也难以预测未来的结果。所以,要了解未来,最重要的是了解学术界在研究什么,初创企业在做什么,有多少。为了解中国人工智能现状,展望未来,我们构建的人工智能指数主要从三个方面对中国与国际前沿国家进行对比。这三个方面分别是人工智能初创企业、学术成果和开源软件的应用。从初创企业的维度,我们可以勾勒出人工智能作为一个产业的现状和近期的未来。通过对初创企业不同发展阶段的国际比较,我们可以看到中美人工智能企业的差异。以融资机制为例。融资机制本身就是初创企业的发展机制。融资机制实际上是优胜劣汰机制的核心。中国曾经是计划经济国家,现在还保留着相当一部分计划经济体制。因此,中美的制度差异在于,中国有两种不同类型的机制,一种是优胜劣汰的市场机制,另一种是命令机制,即自上而下的命令或计划。因为我们的主要目的是站在工业革命的角度看人工智能,所以在学术领域,我们关心的是行业未来的长远发展。今天的学术工作就是明天的人工智能产业。在这个维度上,我们观察学术论文的定量和定性指标。第三个维度是开源软件的开发和应用,这是学术界和工业界高度关联的部分。从应用研究的角度来看,这是一个非常重要的指标。人工智能和机构人工智能领域的绝大多数开创性研究都是从学术上开始的。学术研究和应用研究是产生革命性创新的必要条件,没有它们就没有后来的东西。因此,学术研究的成果是最重要的。但仅靠学术研究的成果还是不够的。比如专利。一个看似优秀的项目能否在商业化过程中取得成功?在商业实现之前,没有人可以回答这个问题。所有学术和专利优秀的内容在商业实现之前仍然面临着巨大的挑战和非常高的不确定性。因此,人工智能产业能否成功,整个产业能否在一个国家或地区取得成功,不仅取决于当地的学术和应用研究成果,还取决于当地的制度。与创新技术发展相关的最重要的具体制度是所谓的硬预算约束制度。面对高度的不确定性,在无人知晓某个项目能否成功的情况下,必然有大量的创新想法能够在最早阶段获得投资。需要强调的是,能不能拿到投资和能不能拿到大规模的投资是两个不同的东西。这是第一点,就是有没有很多新点子可以拿到投资。第二点,这些已经获得投资的项目,在发现没有前途的时候,能不能及时打断。硬预算约束是指是否可以及时中断。因为硬预算约束决定了不会把资源浪费在失败的项目上,更多的创新项目才有机会尝试。在中国,尤其重要的是要认识到与计划经济相关的软预算约束无法阻止不成功的项目。因此,在软预算约束下,我们不得不依赖没有投资的预审项目,并用这种方法来减少创新项目的投资。这是计划经济的一个重要特征。但是,一旦提前减少了投资项目,最终成功的几率就降低了。就融资体系而言,风险投资是一项有效且非常重要的基础制度,其核心是周期性的硬预算约束。阶段性投资最重要的是可以及时打断这些不成功的项目;或者换句话说,它是硬预算约束,用于降低失败的风险。风险投资系统高度依赖于股票市场和独立的司法系统。中国人工智能初创企业规模及国际比较2021年5月21日,2021RoboCup机器人世界杯中国赛暨亚太机器人世界杯天津国际邀请赛在天津空港体育中心举行。在人工智能初创企业方面,中国的投资不仅巨大,而且在增速方面,过去几年,初创企业的增速一直是全球最快的。特别是2014年以来,投资大幅加速。从总投资来看,美国位居世界首位,其次是中国。创新具有高度不确定性,其中最重要的机制之一就是投资量要大。这个数额既指投资总额,也指项目总量。第一个特征,从项目来看,无论是创业总数还是交易总数(所谓交易总数是指有些公司可能有多个项目,处于不同的阶段,所以交易总数和公司总数不是一回事,交易数会更大)。从这两个方面来看,中国的投资总额位居世界第二,但企业或交易的总数,中国不是世界第二,而是世界第三,而英国与世界第二的差距很大。世界不是很大。我们稍后会介绍更详细的信息。第二个特点是中国人工智能初创企业的融资高度依赖对外开放。我们发现中国的总投资是世界第二,那么这些投资从哪里来呢?据统计,近40%的交易来自国内,另外46%以上完全来自国外。国内外合计超过14%。从这组数据可以明显看出,人工智能初创企业一半以上的融资来自国外,这是一个非常重要的特征。中国的研究不仅与改革开放高度相关,而且与融入国际也高度相关。甚至在融资方面,也与国际一体化和对外开放高度相关。中国人工智能初创企业的投资主体是风险投资,而不是传统的中国金融机构。前面我们谈到了硬预算约束,它主要来自风险投资。在中国,74%的交易来自风险投资,近16%的交易来自私募股权。私募股权的性质与风险投资高度相似,所以我们将两者合并在一起。也就是说,人工智能初创企业近90%的投资都来自风投。这是一条极其重要的信息。前文提到,2014年之后,中国对人工智能初创企业的投资加速,早期项目投入的资金总量非常庞大,但有一个重要特点值得关注。虽然投入的资金量非常大,但投资的创业公司总数和交易总数都没有相应的多,导致创业初期的平均投资额非常高.不同的人对此可以有不同的解释,我们的解释留给最后的分析。创业融资数据来自两个数据库,VCExperts和Crunchbase。这两个是世界上最大的风险投资融资数据库。两者结合,基本上概括了世界上所有风险投资的融资方式。中国与世界的对比数据,都是从这里获取的。我们先关注IT相关领域,然后在数据库中搜索公司简介,使用了近20个涉及人工智能各个方面的关键词。如果这个企业涉及到这些方面,我们就定义为人工智能初创企业。通过这种方式,我们找到了世界上所有创业公司的状态。美国有4600多个,占全球的45%以上;英国有846个,占全球的8.2%,中国有730个,排名第三,占全球的7.11%。从初创企业总数来看,中国在全球相当领先,但与美国、英国相比,仍有明显差距。在融资方面,美国的融资额为1273亿美元,占全球的59%。中国为487亿美元,占全球近23%。就企业总数而言,中国所占比例远没有那么大,但就投资总额而言,中国的投资总额几乎是美国的一半,位居世界第二。排名世界第三的是英国,远远落后于中国。每个初创企业平均获得多少投资?与世界其他发达国家相比,美国并没有明显高,只是略高。但中国从2013年开始起步,2014年拉大了差距,人均创投数远高于世界其他国家。有两种可能,一种可能就是我们前面提到的软预算约束机制。在面对高风险、高不确定性的项目时,尤其是在前期,投资的数量一定要非常少,因为越小越便宜。等到你相当确定的时候,再扩大你的投资,这样才能确保你以最少的成本获得更大的成果。如果前期投入大量资金,可能会浪费掉相当一部分资金。这是从机制上的解释。高的。我们的数据无法告诉我们这一点,业内同行可能比我们更清楚。面对高度的不确定性,关键问题是早期的探索项目是否足够。就探索性项目数量(种子期交易量)而言,美国远高于世界上所有其他国家。排在第二位的是英国,排在第三位的是中国和加拿大。在这方面,中国只有英国的一半多一点,美国的七分之一左右。由于勘探面临着很高的失败风险,有效分配资源的方法是在勘探开始阶段对每个项目投入尽可能少的资金。但在这方面,中国的情况与发达国家有很大不同。与发达国家相比,中国初创企业在种子期对每个项目的投入都很大。到了创业后期,从风险投资的角度,人们对项目的成功已经有了相当的把握。根据我们的数据,后期的投资交易总额,也就是有多少项目获得融资,在美国排名第一,在中国排名第二,在英国排名第三。从趋势上可以看出,2016年以来,中国与其他国家的差距已经很大。也就是说,2016年以来,后期的投资额明显多于其他发达国家,但与美国相比仍有明显差距。这个差距似乎在一点点缩小,但也不是很确定。但与其他发达国家相比,中国明显领先。排在第三位的是英国。英国与其他发达国家的距离并不大,但中国与除美国以外的所有发达国家的距离非常大。从前期的平均投资金额、每个项目的平均投资来看,中国远高于世界其他国家,美国位居第二,英国位居第三。中国远高于排名第二的美国,美国与其他发达国家没有明显差距,发达国家平均水平基本持平。这是一个非常重要的信息,说明发达国家有一些规律性。这些规律决定了他们认为什么时候是划算的。基本上,每个人的做法都差不多。但是当中国讨论平均数时,显然是非常高的。如何解释这种现象?有两种可能的解释。一种可能的解释是上面提到的软预算约束和硬预算约束。中国可能仍会受到一定程度的软预算约束,从而导致更高的平均投资。另一种解释是,中国的市场可能非常大,包括与人工智能相关的应用领域。所以,即使每个项目投入很多,成本很高,整体还是可以盈利的。这两种解释可能同时成立,并且是原因的一部分。学术与开源软件的国际比较从学术论文发表量和论文被引用指数来看,近年来我国整体位居世界第二。总的来说,与美国的差距正在缩小,但在一些重要领域,差距还是比较明显的。首先看期刊和会议论文的发表情况。中国在期刊和会议上发表的论文总数,包括过去20年的累计总数和近年的年度发表数量,均居世界第二位。很重要的一点是,自2017年以来,中美年度论文发表总量的差距逐年缩小。如果把期刊和会议分开来看,单独看期刊,中国期刊发表论文总数位居世界第一。期刊总被引次数也是世界第一。因此,如果单纯看期刊,中国现在已经超过美国,位居世界第一。这也是为什么不少报道认为中国在人工智能方面已经超越美国成为世界第一,其实指的是在期刊上发表的论文。但是,如果我们把这个引用分门别类,分为高被引论文、普通被引论文和低被引论文,我们会发现,如果我们看被引次数超过1000次,那么中国仍然是排名第一的期刊非常高.在会议论文方面,中国的排名也不尽相同。如果从总数上看,国内会议发表论文总数普遍居世界第二,总被引次数也普遍居世界第二。如果从会议论文的引用次数来看,那些被引用超过一千次甚至一百多次的,中国在世界上排名第二,但是与世界第一的美国的差距已经很大了。没有明显缩小。在开源软件的开发和使用方面,中美差距明显。值得注意的是,与期刊和学术论文截然不同的是,中美在开源软件方面的差距正在扩大,而不是缩小。这背后究竟是什么问题,需要深入探讨。我们的数据源是Scope数据库,包括学术论文、期刊和会议,都来自这个数据库。搜索方式和斯坦福大学出品的人工智能索引的搜索方式基本相似,这让我们跟他们有很强的可比性。具体来说,就累计学术论文总数而言,美国排名第一,中国排名第二,英国排名第三。从累计总量来看,中美差距还是比较大的。从时间趋势来看,虽然中国仍位居第二,但与美国的差距在逐年缩小,尤其是在2016年和2017年之后。第三位是英国,实际上可能是印度。英国和印度这两个国家的状态差不多,与排名第二的中国的差距很明显,就是期刊和会议论文的总量。如果只看期刊,中国自2012年以来已经超过美国,成为全球期刊发表人工智能论文最多的国家。从2012年开始,美国长期位居第二,如今也被印度超越。所以现在印度排第二,美国排第三。这背后有一个重要的内容,就是由于人工智能领域本身的加速发展,很多研究者为了加快速度,在会议而不是期刊上发表更多的论文。这是我们在期刊中看到这种行为的部分解释。一方面,中国的论文增长速度非常快。另一方面,作为人工智能最发达的国家,美国在期刊上发表的论文数量并没有增加,原因是大量论文被转移到会议上。从会议论文总数来看,美国排名第一,中国排名第二,英国排名第三。中美之间的差距似乎在缩小,但不是很明显。但中国与其他发达国家的差距正在扩大。中国超越了其他发达国家,而且超越的越来越多。单看论文的数量,未必能说明论文的好坏。质量更多地体现在引用次数上。可以看到,自2014年以来,在被引频次方面,中国已经超越美国,成为全球期刊论文被引用总量第一的国家,而美国仅次于中国,和其他几个发达国家并列第三。与其他国家相比,中美在后者方面存在明显差距。从每年大型人工智能学术会议论文被引用次数来看,美国位列第一,远超其他国家,中国位列第二。中美之间的差距是否正在缩小,目前还不清楚。其他发达国家与中国的差距似乎正在扩大。对小型、更专业的人工智能学术会议发表论文的年度引用情况进行总结,可以看出中国与发达国家之间并没有明显的优势。美国世界第一,英国世界第二,德国以前世界第一,现在连第三都排不上,现在法国排第三。为什么会这样?这背后的原因是什么?这需要专家来解释。让我们看看被引用最高的论文是如何分布的。首先我们来看期刊中被引用次数最多的论文,也就是人工智能领域影响最大的论文。美国曾经非常发达。近年来,中国、美国和以色列似乎处于同一水平线上。从会议论文总和来看,美国在最具影响力的论文数量上遥遥领先,其他几个国家,中国、英国、德国,近年不相上下,可以考虑并列第二。对于低影响力的论文,我们将其分为几个等级:被引用1000次及以上、数百到几十次、几十到十次、个位数、零引用。限于篇幅,我将重点介绍论文被引用率较低的情况。在期刊论文、被引率低的论文中,中国一直是世界第一,美国是世界第二。但是如果我们看低引用率的会议论文,类似高引用率论文的情况,美国遥遥领先。中国与英国并列第二,但远远落后于美国,与其他发达国家相差无几。最后,我们来看看中美两国研究人员对人工智能开源软件平台的使用情况。从汇总的数据来看,从2015年至今,我们可以看到,中美两国在人工智能开源软件的使用和开发上都有所增长,但美国增长更快。2019年,美国使用的开源软件平台总数已超过10万个,中国约为3万个。为什么是这样?留给专家们讨论分析。总结本报??告的核心发现。首先我们看到,在人工智能初创企业方面,中国的投资总额仅次于美国,大致相当于美国的五分之二规模。从趋势看,中国投资总额与美国的差距正在缩小。如果着眼于项目后期的投资情况,中美差距会更快缩小。这是第一个总结。第二个总结,人工智能作为一个全新的行业,目前还处于新兴阶段,还没有真正落地,不确定性非常高。面对如此高的不确定性,它的种子期和早期数量,包括项目和企业的数量,是优胜劣汰最终结果的关键。如果着眼于种子期和早期,无论是企业总数还是交易总数,中国都落后于英国和美国,与英国和美国的差距是不是缩小,而是增加。这是一个非常值得关注的问题。在学术方面,中国发表的论文总量仅次于美国。其中,期刊发表总量和被引频次均居世界首位,超过美国,而且很早就超过了美国。会议论文总数排名第二,与美国的差距还是很大的,与英国、德国等差距不大。会议论文中,高被引论文,尤其是被引频次最高的论文,中美差距明显,而且这种差距没有明显缩小的趋势。在人工智能开源软件方面,与美国研究人员相比,中国人工智能研究人员开发和使用的要少得多。从趋势上看,这个差距是在扩大,而不是在缩小。