2022StanfordAIIndex发布:AI期刊发表量和引用量居中国第一,TF开源库最受欢迎一个旨在全面研究AI行业现状的非营利项目,旨在促进广泛交流以及关于基于数据的人工智能的有效对话。刚刚,AIIndex正式发布了2022年年度报告。报告下载地址:https://aiindex.stanford.edu/report/2022年发布的报告要点可归纳为以下八点:1.AI领域民间投资猛增投资集中度加大。2021年AI私人投资总额约为935亿美元,是2020年私人投资总额的两倍多,但新投资的AI公司数量持续下降,从2019年的1,051家减少到2020年的762家,减少到2021年的746家。有2020年有4轮5亿美元以上的资金,2021年有15轮。2.美国和中国主导AI跨国合作。尽管地缘政治紧张局势加剧,但从2010年到2021年,美国和中国在AI出版物上的跨境合作数量最多,自2010年以来增长了五倍。美国和中国之间的合作产生的出版物数量是英国和中国之间合作的2.7倍中国(次高)。3.语言模型比以往任何时候都更有能力,但也更偏向。大型语言模型在技术基准上创下了新记录,但新数据表明,大型模型也更容易从训练数据中发现偏差。与2018年被视为SOTA的1.17亿参数模型相比,2021年开发的2800亿参数模型产生的“毒性”增加了29%。随着时间的推移,这些系统的能力在性能提升和暴露潜在恶化方面都有显着提高偏见。4.人工智能伦理的兴起无处不在。自2014年以来,关于AI公平性和透明度的研究呈爆炸式增长,伦理相关会议上的出版物增加了五倍。算法的公平性和偏见已经从主要的学术追求转变为具有广泛影响的主流研究课题。近年来,具有行业联系的研究人员在以伦理为重点的会议上发表的论文同比增长了71%。5.人工智能变得更实惠、更高效。自2018年以来,训练图像分类系统的成本下降了63.6%,而训练时间增加了94.4%。在其他MLPerf任务类别(例如推荐、对象检测和语言处理)中出现了降低培训成本但加快培训时间的趋势,有利于更广泛地商业采用AI技术。6.数据,数据,数据。跨技术基准测试的最佳结果越来越依赖于使用额外的训练数据来获得新的SOTA结果。截至2021年,本报告中的10个基准测试中有9个都对SOTAAI系统进行了额外数据训练。这种趋势隐含地有利于私人机构参与者访问海量数据集。7.关于人工智能的全球立法比以往任何时候都多。AIIndex对25个国家AI立法记录的分析显示,已通过成为法律的包含AI的法案数量从2016年的1项增长到2021年的18项。西班牙、英国和美国将通过最多的AI相关法案2021年,平均通过三项法案。8.机械臂越来越便宜AIIndex调查显示,在过去六年中,机械臂的中位价格下降了4倍,从2016年的每只手臂50,000美元下降到2021年的12,845美元。机器人研究变得更容易获得并且负担得起。从结构上看,2022AIIndex报告共分为五章,具体如下:第1章:研究与发展第2章:技术性能第3章:技术AI伦理Ethics第4章:经济与教育第5章:AI政策与治理(AIPolicyandGovernance)附录以下是对报告前两章的简要解读。研发研发是推动人工智能快速发展不可或缺的力量。每年,广泛的学术、行业、政府和民间社会专家和组织都会通过大量论文、期刊文章和其他人工智能相关出版物、人工智能会议或关于图像识别等特定子主题的会议为人工智能研发做出贡献。本报告第一章使用多个数据集分析了2021年人工智能研发领域的主要趋势。本章首先查看了AI出版物,包括会议论文、期刊文章、专利和知识库。然后,报告分析了人工智能会议的出席情况。最后,该报告检查了研发过程中使用的AI开源软件库。AI出版物总体概览图1.1.1显示了全球AI出版物的数量。从2010年到2021年,AI出版物总数翻了一番,从2010年的162,444篇增加到2021年的334,497篇。按专业分:模式识别和机器学习方面的出版物自2015年以来翻了一番以上。其他受深度学习影响更大的领域,例如计算机视觉、数据挖掘和自然语言处理的增长幅度较小。跨境合作:从2010年到2021年,美国和中国在AI出版物上的跨境合作数量最多,自2010年以来增长了五倍。两国之间的合作产生的出版物数量是英中合作的2.7倍(排名第二)。在2010年至2015年仅略有增长之后,AI期刊出版物的数量自2015年以来增长了近2.5倍(图1.1.7)。图1.1.10细分了过去12年人工智能期刊出版物中排名前三的人工智能巨头的份额。中国在2021年仍以31.0%领先,其次是欧盟和英国,为19.1%,美国为13.7%。引用次数:中国对人工智能期刊论文的引用份额逐渐增加,而欧盟、英国和美国的份额有所下降。这三个地理区域合计占全球引用量的66%以上。人工智能会议出版物人工智能会议出版物的数量在2019年达到顶峰,较2021年的峰值下降了约19.4%(图1.1.12)。然而,尽管总量有所下降,但AI会议出版物占全球会议出版物总数的份额自2010年以来增加了5个百分点以上(图1.1.13)。按地域划分:中国将在2021年占全球AI会议出版物的最大份额,达到27.6%,比2020年的领先幅度更大,其次是欧盟和英国,占19.0%,美国占19.0%,排名第三,占16.9%(图1.1.15)。引用:虽然中国在2021年拥有最多的AI会议出版物,但图1.1.16显示美国在2021年的AI会议引用中以29.5%领先于其他主要国家,其次是欧盟+英国(23.3%)和中国(15.3%)).AI专利图1.1.22为2010-2021年AI专利申请数量,2021年AI专利申请数量是2015年的30多倍,年复合增长率达76.9%。按地域划分:中国现在申请了全球一半以上的人工智能专利,并获得了约6%的授权,与欧盟和英国大致相当。美国申请了北美几乎所有的专利。图1.1.24c显示,与AI专利申请量和授权量的增长相比,中国专利申请量(2021年87343件)远高于授权量(2021年1407件)。AI开源软件仓库图1.3.1和1.3.2反映了2015年至2021年GitHub开源AI软件仓库的用户数量。TensorFlow仍然是2021年迄今为止最受欢迎的,累计GitHubstar约161,000,略有增加从2020年开始。到2021年,TensorFlow的受欢迎程度大约是OpenCV的三倍,OpenCV是排名第二的GitHub开源AI软件库,紧随其后的是Keras、PyTorch和Scikit-learn。图1.3.2显示了GitHubstar少于40,000的库的受欢迎程度——FaceSwap位居榜首,其次是100-Days-Of-ML-Code、AiLearning和BVLC/caffe。技术性能今年,技术性能章节比以往任何时候都更多地分析了人工智能各个子领域的技术进步,包括计算机视觉、语言、语音、推荐、强化学习、硬件和机器人技术的趋势。计算机视觉:到2021年底,顶级图像分类系统的图像Top-1准确度平均每10个分类有1个错误,而到2012年底,每10个分类有4个错误。图2.1.5记录了生成模型在STL-10数据集上实现的性能。首尔国立大学等机构的研究人员开发的最先进的STL-10模型获得了7.7的FID分数,明显优于2020年的SOTA结果。人脸检测:FRVT人脸面具测试出现了三个重要趋势:(1)人脸识别系统在面具上仍然表现相对较好;(2)masked比non-masked表现差;(3)自2019年以来差距有所缩小。虽然人脸识别技术已经存在了几十年,但近年来的技术进步令人瞩目。当今一些性能最好的面部识别算法在具有挑战性的数据集上的成功率接近100%。ComputerVision:VideoMTV,谷歌研究院、密歇根州立大学和布朗大学合作,于2022年1月发布,在600系列上达到89.6%的Top-1准确率,在400系列上达到89.1%准确率为82.20%在700系列上(图2.2.2)。对2022AIIndex的更多细节感兴趣的读者,请阅读报告原文。
