2021年斯坦福AI指数报告正式发布,从七大版块出发,探讨AI在过去一年的整体发展。人工智能指数(AIIndex)由斯坦福大学发起,是一个追踪人工智能动态和进展的非营利性项目,旨在全面研究人工智能行业的现状,旨在促进人工智能领域的广泛交流和有效对话。基于数据的人工智能。刚刚,AIIndex正式发布了2021年年度报告。报告下载地址:https://aiindex.stanford.edu/report/2021AIIndex报告极大扩展了可用数据量,并与大量外部机构合作对数据进行校准,加深了报告与StanfordHAI的联系。该报告还从多个角度展示了COVID-19对人工智能发展的影响。例如,“技术性能”一章探讨了AI初创公司如何使用机器学习来加速与COVID相关的药物开发;“经济”篇章显示,AI招聘和民间投资并未受到新冠大流行的严重影响,仍在增长。报告从研发、技术性能、经济、教育等多个维度探讨了过去一年人工智能的发展,并得出以下重要结论:民间对人工智能领域的投资呈现显着增长,其中“药物、癌症、分子、药物研发”获得投资比例最大——138亿美元,是2019年的4.5倍;中国在学术工作方面已经超过了美国。多年前,中国在人工智能期刊上发表的文章比美国多,而现在,中国在期刊引用方面也首次占据优势。然而,在过去十年中,美国的人工智能会议论文(和高被引论文)数量仍然超过中国;合成媒体(deepfake)数量显着增加,文本、图像、视频合成均出现突破。这显示了人工智能的快速发展,但也引发了对其滥用、误用的潜在担忧;人工智能应用的伦理挑战越来越受到人工智能界的关注。2015-2020年间,涉及伦理学及相关关键词的论文数量增长迅速;人工智能领域面临多样性挑战。2019年,45%的AI博士新生。美国的学生是白人,只有2.5%是非裔美国人,3.2%是西班牙裔。目前,人工智能研究人员正在努力增加该领域的多样性;自2017年加拿大发布国家人工智能战略以来,多个国家采取了类似举措,截至2020年,已有30多个国家发布国家人工智能战略;更多人工智能博士离开学术界去商界的教授人数持续增长,因为他们选择进入工业界而不是留在学术界;商业主导了AI研究人员常用的工具,例如企业开发的软件库(Google的TensorFlow和Keras,Facebook的PyTorch)成为GitHub上最受欢迎的框架;随着美国政府在人工智能的民用和非民用用途上花费数十亿美元,政府对人工智能领域的兴趣持续增长。美国国会提及“人工智能”的次数是上届国会的三倍;监视技术快速、便宜且应用更广泛。2020年,图像分类、人脸识别、视频分析、语音识别等技术将取得重大进展,大规模监控技术将快速成熟。报告包括“研发”、“技术性能”、“经济”、“人工智能教育”、“人工智能应用的伦理挑战”、“人工智能多样性”、“人工智能政策与国家战略”七个部分。下面分别介绍各章的核心内容。第一章:研发报告首先从五个部分总结了人工智能领域的论文发表情况:“同行评议的人工智能论文”、“人工智能期刊论文”、“人工智能会议论文”、“人工智能专利”和“人工智能论文”“arXiv论文”。同行评审论文的数量猛增。从2000年到2019年,经过同行评审的AI论文数量增长了约12倍,同行评审论文占同期发表的所有论文的比例从2000年的0.82%上升到2019年的3.8%。中国发表的人工智能期刊论文数量首次超过美国。在AI期刊论文方面,2020年AI期刊论文发表量是2000年的5.4倍。其中,2020年AI期刊论文发表量较2019年增长34.5%,大大超过2018年的增幅到2019年(19.6%)。2000-2020年AI期刊发表论文数量。其中,中国发表AI期刊论文数量最多(占比18.0%),超过美国(12.3%)和欧洲(8.6%)。这对中国来说不是第一次。2000-2020年不同地理区域发表的AI期刊论文数量占全球总数的百分比。值得一提的是,2020年中国AI期刊论文被引用次数首次超过美国。尽管如此,在过去十年中,美国对AI会议论文的引用次数仍然多于中国。2000年至2020年,AI期刊论文被引用比例,中国以20.7%的比例首次超过美国(19.8%)。人工智能会议发展迅猛过去十年,人工智能会议论文数量增长迅猛。2020年AI会议论文数量占所有会议论文的20.2%。从2000年到2020年,AI会议发表的论文数量占所有会议论文的比例。2019年中国AI会议论文发表比例超过美国。然而,在过去21年中,美国在AI会议论文的引用方面继续占据主导地位。2020年,美国以40.1%的比例位居第一,中国以11.8%的比例位居第二,两者差距依然较大。2000-2020年不同地区发表的AI会议论文数量占比2000-2020年不同地区AI会议论文被引用比例arXiv论文发表情况除了传统的期刊和会议,论文的发表情况在预印本平台上也很重要。过去6年,arXiv平台上AI相关论文增长了5倍多,从2015年的5478篇增加到2020年的34736篇。其中,中国发表的arXiv论文总数仍不及美国和欧洲,但就比例而言,中国正在迎头赶上。2015-2020年不同地区在arXiv上发表的AI论文占比。在arXiv的六个AI子领域中,机器人(cs.RO)和机器学习(cs.LG)2015-20年间论文数量增长最快2020年,分别增长11倍和10倍。2020年,机器学习和计算机视觉(cs.CV)占比最高,分别为32.0%和31.7%。2019-2020年,增长最快的类别是计算与语言(cs.CL)和机器人(cs.RO),论文数量分别增长了35.4%和35.8%。此外,得益于数据和计算能力的发展,深度学习论文的数量增长迅速。2010-2019年arXiv平台上发表的深度学习论文数量。受新冠疫情影响,大部分AI会议在线上举行,参会人数大幅增加。2020年,报告统计的九场会议的总出席人数几乎翻了一番。2010-2020年参加大型和小型AI会议的人数。大公司的高度参与可能会加剧计算鸿沟。研究表明,大型科技公司参与AI峰会的人数有所增加。研究人员认为,学术界计算能力分布不均(“计算差距”)将加剧深度学习时代的不平等。大型科技公司拥有更多资源来设计AI产品,但与小型组织相比缺乏多样性,这引发了人们对AI偏见和公平性的担忧。下图显示了大型企业参与前10大AI会议,这可能会加速计算鸿沟。2000-2019年大型科技公司AI会议论文数量占比。TensorFlow仍然是最流行的AI软件库除了论文和会议,本章还介绍了AI开源软件库。其中,谷歌开发的TensorFlow框架仍然是最受欢迎的AI软件库,其次是Keras和PyTorch。2014-2020年AI库的受欢迎程度(由GitHubstars计算)。第2章:技术性能本章总结了计算机视觉、语言、语音、概念学习、推理等人工智能子领域的技术进展。人工智能生成一切目前,人工智能系统可以合成高质量的文本、语音和图像即使是人类也很难分辨真假。这将带动大量AI下游应用,促使研究人员投入到生成模型检测技术的研究中。下图展示了近两年生成模型的进展情况:2018-2020年生成模型在STL-10数据集上的FID分数。2014-2020GAN人脸生成技术进展。计算机视觉的产业化计算机视觉在过去十年取得了巨大的进步,这主要得益于机器学习技术,尤其是深度学习的应用。新数据表明计算机视觉正在产业化:在一些最大的基准测试中,性能开始趋于平缓,这表明社会需要制定并就更严格的基准达成一致,以进一步测试性能。与此同时,公司正在投入越来越多的计算资源来以前所未有的速度训练计算机视觉系统。与此同时,用于分析静止视频帧的对象检测框架等已部署系统的技术正在迅速成熟,这表明需要进一步部署AI。ImageNet挑战中TOP-1精度的变化。COCO密集姿态估计挑战的平均精度变化。自然语言处理(一种NLP评估指标)的快速发展已经产生了具有显着改进的语言能力的AI系统,这些系统已经开始对世界产生有意义的经济影响。谷歌和微软都在他们的搜索引擎中部署了BERT语言模型,从微软到OpenAI等公司都开发了其他大型语言模型。这可以从在SuperGLUE上实现人类水平性能的系统的迅速崛起中看出。SuperGLUE是一个NLP评估套件,是为了响应早期NLP的进步而开发的,超出了GLUE评估的范围。SuperGLUE基准测试。SQUAD1.1和SQUAD2.0的F1SCORE更改。GPT-3在42个基准测试中的表现。AI推理问题大多数技术问题的指标显示最佳系统在每个时间点在固定基准上的性能。为AI指数开发的新分析提供的指标考虑了不断变化的基线,并允许随着时间的推移将一组系统的整体性能的一部分归因于单个信用系统。这些分析适用于两个符号推理问题:自动定理证明和布尔公式的可满足性。2016-2020年解决所有400个实例(布尔满足问题)的总时间。1997-2020年解决问题的百分比(自动定理证明)。机器学习正在改变医疗保健和生物学机器学习正在改变医疗保健和生物学。DeepMind的AlphaFold应用深度学习技术,在几十年的蛋白质折叠生物学挑战中取得重大突破。2006-2020年最佳CASP团队的免费建模预测准确性。科学家使用机器学习模型来学习化学分子的表征,以便规划更高效的化学合成。人工智能初创公司PostEra正在使用基于机器学习的技术来加速大流行期间与COVID相关的药物发现。PostEra:Moonshot提交的药物总数。第3章:经济人工智能的兴起不可避免地提出了一个问题:这些技术将在多大程度上影响企业、劳动力和更广泛的经济?人工智能的最新进展和突破为企业带来了许多好处和机遇,从通过自动化提高生产力,到使用算法为消费者定制产品,再到大规模分析数据等等。然而,人工智能带来的效率和生产力的提升也带来了重大挑战:企业必须找到并留住技术人才以满足其生产需求,同时采取措施降低使用人工智能的风险。此外,COVID-19大流行给全球经济带来了破坏和持续的不确定性。私营部门如何依靠和扩展人工智能技术来帮助企业渡过这个最困难的时期?AIBio获得最多投资药物、癌症、分子、药物发现是2020年最大的单笔私人AI投资,超过138亿美元,是2019年的4.5倍。2019-2020年全球人工智能私人投资行业分布。人工智能人才招聘持续增长巴西、印度、加拿大、新加坡和南非是2016-2020年人工智能招聘增长最快的国家。尽管COVID-192020年,所有样本国家的AI就业继续增长。2020年AI招聘指数的国家分布。2016-2020年不同国家AI招聘指数的变化。人工智能私人投资趋势越来越多的私人人工智能投资集中在少数初创企业。尽管受疫情影响,2020年民间人工智能投资较2019年增长9.3%,增幅高于2019年(5.7%),但新设立企业数量连续三年呈下降趋势。2015-2020年全球新增AI公司数量。2015-2020年AI基金公司私募投资额。对人工智能伦理问题的认识根据麦肯锡的一项调查,尽管越来越多的人呼吁解决与人工智能使用相关的伦理问题,但业界在解决这些问题方面做得很少。例如,人工智能中的公平性等问题仍然很少受到公司的关注。此外,与2019年相比,2020年将个人或个人隐私风险确定为相关风险的公司有所减少。2020年机构认为与采用人工智能技术相关的风险百分比。2020年,采取措施减轻风险的机构比例由AI提出。AI领域投资是否受到疫情影响?尽管大流行导致经济下滑,但麦肯锡调查的一半受访者表示,冠状病毒对他们在人工智能方面的投资没有影响,而27%的人实际上表示他们的投资有所增加。不到四分之一的企业减少了对人工智能的投资。大流行期间人工智能投资发生变化。2019年至2020年美国AI岗位占比下降,为美国6年来首次下降。美国的AI职位发布总数也下降了8.2%,从2019年的325,724个职位下降到2020年的300,999个。2013-2020年各国家/地区的AI职位。第4章:AI教育随着AI成为经济活动中越来越重要的驱动力,越来越多的人希望了解它并获得在该领域工作的必要资格。与此同时,工业界对人工智能日益增长的需求,正吸引着越来越多的教授离开教育行业,进入民营企业。本章重点介绍人工智能人才的变化趋势。2020AIIndex调查显示,过去四年,世界顶尖大学加大了对AI教育的投入。在过去的四个学年中,教授学生构建或部署实用人工智能模型所需技能的课程数量在本科阶段增加了102.9%,在研究生阶段增加了41.7%。根据计算研究协会(CRA)的年度调查,在过去10年中,北美更多的AI博士毕业生选择在工业界工作,而选择在学术界工作的则更少。具体而言,过去十年,AI博士选择在工业界工作的比例增加了48%,从2010年的44.4%增加到2019年的65.7%。相比之下,进入学术界的AI博士比例下降了44%,从42.1%%从2010年的%上升到2019年的23.7%。AI专业在CS博士中的比例在过去的10年里,AI相关的博士占美国CS博士总数的比例从14.2%上升到2019年的23%左右,根据CRA。与此同时,其他以前很受欢迎的计算机科学博士的受欢迎程度有所下降,包括网络、软件工程和编程语言。与2010年相比,编译器领域的博士人数有所减少,而人工智能和机器人/视觉领域的博士人数则大幅增加。经过两年的增长,北美大学AI教职员工从2018年的42人下降到2019年的33人(其中28人为终身教职人员,5人为非终身教职人员)。2004年至2019年间,卡内基梅隆大学的AI教员离职人数最多(16人),其次是佐治亚理工学院(14人)和华盛顿大学(12人)。AI博士国际学生比例2019年北美AI博士国际学生占比持续上升,达到64.3%,较2018年增长4.3个百分点。在国外毕业生中,81.8%的国际学生选择留在美国,8.6%的人选择在美国以外的地方工作。此外,在欧盟,绝大多数专业的人工智能学术课程都是在硕士阶段教授的;机器人技术和自动化是迄今为止本科和硕士课程中最常讲授的课程,而机器学习(ML)则在专业短期课程中占主导地位。第五章:人工智能应用的伦理挑战随着人工智能对人类生活的影响越来越深远,其面临的伦理挑战也越来越明显。各种技术的应用可能会导致意想不到的负面影响,例如侵犯隐私;基于性别、种族/民族、性取向、性别认同的歧视;和不透明的决策。创造负责任和公平的AI创新从未像今天这样重要。报告第五章首先介绍了大量近期发布的人工智能原则和框架文件,以及媒体对人工智能伦理问题的报道,然后回顾了人工智能会议上的伦理相关研究、大学计算机系开设的伦理课程世界各地。此外,该报告还讨论了面部识别技术偏见的研究。学术会议中的EthicalAI如图5.3.1所示,自2015年以来,提交给AI会议的论文在标题中包含伦理相关关键词的论文数量显着增加。但近年来,主流AI会议上与伦理相关关键词相匹配的论文标题的平均数量一直很低。图5.3.2显示了六个主要会议的所有出版物中与伦理相关的关键字匹配的平均数量。媒体报道中的AI伦理问题如图5.2.1所示,在2020年最受关注的新闻话题中,与AI伦理指导和框架相关的文章位居榜首,其次是研究与教育、人脸识别等。排名前五的新闻相关2020年人工智能的道德使用受到最多关注:欧盟委员会发布人工智能白皮书(5.9%);谷歌解雇伦理研究员TimnitGebru(3.5%);联合国成立人工智能伦理委员会(2.7%);梵蒂冈的人工智能伦理计划(2.6%);IBM宣布退出人脸识别业务(2.5%)。第6章:AI领域的多样性AI领域的多样性由来已久。目前,人工智能研究人员仍以男性为主,在种族、民族、性别认同、性取向等方面缺乏多样性。学术界和工业界仅此而已。这加剧了人工智能系统中现有的不平等。报告第6章介绍了学术界的AI人才和多样性统计数据。由于缺乏这方面的公开数据,人工智能多样性对社会和技术发展影响的统计、分析和评估将是有限的。从学术界和工业界获取更多数据对于衡量问题的严重程度和解决问题至关重要。近年来,人工智能博士毕业生和计算机科学终身教授的女性成员比例较低。根据计算研究协会(CRA)的年度调查,北美AI博士课程的毕业生平均不到所有博士毕业生的18%。根据AIIndex的一项调查,女性仅占全球大学计算机科学系所有终身教授的16%。此外,根据CRA的Taulbee调查,2019年美国新入驻AI博士生中,白人(非西班牙裔)占比最高(45.6%),其次是亚裔(22.4%)、非裔(非西班牙裔)西班牙裔)和非裔美国人(非西班牙裔)。西班牙裔(2.4%)和西班牙裔(3.2%)的人数不足。第七章人工智能与国家战略未来几十年,人工智能将重塑全球竞争格局,为早期从业者带来强大的经济和战略优势。报告第七章介绍了全球人工智能政策制定概况,梳理了当前各个国家和地区的人工智能战略。此外,本章还介绍了美国对人工智能的公共投资,以及立法机构、中央银行和非政府组织如何应对对人工智能技术政策框架日益增长的需求。自2017年加拿大发布全球首个人工智能国家战略以来,截至2020年12月,已有30多个国家和地区发布了类似文件。中国在2017年发布了《新一代人工智能发展规划》,这是世界上最全面的人工智能发展战略之一。2019年2月,白宫发布《美国人工智能倡议》,优先满足联邦政府人工智能研发的投资需求,确保人工智能技术安全开发、测试和部署的技术标准。该倡议还强调建立人工智能劳动力队伍,并表示致力于与国际合作伙伴合作,提升美国在人工智能领域的领导地位。然而,该倡议缺乏项目时间表细节,并且不清楚是否会有更多研究或其他专门针对人工智能的实用内容。政府对人工智能的兴趣仍然很高,美国政府在人工智能的民用和非民用方面投资了数十亿美元。在本届大会上,人工智能被提及的次数是上届大会的三倍。结合2019年和2020年的数据显示,创新科技、国际事务和国际安全、产业和监管等议题是美国人工智能政策文件的主要关注点。“从数据中可以清楚地看出,2020年人工智能对世界的影响将更加显着,技术将继续快速推进,”AIIndex联合主席杰克克拉克说.,政府需要花更多的钱来收集人工智能的数据,研究人员需要为新一代人工智能系统开发更高难度的测试。从各个维度分析文献表明,美国和中国在人工智能领域已经成为彼此的竞争对手。人工智能发展方面。等待的国家。”
