当前位置: 首页 > 科技观察

重的!剑桥年度AI全景报告出炉:美国27%顶级AI人才有中国教育背景

时间:2023-03-20 15:24:04 科技观察

本文转载自雷锋网。进入2020年,在疫情黑天鹅、新基建极速成为共识的背景下,AI真正迎来了属于自己的高光时刻。今年全球人工智能领域人才分布情况如何?人工智能领域有哪些研究和突破?AI行业有哪些新动向?未来有哪些新趋势?剑桥大学一年一度的AI全景报告或许会??告诉你答案。今年是第三期年度报告,NathanBenaich和IanHogarth代表剑桥大学总结了过去一年的AI趋势。与往年一样,该报告引用了知名科技公司和研究团体的数据。新版AI全景报告全面总结了过去一年AI领域的研究成果与突破、人才情况、行业趋势等,并对未来做出预测。报告显示,在美国工作的顶尖AI人才中,27%拥有中国教育背景,但54%毕业后会赴美攻读博士研究生,90%选择留下在美国工作。如需获取本报告pdf全文,请在雷风网(公众号:雷风网)微信回复关键字“1010报告”公众号进行提取。文档来源:剑桥大学1.人工智能研究进展:只有15%的论文会开源代码,PyTorch超越TensorFlow1,开放性还不够AI研究的开放性没有我们想象的那么高,只有15%的论文将开源他们的代码。研究论文代码的实施对于AI的问责制、可重复性和进步至关重要。自2016年年中以来,该领域在这一指标上几乎没有改善。传统上,学术团体比行业团体更有可能发布他们的代码。不发布所有代码的著名组织包括OpenAI和DeepMind。对于科技公司而言,他们的代码通常与无法发布的专有扩展基础设施交织在一起。这说明AI人才和计算机的集中是一个巨大的问题。2.PyTorch超越TensorFlow在研究论文中,Facebook的PyTorch迅速超越了谷歌的TensorFlow。20-35%的会议论文提到他们使用的框架,75%引用PyTorch而不是TensorFlow。2018年,有161位作者发表了比PyTorch论文更多的TensorFlow论文,其中55%的作者转向了PyTorch。15%正好相反。同时,作者观察到TensorFlow、Caffe和Caffe2仍然是生产AI的主力军。此外,PyTorch在GitHub上比TensorFlow更受欢迎。据统计,现在约有47%的实现基于PyTorch,而TensorFlow约为18%。PyTorch提供更大的灵活性和动态计算图,使实验更容易。JAX是Google生产的一种对数学更友好的框架,通常适用于卷积模型和转换器之外的工作。3.NLP模型的趋势另一方面,大规模模型正在推动NLP领域的技术进步。OpenAI的GPT-3等新研究已将深度学习模型的参数数量推至数千亿。按照目前云服务的算力价格,训练一个1000个参数的模型平均需要1美元,而拥有1750亿个参数的GPT-3可能要花费数百万美元。一些专家认为,这个数字超过了1000万美元。高昂的培训成本让研究人员在探索新方向时遇到了挑战。在AI模型训练对计算能力要求越来越高的同时,传统的计算机架构也逐渐接近摩尔定律的尽头。根据麻省理工学院等大学的研究,如果科学家希望将ImageNet数据集的图像分类任务的错误率从11.5%降低到1%,可能需要数百亿美元的投资。不过,人们也在研究提高模型效率的方法。OpenAI的统计数据显示,自2012年以来,将ImageNet图像分类的深度学习神经网络训练到一定水平所需的计算能力每16个月减半。.毫无疑问,GPT-3、BERT等模型将NLP领域的研究带入了一个新的阶段。甚至还有自动翻译编程语言的无监督机器翻译工具。在GitHub上以90%的准确率将C++函数翻译成Java。4.生物学的“AI时刻”:仅2020年就有21000多篇论文生物学研究正在经历“AI时刻”:仅2020年就有21000多篇相关论文发表。自2017年以来,涵盖生物领域人工智能方法(例如,深度学习、NLP、计算机视觉、RL)的出版物同比增长了50%。2019年以来发表的论文占2000年以来发表的所有论文的25%。然而,目前大多数机器学习应用通过统计实现功能,忽略了人类学习知识的重要方法——因果推理。在为患者寻找诊断和治疗等任务中,因果推理是一种更好的方法。JudeaPearl和YoshuaBengio等人工智能先驱认为,因果推理是一个新的方向,可以让机器学习系统泛化得更好、更强大、更稳健,为决策做出更大的贡献。5.联邦学习从2018年到2019年,提到联邦学习的论文数量增长了近5倍。2020年上半年发表论文数量超过2019年全年。2.AI人才:人才流失,27%具有中国教育背景的人工智能领域研究人员分布近年来呈现出几个新趋势。1.人才流失2004年至2018年间,谷歌、DeepMind、亚马逊、微软从美国大学聘请了52位终身教授和终身教授。卡内基梅隆大学、华盛顿大学和伯克利大学同期失去了38位教授。值得注意的是,2004年没有一位AI教授离职,但仅2018年就有41位AI教授离职。当然,老教授的离开可能会为年轻的学术人才腾出晋升阶梯。同时,也有学者不买账。人工智能教授的流失与美国69所大学毕业生创业精神的下降有关。一般来说,人工智能终身教授离职4-6年后,毕业生创办人工智能公司的可能性降低4%;但这不适用于教授在学生毕业前离开1-3年的情况,这表明教授与学生之间的互动很重要;但人工智能教授的离职与同一所大学的毕业生创办非人工智能公司之间也没有显着相关性。2、中国学者的重要性凸显。2019年被NeurIPS录用的论文作者中,有29%的人在中国获得本科学位。但在离开中国大学后,54%的毕业生前往美国在NeurIPS发表论文。在人工智能领域,美国依然是国际研究的中心,在美国毕业的博士生90%会留在美国继续工作。非美国人工智能博士毕业生更有可能在毕业后为大型科技公司工作,而美国博士。毕业生更有可能为初创公司工作或加入学术界的研究行列。与此同时,许多美国AI博士毕业生毕业后前往英国和中国寻找工作。赴英毕业生中,55%选择在私营部门工作;去中国的人中,40%选择去私营部门。还有数据显示,尽管美国在AI领域处于领先地位,但大多数在美国工作的顶尖AI研究人员并未在美国、中国(27%)、欧洲(11%)和印度(11%)接受过本科教育。美国最大的人工智能人才供应商。3、美国对人工智能人才的依赖考虑到美国人工智能产业对移民的依赖程度,特朗普宣布暂停H1-B签证的消息引发强烈反弹。八项联邦诉讼和数百所大学表示反对。4.美国继续在NeurIPS2019论文中独领风骚。以NeurIPS2019为例,谷歌、斯坦福、卡内基梅隆大学、麻省理工学院、微软的论文发表数量位居前五。5.人工智能人才供给紧缺。AI领域人才需求持续增长。许多一流大学也在扩大人工智能专业的招生规模。以斯坦福为例。近年来,斯坦福AI领域的学生人数是1999-2004年的十倍,AI领域的学生人数也比2012-2014年翻了一番。尽管如此,来自Indeed的数据显示,职位空缺的数量仍然是求职者数量的大约三倍。但2020年人工智能领域的人才市场不可避免地受到新冠疫情的严重影响。LinkedIn公布的数据显示,2020年机器学习职位的强劲增长趋势在2月份受到冲击,开始回落。3.AI产业:医疗、自动驾驶正在充分利用AI1。医疗疫情期间,多家科技公司将AI医疗影像识别技术投入使用。例如,深度学习改进了从采集到分析的超分辨率显微镜成像,使用监督学习和计算机视觉将人类显微镜下的时间缩短到几分钟。超分辨率显微镜通常需要主题专家来评估样本,ONI的系统可自动执行这些视觉检查任务并解锁超分辨率外行用户。此外,美国医疗保险和医疗补助服务中心还提出了基于深度学习的医学影像产品成本标准。未来,人工智能技术在医疗领域的优先使用将越来越普遍。例如,利用人工智能设计药物已经在日本进行了临床试验,大量的创业公司也获得了大量资金用于平台战略的制定。2.自动驾驶自2018年以来,在加州拥有自动驾驶汽车测试许可的66家公司中,只有3家被允许在没有安全驾驶员的情况下进行测试。它们是Waymo(谷歌)、Nuro和AutoX。即使在最自由的加利福尼亚州,与人类相比,自动驾驶汽车行驶的里程迄今为止也微不足道——自动驾驶汽车公司在2019年的行驶里程比2018年多了42%。但这只是行驶里程的0.000737%2019年由加州持照司机驾驶。自动驾驶领域的公司必须有强大的资金支持。被亚马逊以13亿美元收购的Zoox,自2015年以来已融资超过9.55亿美元,Zoox最新估值约为32亿美元。交易文件显示,Zoox在2020年初每月烧掉3000万美元。国内旅游公司滴滴最近也剥离了自动驾驶业务,并从软银愿景基金等机构筹集了5亿美元。7月,滴滴在上海推出自动驾驶汽车服务。目前,自动驾驶系统中的大多数机器学习算法只关注车辆周围的事物,并且基于精心设计的手写规则。研究人员正在开发类似于AlphaGo的新算法,它从大量人类驾驶经验中学习进行训练。最近,Waymo、Uber、Lyft都展示了模仿学习和逆向强化学习的新技术。自动驾驶等领域的发展也需要大量的计算能力。今年Graphcore、Nvidia等公司推出的新一代芯片成为了人们的希望。此外,今年人工智能还在保护人类免受电子邮件钓鱼攻击、计算机视觉检测被篡改的身份证件、反洗钱和恐怖主义融资以及经济犯罪方面做出了巨大贡献。四、政策变化1、伦理道德风险NeurIPS和ICLR都提出了新的伦理规范,但没有强制要求代码和数据共享。以人工智能领域的顶级会议NeurIPS为例:NeurIPS将创建一个专门的子团队,由机器学习和伦理学交叉领域的专家组成。NeurIPS现在要求论文作者提交关于“这项工作可能产生的更广泛影响,包括伦理方面和未来社会影响”的报告。鉴于Facebook和谷歌等公司在NeurIPS中的影响力越来越大,“作者必须明确披露资金来源和竞争利益。”NeurIPS“强烈鼓励”共享数据和模型,但并不强制要求。在这方面,机器学习领域落后于生命科学领域。例如,在《自然》杂志上发表论文的条件之一是作者必须“及时向读者提供材料、数据、代码和相关协议”。华为加强了在智能手机领域的主导地位,并大力投资机器学习技术。2、人脸识别面临争议。目前,全球有50%的人允许使用面部识别。只有3个国家(比利时、卢森堡、摩洛哥)仅在特定情况下部分禁止使用该技术。那些领先的科技公司对人脸识别技术的使用也更加谨慎:微软删除了其拥有1000万张人脸的数据库——这是目前最大的数据库。数据库中的人脸是未经当事人许可从网上抓取的。亚马逊宣布暂停警方使用其面部识别工具Rekognition一年,以便“国会有足够的时间制定适当的法规”。IBM宣布放弃其面部识别产品和技术。纽约大都会运输署(MTA)要求苹果公司允许乘客在戴口罩的情况下使用FaceID,以防止新型冠状病毒的传播。3.军事人工智能系统受到重视美国继续在军事人工智能系统的实施方面进行大量投资。随着机器学习技术的不断产业化,军方也越来越多地对其进行探索。美国总务署和美国国防部联合人工智能中心授予博思艾伦咨询一份为期五年、总额超过8亿美元的订单。单词。在国防层面,有更多与人工智能相关的公司正在获得利润丰厚的政府合同和风险投资。戴尔的Pivotal软件公司获得了美国国防部1.21亿美元的合同,一些从事无人机、高分辨率卫星地图、信息管理等的公司获得了大量风险投资,如Anduril、Rebellion、Skydio.从AlphaGo、AlphaStar到AlphaDogfight,借助深度强化学习技术,人工智能正在更多领域击败人类顶尖选手。这也充分说明,在游戏作战环境中锻炼出来的制胜法宝,是可以快速转移到军事环境中的。4、华为智能手机业务主导地位增强华为在智能手机领域的领导地位越来越强,并且在机器学习技术上投入巨资。九年来,苹果和三星以外的公司首次引领市场。但根据美国的制裁,到2020年9月中旬,华为的芯片供应将告罄。使用美国芯片制造设备的外国公司在向华为供应某些芯片之前将需要获得美国许可。华为消费者事业部总裁宣称:“没有芯片,就没有供应”。5.台湾台积电在研发支出和半导体制造方面仍占主导地位台积电的研发支出与中芯国际的收入相当。台积电是唯一一家采用5nm工艺(N5)的制造商,目前正在研发3nm工艺(N3),其效率比N7高2倍,性能提高33%。6.中国正在努力减少对美国半导体的依赖中国政府设立了290亿美元的国家支持基金,以减少对美国半导体技术的依赖。并招募了100多名台积电工程师,缩小了与中国在半导体能力上的差距。新的国家基金得到了财政部、国家开发银行、地方政府和国有企业的支持。继2014年首支政府主导的半自动化投资基金推出之后。7.美国参议院提出CHIPS法案尽管全球一半以上的先进芯片是在美国设计的,但只有12%是在美国制造的美国。美国CHIPS法案将指定220亿美元补贴美国芯片制造业。这些项目包括100亿美元的联邦配套资金、国防部的相关资金以及120亿美元的相关研发资金。此外,美国要求盟友也为其生产芯片。8.AI民族主义:AI预算将继续扩大AI继续被强调为最重要的科技投资领域。国防部联合人工智能中心继续扩大启动预算,从2019年的9300万美元增加到2020年的2.38亿美元。9.所有国家都在宣布自己的人工智能战略。五、对未来的预测报告最后给出了未来十二个月的八项预测:1.构建更大语言模型的竞赛将继续,我们将见证第一个10万亿参数级模型的诞生。2、attention-based神经网络将从NLP领域迁移到CV领域,实现新的SOTA。3、随着母公司战略的调整,某大企业的AI实验室即将关闭。4.为响应美国国防部的活动和美国军事人工智能初创公司的融资,一些中国和欧洲的国防人工智能公司将在未来12个月内筹集超过1亿美元的资金。5.顶级AI药物发现初创公司(如Recursion、Exscientia)要么进行IPO,要么以超过10亿美元的价格被收购。6.DeepMind将在结构生物学和药物发现方面取得重大突破。7.Facebook将利用3D计算机视觉技术在AR和VR方面取得重大突破。8.NVIDIA最终不会完成对Arm的收购。最后,您如何看待2020年AI的发展?