当前位置: 首页 > 科技观察

技术-12位专家畅谈2021年人工智能发展趋势

时间:2023-03-21 14:03:53 科技观察

我们告别了2020年,迎来了2021年!前不久我们采访了一些人工智能专家,了解他们对2021年人工智能领域主要发展趋势的看法。这些专家主要来自加拿大蒙特利尔算法学习研究所(MILA)、美国信息技术研究所和分析公司加特纳(Gartner)、Facebook、亚马逊的人工智能研发部门AlexaAI、美国国家航空航天局(NASA),以及基于许可的电子邮件营销服务提供商Mailchimp等组织和机构。图片来源:REWORK美国信息技术研究分析公司Gartner的数据科学负责人AndriyBurkov在与用户进行试用后,虽然有些公司可能会推出家庭和工作之间的点对点无人驾驶通勤服务,但全自动驾驶汽车在2021年仍“准备就绪”。此外,全自动驾驶卡车将开始在高速公路上从一个海岸到另一个海岸长距离行驶(可能借助人工远程监控),尽管最后一英里的驾驶仍将由安全人员直接控制。基于Transformer的预训练模型,比如GPT-3,会更擅长伪装智能,这会更让人不安,伪装智能的程度甚至可能让一些人认为它已经实现了智能。AnirudhKoul,NASA机器学习负责人,图片分享网站Pinterest技术孵化负责人,本书作者《云、移动端和边缘智能设备的实用深度学习》AnirudhKoul2021年,我期待两件事。一种是变大的东西,一种是变小的东西。预测未来的最好方法是回顾过去(也许在过去部署一个LSTM网络)。在两年内,我们的预训练模型从440MBBERT变成了350GBGPT-3。我们已经可以通过云租用一台超级计算机,利用其285,000个CPU内核和10,000个GPU(由微软为OpenAI开发,OpenAI是硅谷大亨共同创立的人工智能非营利组织)。我们已经在您口袋中的iPhone的A14芯片中实现了118亿个晶体管。我们已经能够在90秒内训练ImageNet,这在十年前可能需要几个月的时间。因此,我们可以预见,计算能力、模型和算法的能力将继续呈指数级增长,进一步向大家展示人工智能的新奇魔力。另一方面,我们现在可以实现BERT精度,但使用FastFormers的CPU推理速度提高了233倍。今天,我们通过NVIDIAMaxine传输视频通话,它只需要比以前五分之一的带宽。我们将训练AutoML模型的时间从40,000GPU小时(2018年的MNasNet)减少到3.75小时(2019年的单路径NAS)!只关注模型剪枝和模型量化不是我们对模型的研究课题,而是研究课题是从业者写的高效三行代码(TensorFlow模型优化工具箱)。2021年,关注小事的乐趣将持续增长,让边缘智能设备的用户基于强大的模型获得神奇的体验。情感感知初创公司Affectiva的联合创始人兼首席执行官RanaelKaliouby博士我们将看到情感感知AI的新用例,以促进COVID-19大流行期间的在线协作和交流。在COVID-19大流行期间,我们比以往任何时候都更加依赖视频会议。视频会议以虚拟方式连接我们,使我们能够远程工作、在家学习和社交。然而,目前存在一个主要问题:情感感知是这些技术的盲点。当我们面对面交流时,我们不仅可以通过文字本身传达信息,还可以通过面部表情、语调和肢体语言传达信息。但这些技术最初并不是为了捕捉我们与周围人互动方式的细微差别而设计的。我们或许能够利用人工智能在虚拟环境中保留我们人性的一面。具体来说,能够根据面部表情和声音理解人类微妙情绪和复杂认知状态的情绪感知人工智能软件,可以解决疫情期间出现的一些技术短板,我们将看到各大公司将其应用到新的用例中,例如视频会议和虚拟活动——情绪感知人工智能可以在虚拟活动或会议期间提供对人们情绪的理解。它向在线演讲者提供现场听众反馈,让参与者获得共享体验,同时帮助公司了解这个压力时期的集体参与。在线学习——具有情感感知能力的AI可以针对学生对在线教育材料和指导的参与情况提供反馈。当学生感到困惑、紧张或无聊时,系统会发出信号。这在疫情期间尤为重要。毕竟,很多学生在网上学习时都会出现“变焦疲劳”。远程医疗——随着远程医生就诊逐渐取代面对面诊断,具有情感意识的人工智能可以在患者和医疗保健提供者之间建立更有意义的讨论和信任。此外,对患者情绪健康的数据驱动分析提供了心理健康的定量测量,而不是要求患者以1到10的简单等级进行自我评估。AlexiaJolicoeur-Martineau降噪评分与AnnealedLangevin的变化Sampling(DSM-ALS)andDiffusionDenoising,蒙特利尔学习算法研究所(MILA)的博士研究员,将开始打破模型生成的记录;他们将击败当前最先进的一代对抗网络(GAN)。我们还将看到生成模型的新指标,因为当前的指标IS(起始分数)和FID(FrechetInceptionDistance分数)将使值接近完美,但仍未实现逼真的图形。ChandraKhatri,Got-ItAI首席科学家兼对话式AI负责人无代码AI平台、产品和初创公司激增:在过去几年中,人们创造了许多强大的深度学习和AI工具,例如PyTorch和Tensorflow.工程师现在已准备好在现有工具之上构建无代码AI平台和产品层,用户只需提供他们的数据并通过配置或用户界面列出或选择模型。我们不仅可以训练和提供模型,还可以通过RESTAPI将它们公开给应用程序。Got-ItAI开发的无代码、自我发现、自我训练、自我管理平台,正朝着流行的对话式人工智能方向发展。微软最近推出了一款名为“Lobe”的应用程序,它允许任何人训练AI模型,它也在朝着民主化对话AI的方向发展。可持续发展的人工智能:我们正在经历一个流行病(包括SARS、H1N1和COVID-19)变得越来越普遍的阶段,气候变化正在导致大规模的森林火灾和物种灭绝,洪水和干旱也越来越多常见的。我们将看到越来越多的初创企业,以及由大公司或组织资助的倡议,利用人工智能实现可持续发展。我们已经看到斯洛伐克的可再生能源公司Fuergy和加拿大拼车平台Facedrive等绿色科技初创公司,我们很可能会看到AI初创公司使用预测模型来应对气候变化、大流行病预测和缓解以及城市交通问题等.AbhishekGupta,蒙特利尔人工智能伦理研究所(MAIEI)创始人兼首席研究员,微软公司机器学习工程师,协同创新部门(CSE)首席人工智能委员会成员我的预测(和我真诚的希望)是道德、安全和包容将成为每个从事AI工作的人的日常工作原则。更重要的是,我预测差分隐私等一些概念将变得更加主流,并很好地融入日常实践中。随着新组织开始意识到使用AI完成工作的价值,我还预测许多能力建设工作将开始发生在应用AI的传统领域之外。随着人工智能工具变得更容易获得,公民数据科学家的概念将获得更多关注,人工智能技术将被用作解决对人类社会非常重要的问题的新方法。最后,信息污染等问题将会加剧,我相信这将迎来一个知识构建的时代,组织和团体将努力提高认识,并让大众具备更好地驾驭环境的技能。亚马逊人工智能研发部门AlexaAI首席研究科学家ShaliniGhosh表示,随着人们开始在家庭和工作环境中接触到越来越多的人工智能设备,这些设备能够帮助用户完成的任务数量将进一步增加。例如,智能助手可以帮助用户完成租借电影或在线订餐等任务,智能监控可以通过异常事件检测来确保家庭安全。许多任务将是多模式的,涉及视频、音频、语音和文本数据的处理和分析。因此,到2021年,人们将继续对多模态AI感兴趣,正如我们在2020年已经看到的那样。此外,许多高级任务的标记训练数据稀缺,这将促使对稀疏数据环境中的学习技术进行进一步研究,比如小样本学习和自监督学习。最后,由于许多AI任务将在用户设备上运行,我们将看到更多对设备上机器学习(以及更广泛的资源受限机器学习)感兴趣的研究。获得许可的电子邮件营销服务提供商Mailchimp数据科学家MuhammedAhmed使用了更多的零样本注释!近年来,我们深入研究了大量预训练自然语言处理(NLP)模型的好处。许多最近的研究喜欢使用零样本(ZS)学习器作为开箱即用的分类器。在2021年,我希望看到更多人使用零样本学习来标注数据集和训练开箱即用的分类器。与零样本分类相比,零样本标记的优点包括:免费标记:无需昂贵的标记器(如亚马逊机械土耳其人)即可管理数据集标记指导:将开放式标记任务转化为简单的真/假标签·隐私保护标签:在标记敏感数据(例如医疗保健和遗传数据)时很有用多类、零样本和自然语言推理(NLI)等场景)全栈数据科学家的成长对于很多机器学习任务,未来的工程和建模不再是难事。这主要是因为机器学习领域在过去几年取得的巨大进步。对于自然语言的理解和生成,我们知道使用转换器。对于计算机视觉,我们知道使用CNN。对于列表类型的数据,我们知道使用树的方法,这种方法经常使用bagging或boosting等算法。这节省了我们过去能够解决和试验并快速训练最先进模型的大量时间。许多数据科学团队的新痛点是部署模型和编写生产就绪代码,这需要具有软件工程和MLOps技能的开发人员。到2021年,我预计对机器学习工程师和全栈数据科学家的需求会更大。数据管理平台ApertureData创始人兼首席执行官VishakhaGupta随着机器学习和数据科学领域的成熟,机器学习行业正在从提高模型在特定数据集上的性能和准确性发展到解决MLOps挑战。随着当前机器学习工具和平台对细节的抽象化,我相信未来的重点将更多地放在降低复杂性、提高生产力和展示实时公司数据(在延迟和足迹内)的结果上,而不是展示可行性。通过机器学习从数据中获取商业价值涉及多个步骤,这个过程仍然需要多个孤立的解决方案。当集成这些解决方案时,系统效率会降低。假设这些不同的步骤中的每一个都与数据交互并提供一种统一且有效的方法来进行交互,那么它会降低机器学习管道在扩展时的复杂性,无论处于哪个阶段。我的研究主要集中在智能数据管理领域。我预测,到2021年,我们将越来越重视基础设施,这些基础设施能够在边缘设备和云中实现更简单和更具可扩展性的机器学习部署,解决问题的时间,以及在真实世界数据上安全运行的能力。大量的训练和验证任务作为主要指标。与此同时,能源效率将成为次要指标,尽管它会变得越来越重要。2021年的另一个重点领域是验证模型在更具代表性的数据集上的表现如何的工具。几个研究小组已经确定了模型如何受到现实世界图像捕获的影响、文本数据的混乱程度以及训练集数据本身的代表性。我相信会有更多的标准化指标和中立的第三方验证工具或服务来评估模型的准确性。这些工具或服务最终结合了解决方案的操作和性能指标来给出总体评分。JekaterinaNovikova,加拿大技术和健康公司WinterLightLabs的机器学习负责人。2020年对很多人来说都是特殊的一年,没有太多的正能量。COVID-19的爆发、健康风险的增加、全球范围内前所未有的流动和旅行限制,以及COVID-19大流行的其他后果,已经彻底改变了我们的日常生活。我认为这个背景加速了人工智能在几个领域的应用,在2021年会形成一些重大转变。首先,人工智能解决方案将在医疗保健领域得到更广泛的应用,尤其是在心理健康领域。遭受抑郁、焦虑和压力等问题困扰的人数正在飙升,而基于人工智能的工具和解决方案恰到好处,能够解决这场危机。其次,在新冠疫情长期未得到完全控制的情况下,由于各种追踪应用的应用,以及类似基于人工智能的解决方案的出现,个人隐私问题也变得尤为突出。显然,这些产品非常有用,可以帮助实施必要的社会控制、预测疫情和追踪感染。然而,由于人工智能可能对隐私造成负面影响,这将在2021年成为一个严重的问题。TaniyaMishra,教育科技初创公司SureStart创始人兼首席执行官我们将看到更多人工智能产品关注人和整个社会。多元化、平等和包容(DEI)问题正在所有业务领域重新被唤醒,包括人工智能和技术,这是一个不会消失的新兴趋势。具体来说,忽视DEI这三个方面的人工智能公司会承担影响其底线的商业风险。如果AI没有为其所有目标市场或用户提供服务,那么这些公司实际上并没有最大化其工作的价值。同样很重要的是,很多公司通过对数据和算法偏差的技术评估,关注并解决了人工智能的多样性和伦理问题。然而,如果我们真的要解决这个问题,考虑到围绕种族平等和正义的对话,我相信我们将更加关注人、社会和构建AI的团队。我们都看到自上而下的DEI计划经常失败,通常是因为个别员工不了解如何在日常决策中具体化,或者更确切地说,他们没有与这些决策建立情感联系。所以,在2021年,我们会看到人工智能公司采取自下而上的DEI方式,拓宽员工尤其是技术人员的视野,让他们进一步了解“谁”是工程师,“谁”是科学家,以及“谁”是技术专家。此外,人工智能不再是一门纯技术学科,我们需要采用多学科方法来了解它对人类的影响。对此有深入思考的公司将开始建立专门的团队,其中不仅包括技术人才,还包括受过专业训练的伦理学家、社会学家和人类学家。从技术和规范的角度思考技术的影响。如果要恢复对科学技术的信心,人工智能行业使用数据的方式将不得不改变。多年来,许多公司争先恐后地成为创新驱动型企业(IDE)。但是现在,大家新的关注点变成了数据驱动企业(datadrivenenterprises,DDE)。对于人工智能公司来说,DDE尤为重要。毕竟,人工智能系统需要大量数据来训练、测试和验证算法。然而,随着大量数据的出现,在收集、存储和使用这些数据,或使用它来构建符合道德规范的人工智能时,责任也随之而来。随着越来越多的消费者希望参与有关如何以及由谁使用其数据的决策,市场也受到这些道德挑战的推动。对个人数据访问的控制权将掌握在用户手中,而不是技术开发人员或技术企业所有者。人工智能公司需要牢记这一点,想方设法让数据收集、存储和使用更加透明;同时,他们需要关注如何使用这些数据来确保人工智能系统的公平和公正。这要求人工智能公司在测试和验证算法时建立约束,不仅要检查整体准确性,还要特别检查它在不同人口群体(例如白人男性与黑人女性)之间的泛化程度。只有这样,组织才能在将AI部署到产品中之前识别出特定的偏见领域并加以解决。深度学习初创公司DeepCube的联合创始人兼首席技术官EliDavid博士,我们看到一个明显的趋势,即顶级深度学习模型越来越大。2019年,最大的深度学习模型有大约10亿个参数(权重)。到2020年,最大的深度学习模型已经超过1000亿个参数,一年增长100多倍!由于提高了准确性,这些较大的模型也更有优势。然而,它的计算和内存需求正以同样的速度增长。因此,能够显着减小这些模型的大小并提高其速度的解决方案将变得越来越重要。