当前位置: 首页 > 科技观察

2019人工智能领域预测与展望

时间:2023-03-19 01:59:32 科技观察

2019人工智能领域将如何演变?与往年相比,会有哪些变化?人工智能正在引领全球企业的创新——无论是大型企业集团还是年轻的初创企业。根据市场调研报告《从技术和垂直行业看人工智能市场——全球机会分析和行业预测》,2018年至2025年,全球人工智能市场规模预计将从2016年的40.65亿美元增长至1694.11亿美元,年复合增长率为55.6%。该报告按技术、垂直行业和地区对人工智能市场进行了细分。人工智能技术细分为机器学习、自然语言处理、图像处理和语音识别。2016年,机器学习部分在收入方面主导了人工智能市场,由于人工智能行业对解决方案的需求不断增加,预计这一趋势将在未来几年继续下去。据Statista称,大部分收入来自企业应用市场的人工智能。以下是2019年AI的预期:IBM、谷歌、微软、亚马逊和机器学习API提供商将发布更具包容性的数据集,以解决AI内置的歧视和偏见机器学习是人工智能AI的主要形式已成功应用于许多不同的领域,例如亚马逊智能助手Alexa的语音识别、Facebook自动标记照片的人脸识别、自动驾驶汽车中的行人检测,甚至是基于您的访问的电子商务。一个网站的记录决定给你看一个鞋子广告等。在机器学习中,决策是从现有的人类决策和标签的数据记录中学习的。所以,为了让计算机区分狗和猫,我们给它看了很多带标签的狗的图像和很多带标签的猫的图像,让它学习两者之间的区别。这种看似无伤大雅的做法本身就带来了一个严重的问题——偏见。如果我们盲目地将人类的符号和决定输入计算机,计算机就可以完全复制我们的偏见。臭名昭著的MicrosoftTay机器人就是一个很好的例子。更糟糕但更微妙的是,来自数据本身的偏差不能代表我们想了解的广大人群。例如,今年早些时候,JoyBuolawumi和TimnitGebru表明,在对一个人的性别进行分类的任务中,主流商用计算机视觉产品在输入浅肤色男性图像时表现良好,而在输入深色皮肤女性图像时表现最差.如果我们训练这些分类器的数据集没有包含足够多的正确标记的有色人种,并且没有捕捉到更广泛的文化差异,无论他们来自哪里,这都是一个巨大的问题。在这些非包容性数据集上训练的机器学习模型做出的关于人员样本不足的决定显然是有缺陷的。2019年,我们将看到拥有主流计算机视觉产品的大公司公开发布更具包容性的数据集。这些数据集将在地域、种族、性别、文化观念等多个维度上变得更加均衡,它们的公开发布也将推动研究人员进行研究,以最大限度地减少人工智能的偏见。医疗保健和金融服务将更多地采用AI,因为这些产品可以使AI的决策更容易解释成为主流当AI基于可以做出易于解释的决策的算法时,生活会简单得多。例如,一种算法首先了解你是否头痛,然后查看你是否发烧,然后得出你得了流感的结论,这是可以解释的。只要可以解释算法如何做出决策,那么它的预测是对还是错就具有巨大的价值。在医学等领域,我们可能会使用机器来做出生死攸关的决定,因此能够追溯地理解为什么机器会建议采取特定的行动方案显然很重要。在金融等领域,这也很关键。如果AI算法拒绝某人贷款,了解原因很重要——尤其重要的是要确保它不会无故歧视。随着AI变得越来越成功,它更多地依赖于一种称为“深度学习”的技术,该技术利用多层神经网络(因此名称中有“深度”一词)。在这些系统中,没有明确的方法来解释发生了什么,以及机器做出决定的原因。该系统就像一个极其精确的黑匣子,可以接收一系列症状、测量值、图像以及患者状态和病史的数据,并可以输出高度准确的诊断。例如,谷歌人工智能可以通过检查你的眼睛来预测你是否有患心脏病的风险!你的眼睛怎么了?没有人会轻易的认为自己的眼睛有问题!为了推动AI在金融和医疗保健等行业的采用,将会有针对这些行业的业务支持系统,帮助我们重新思考深度神经网络,并让我们更好地解释AI预测。企业将尝试完全自动化解释这些预测的过程,但成功将在于使人类能够调查“黑匣子”以更好地理解其决策,以便机器背后的人类能够提出自己的解释。算法与算法。除了“假新闻”之外,其他领域的AI系统也会受到基于AI的攻击。其他关键任务系统将面临新的安全问题。到目前为止,公众的注意力集中在图像、视频和音频上——笼统地说,是“假媒体”和“假新闻”的泛滥——但在2019年,我们将看到一些示范:生成令人信服但虚假的结构化和非结构化文本数据,导致机器在诸如信用评分和从文档中提取数据等问题的自动决策方面出错。迁移学习和模拟成为主流,帮助企业克服冷启动问题,避免高昂的训练数据积累成本大多数人工智能项目的成功很大程度上取决于拥有高??质量的标记数据。大多数项目死于这个问题,因为他们通常没有手头问题的现有数据,或者很难手动标记所有现有数据。例如,即使像预测客户是否会购买产品这样简单的事情也会在没有客户的情况下遇到冷启动问题。如果您的企业永远不会变大,您将永远无法获得利用强大技术所必需的“大数据”。更糟糕的是,在需要专业知识的情况下(例如,标记肿瘤),获得数以千计的数据标签是非常昂贵的。人工智能研究的一个活跃领域是如何应对这一挑战。我们如何只用少量数据使用强大的深度学习技术?2019年,有两种方法将在企业中得到更多采用。一种有效的方法是迁移学习——从一个具有大量数据的域中学习的模型用于重新训练机器以在另一个数据较少的域中学习。例如,LandingAI?只需使用少量缺陷产品示例即可检测出生产线上目标对象的缺陷。现在任何人都可以从一个模型开始,该模型从ImageNet等大型数据集中学习大量图像,并训练专门的对象分类器(例如区分损坏的汽车或房屋,自动处理保险)。这些字段也不必基于相同的数据类型。研究人员使用从传感器数据获得的图像数据库中学习的模型来训练分类器。第二种方法是合成数据生成和模拟。生成对抗网络使我们能够创建非常逼真的数据。众所周知,Nvidia使用生成对抗网络来生成虚拟但非常引人注目的名人面孔。自动驾驶汽车公司也在创建虚拟模拟,他们能够在比现实生活更远的距离内训练他们的驾驶算法。例如,Waymo自动驾驶汽车在模拟中行驶了50亿英里,但在现实世界的道路上仅行驶了8英里。2019年,公司将使用模拟、虚拟现实和合成数据在机器学习方面取得巨大进步。以前,由于数据限制,这是不可能的。越来越高的隐私要求将推动更多人工智能在边缘设备上发生,大型互联网巨头将投资边缘人工智能以获得竞争优势。随着消费者转向大互联网获取他们的所有数据公司越来越意识到,那些能够提供不需要将数据上传到云端的服务的公司将享有竞争优势。业界普遍认为,产品和服务必须使用云端来执行昂贵的机器学习操作,例如面部识别和语音识别。移动电话和更小的边缘设备,从而减少将潜在敏感数据发送到中央服务器的需要。这种趋势还处于早期阶段,苹果等公司在移动设备上而不是在云端进行智能处理(运行机器学习模型)(例如,使用CoreML及其专用神经引擎芯片,谷歌也宣布了TPU边缘产品)。2019年,这一趋势将加速,移动性、智能家居和物联网生态系统将推动机器学习在边缘发生。