从自动驾驶到机器翻译,从识别欺诈交易到语音识别,从卫星图像识别到帮助视频流服务预测我们想看哪部电影……机器学习(ML)正在推动人工智能(AI)的爆发式增长应用程序,帮助软件理解不确定和不可预测的现实世界。毫无疑问,得益于数据量的增加、计算能力的丰富以及算法的进步,机器学习被认为是目前最成功的人工智能技术,彻底改变了行业竞争格局和我们的日常生活。机器学习使计算机能够处理迄今为止只能由人类执行的任务。Gartner的相关调查显示,2020年,每家企业平均部署10个ML项目,到2021年将达到20个。机器学习将在全球产生高达2.6万亿美元的价值。那么在企业服务领域,目前的机器学习热潮靠的是什么?未来会在哪些方面发挥更多作用?1机器学习应用程序无处不在。每个Google搜索都使用各种机器学习系统,将您的查询语言作为模型输入,为您输出个性化的结果。因此,搜索“贝斯”的渔夫不会被吉他的搜索结果淹没。同样,Gmail的垃圾邮件和网络钓鱼识别系统使用经过大量数据训练的机器学习模型,让您的收件箱远离恶意电子邮件。虚拟助手是机器学习能力最明显的体现之一,例如苹果的Siri、亚马逊的Alexa、谷歌助手和微软的Cortana,它们都严重依赖机器学习来增强其语音识别和理解自然语言的能力。除了这些明显的表现之外,机器学习几乎在每个行业都有用武之地。如无人驾驶汽车、无人机和送货机器人的计算机视觉,聊天机器人和服务机器人的语言识别和合成;安全系统或无人超市的人脸识别;合理准确的转录和商务会议语音翻译,帮助放射科医师从X光片中发现肿瘤,帮助研究人员发现疾病相关基因序列,识别药物中更有效的药物分子;通过分析物联网传感器数据等对基础设施进行预测性维护。那么,什么是机器学习?机器学习是教计算机系统如何在输入数据时做出准确预测的过程。这些预测可能会回答“照片中的水果是香蕉还是苹果”,发现有人在自动驾驶汽车前面过马路,确定一封电子邮件是否是垃圾邮件,通过语音合成在抖音上自动生成字幕,等等。机器学习是基于现有数据、知识或经验自动识别有意义的模式。在最基本的情况下,机器学习使用算法来解析数据并从中学习,然后在类似情况下做出决策或预测。机器学习模型已经学会了如何通过对大量数据进行训练来可靠地区分水果。在这种情况下,可能会有大量标记为包含香蕉或苹果的图像数据,用于训练模型。在机器学习的过程中,机器学习系统如何对未知环境做出决策或预测,没有人为指导。这个过程是通过机器学习中的算法从数据中学习到的。决策的主体是机器学习算法,决策或预测是非确定性的结果,一般以概率的形式输出,比如80%的概率是晴天。机器学习与传统计算机软件的主要区别在于,人类开发人员尚未编写代码来指示系统如何区分香蕉和苹果。不同的是,传统的应用程序需要软件工程师逐句编写代码(特定的指令集),指示程序或软件执行某些行为,例如输出0和1分别表示注册成功和失败。决策的主体其实是人,程序只是执行动作的工具。因此,机器学习可以归类为间接编程,而不是传统编程。人工智能和机器学习有什么区别?机器学习最近取得了巨大的成功,但这只是实现人工智能的一种方式。在1950年代成立之初,人工智能被定义为能够执行通常需要人类智能才能完成的任务的任何机器。人工智能系统通常表现出这些特征:计划、学习、推理、解决问题、知识表示、感知、运动和操纵,以及在较小程度上的社会智能和创造力。除了机器学习之外,还有多种其他方法可用于构建人工智能系统,包括进化计算和专家系统。在进化计算中,算法经历随机变异和世代组合,试图“进化”成最优解;在专家系统中,计算机模仿人类专家在特定领域的行为,例如自动驾驶系统模仿人类驾驶飞机的飞行。现在我们可以看到机器学习系统在我们周围得到了广泛的应用,今天它们是现代互联网的基石。更令人震惊的是,在2020年,OpenAI的GPT-3因其能够像人类一样写作而成为头条新闻,几乎涵盖了任何可以想象的话题。GPT-3是一种神经网络,接受了开放网络上数十亿篇英文文章的训练,可以根据文本提示生成文章。在企业服务领域,AI落地的热点领域随处可见,例如:用于生产设备的故障预测,制定维修周期/计划,实现7x24全天候运行的目标;用于银行业和保险业的贷款和保单。自动核保与决策人工智能,及早发现与预测反欺诈;人工智能辅助医疗诊断,尤其是图形图像的模式识别;预防安全漏洞和入侵检测,以及数据中心硬件、软件和环境维护;消费者消费行为和模式预测、营销和销售策略决策等。2为什么机器学习如此成功?机器学习已经成为应用最广泛的人工智能技术。据Gartner称,大约37%的组织在其业务中使用某种类型的机器学习技术,预计到2022年,80%的现代技术将基于机器学习和人工智能技术。德勤发布的《全球人工智能发展白皮书》指出,在人工智能的众多分支中,机器学习是人工智能的核心研究领域之一。其中89%的人工智能专利申请和40%的人工智能范围内的相关专利都属于机器学习的范畴。尽管机器学习不是一项新技术,但近年来对该领域的兴趣呈爆炸式增长。为什么机器学习如此成功?有两个主要因素使这些成功成为可能:一个是可用于训练机器学习系统的大量图像、语音、视频和文本数据的可用性。更重要的是,由于现代图形处理单元(GPU)的出现,它们可以聚集在一起形成机器学习引擎,具有大规模并行处理能力。如今,任何能连接互联网的人都可以通过亚马逊、谷歌和微软以及阿里云和腾讯云等公司提供的云服务,使用计算集群来训练机器学习模型。随着机器学习的使用越来越广泛,许多半导体或云服务公司正在创建专门的硬件来运行和训练机器学习模型。谷歌的TensorProcessingUnit(TPU)不仅用于训练GoogleDeepMind和GoogleBrain的模型,还支持GoogleTranslate和GooglePhoto中的图像识别模型,并允许公众使用Google的TensorFlowResearchCloud建立机器学习模型服务。谷歌表示,到2020年,其第四代TPU在MLPerf中的速度将是上一代TPU的2.7倍,MLPerf是衡量系统使用经过训练的ML模型执行推理的速度的基准。2019年,阿里巴巴发布了首款为人工智能(AI)流程提供动力的芯片,称为含光800。当年,华为还宣布其人工智能芯片“升腾910”瞄准数据中心,可与高通(Qualcomm)、英伟达(Nvidia)等美国科技公司竞争。腾讯与中信、中金资本和春华资本等投资者一起,向总部位于上海的烽火科技投资了18亿元人民币。EnflameTechnology制造可处理大量数据以训练人工智能系统的芯片。随着硬件的日益专业化和机器学习软件框架的不断完善,机器学习任务越来越多地在智能手机和计算机上执行,而不是在云数据中心。那么在企业服务方面,机器学习应用的几大发展趋势值得关注。由IT管理的ML项目比例降低。TechRepublicPremium调查结果显示,23%的受访者拥有由IT和终端业务共同管理的AI/ML项目,19%的受访者拥有由IT管理的项目,19%的受访者拥有由数据科学部门管理的AI/ML项目,即11%.这低于2019年由IT管理的AI/ML项目的33%。为确保AL/ML项目成功而采用的三大战略是与管理层合作,以更好地确定AI/ML的业务用例(52%)、准备/培训IT员工(48%),以及投资数据准备、计算和自动化流程(46%)。对AI/ML项目实施的担忧也发生了变化。2020年,最大的担忧是未收到证明投资合理的业务成果(48%)、劳动力准备情况/难以找到AI/ML人才(38%)以及实施时间过长(37%)。ML更适用于商业。据调查受访者称,47%的人将AI/ML应用于业务运营,30%的人将其应用于营销/销售,27%的人将技术应用于工程和IT。3机器学习成为云服务新的增长点。事实上,机器学习的快速崛起很大程度上得益于云计算的普及。计算需求。目前,超过100,000家客户在使用AWS的机器学习服务,许多客户已经将机器学习用于其核心业务。从2016年开始,AWS开始在云端提供机器学习服务。经过近几年的不断创新,AWS在机器学习领域构建了一套“全家福”工具集,真正让客户“开箱即用”。在工具集的底层,AWS提供了强大的计算能力、全面的计算能力选项和丰富的机器学习框架选择。作为工具集的中间层,AWS的AmazonSageMaker可以提供第一个完全托管的机器学习集成开发环境,最大限度地提高用户在机器学习中的效率,降低机器学习的门槛。在工具集顶层,AWS提供预训练模型,涵盖视觉、语音、对话、文本、业务工具、客服中心、搜索、代码+运维、工业AI等。腾讯提供的TIMachineLearningCloud是一站式的机器学习生态服务平台,可以将各种数据源、组件、算法、模型和评估模块进行组合,使算法工程师和数据科学家能够方便地进行模型训练、评估和预测。智能钛系列产品支持公有云接入、私有化部署、专有云部署。其中,智能钛机器学习平台TI-ONE是面向AI工程师的一站式机器学习服务平台,为用户提供从数据预处理、模型构建、模型训练、模型评估到模型服务的全流程开发支持。智钛机器学习平台内置丰富的算法组件,支持多种算法框架,满足多种AI应用场景需求。自动化建模(AutoML)支持和拖放式任务流程设计使AI初学者可以轻松上手。智能钛弹性模型服务TI-EMS是一个具有虚拟化异构计算能力和弹性伸缩能力的在线推理平台,可以帮助客户解决模型部署复杂、资源浪费、人工扩展资源效率低等问题。智能钛工业AI平台TI-Insight是基于智能钛基础功能的一站式工业AI平台解决方案,包括两个功能组件:AI训练系统和AI推理系统。IDC发布的《中国 AI 云服务市场(2020 上半年)跟踪》报告显示,华为云一站式AI开发平台ModelArts在中国机器学习公有云服务市场份额排名第一,高达29%。华为云一站式AI开发平台ModelArts在行业用户中的活跃提及率非常高。4机器学习成为企业数字化转型的重要方向据IDC数据显示,目前40%的企业数字化转型项目都会采用人工智能技术,而目前最主要的是机器学习技术。在这个时代,人工智能与各行各业的融合已经成为一大发展趋势。可以说,人工智能迎来了技术落地的最佳时期。可以说,善于利用人工智能技术应用的企业将迎来新一轮的发展红利。越来越多的行业用户将利用组织内部的人才、数据等资源,根据业务需求将人工智能嵌入到业务流程或用户界面中,为客户带来超个性化的体验。一方面,企业数据量的增长快于预期。专家报告说,世界上90%的数据是在过去两年内生成的。社交媒体和流媒体内容、智能家居和可穿戴设备、数码照片和视频、商业信息和在线购物等应用程序大量生产的数据将产生比过去30年更多的数据。IDC数据显示,从2010年到2020年,全球产生的数据量增长率接近5000%,过去所谓的“大数据”正在被重新定义。另一方面,拥有所有这些数据并不意味着用户会自动获得知识。捕获正确的数据、使用复杂的分析平台并使用数据创造价值是机器学习开发的基础。IDC认为,超大规模计算、5G通信、工业物联网(IIoT)、人工智能/机器学习(AI/ML)等颠覆性技术为更好地激活数据价值提供了工具。云计算为广大企业应用人工智能和机器学习扫清了障碍,从而推动企业数字化转型。目前,最有能力拥抱数字化转型的行业是那些数字优先的行业,如互联网公司、电信公司等。那些以数据驱动决策为核心的传统公司,如医药公司、金融公司、航空公司和制造企业正在使用机器学习等人工智能技术实现数字化转型,并创造新的、更具竞争力的优势。看来,在数字化转型方面,AI技术不会缺席,并可能驱动数字化升级。
