当前位置: 首页 > 科技观察

2017机器学习发展十大趋势预测,悲观还是现实?

时间:2023-03-20 19:20:09 科技观察

分析时代仍处于起步阶段,它拥有许多令人兴奋的想法和值得期待的承诺。在今天的文章中,BigML副总裁AtakanCetinsoy将披露2017年他眼中的机器学习技术及相关生态系统的发展趋势。每年年底,技术人员总是展望新的十二个月,思考如何他们所知道的技术解决方案将迎来下一阶段的变革。在BigML,我们结合2016年机器学习技术的发展与演进,在新的一年尝试分析其未来前景。首先需要强调的是,企业需要摒弃围绕机器学习概念的炒作,探索将其真正引入自身业务系统的有效途径。更具体地说,企业需要通过根据内部环境在选择平台方面做出严格的决策,并逐步构建小型且易于实施的机器学习项目,来尝试利用自己的数据集。随着时间的推移,此类增量项目将带来积极的反馈并最终实现决策自动化,甚至可以帮助敏捷机器学习团队彻底改变其行业的运营状态。和往常一样,我们首先在实际应用层面回顾机器学习技术的发展:机器学习已经形成了不可逆转的历史趋势,我们需要立足于此来考虑如何进行跨部门的日常事务,以及如何整合自己的业务与市场整体经济状况相结合。在其36年的历史中,公司一直在努力消化、采用机器学习技术和相关最佳实践的进步并从中受益。然而,很少有公司能够真正将其转化为自己的业务优势。涌现出一大批所谓的“新兴专家”。他们只读了几本相关书籍或上了几门在线课程,就已经开始借助廉价资本“改变”世界。与此同时,不少顶尖科技公司都在尽可能“招聘”真正懂机器学习技能的人才,希望为蓬勃发展的人工智能经济储备能量。此外,相当一部分诞生于机器学习领域的初创企业怀着“独角兽”的野心踏上了征程,但必须承认,他们认为自己可以利用通用、低成本和可扩展的优势通过神奇的新机器学习算法实现的解决方案。解决方案往往只是一厢情愿。2017年,在经历了一系列可以避免的挫折之后,我们预计机器学习生态系统最终会开始朝着正确的方向发展。在我们开始讨论具体预测之前,需要强调的是,2016年是极其重要的一年,因为在这一年,全球市值最高的五家公司都以科技公司为代表,时间空前。这五家公司都有几个共同特征,包括大规模的网络效应、以数据为中心的企业文化,以及基于尖端分析模型的新型增值服务经济思维。更重要的是,这些公司一直在宣传自己的想法和意图,将机器学习作为未来进化的重要支点。随着Uber、Airbnb等独角兽的加入,科技行业在世界经济中的主导地位很可能在未来几年延续,这也将受到世界经济大规模数字化转型浪潮的强力推动.然而,这又提出了一个可能决定万亿美元走向的新问题:传统企业(如拥有大量数据的非科技企业和从大企业部分解散转制的小型科技企业)如何适应并成为什么?这个新兴价值链的组成部分?他们如何在新时代生存和发展?就目前而言,相当多的公司坚持以死板和经验指导的思想来理解商业智能系统,并继续使用基于旧工作站类遗留的简单回归模型来统计系统性能,这意味着它无法捕捉到现实生活中反映的特定趋势,更不用说准确预测用例的复杂性了。与此同时,这些企业面临着大量专有数据没有得到充分利用的困境。根据麦肯锡全球研究所发布的《分析时代:数据驱动型世界下的竞争》报告,2011年报告中提到的现代分析技术,目前只有不到30%实现,这还不算过去出现的各种新技术解决方案5年。更糟糕的是,行业间数据技术发展严重不平衡(以美国为中心,医疗保健行业数字技术采用率低至10%,而智能手机领域高达为60%),这意味着分析能力和竞争水平出现了前所未有的分化。虽然实际情况还没有达到各大供应商和研究公司大力推广的程度(比如‘认知计算’、‘机器智能’甚至‘智能机器’等炒作概念),但机器学习已经真正成为了商业词汇。为众多企业带来了广泛而可观的潜在发展空间。这个巨大的机遇意味着更多的传统和初创企业将在2017年开启机器学习探索之旅,聪明的企业将努力从失败中吸取教训,利用新技术成果扩大竞争优势。然而,考虑到人类在面对新兴事物时始终表现出的愚蠢和保守态度,我们将以较为悲观的态度来探讨以下十大发展趋势:预测一:机器学习将成为实现“大数据”的重要途径大数据运动的教训将会重演,技术人员将意识到只有结合实用的“大数据”解决方案才能实现他们既定的目标。一般来说,“大数据”代表可以预测未来的数据,就这么简单。Gartner最近从其HypeCycle报告中删除了“大数据”一词,这意味着它已正式进入实施阶段。所有这一切都将高度强调分析能力的重要性,尤其是机器学习在引导客户利用涉及数据技术相关项目的智能应用方面所发挥的作用。此外,过去饱受诟病的样本分析解决方案将成为帮助企业在此类应用场景中探索新的预测用例的重要工具。预测二:风险投资公司仍将积极为基于算法的初创企业提供资金风险投资公司将继续处于摸索和学习的状态,整个学习过程将是缓慢而艰难的。风险投资公司将继续资助具有学术影响力的算法初创企业,无论他们做出误导性甚至是幻想的陈述。例如,将机器学习作为深度学习的同义词,完全忽略了机器学习算法和机器学习模型之间的巨大差异,以及模型训练和训练模型的预测结果。对相关学科的深入理解会作为历史遗留问题而存在,整个投资行业还没有足够重视。不过,值得肯定的是,少数风投公司已经开始意识到机器学习的发展将带来的巨大发展平台。预测三:机器学习人才仍将是炙手可热的稀缺资源。媒体对人工智能和机器学习技术的宣传和渲染,将使相关技术人才不断成为市场宠儿,相关投资也将集中在年轻学者手中。然而,残酷的现实告诉我们,大部分算法的适用范围并不广泛,有相当一部分只是在原有基础上做了一点改进。其直接结果是,大多数机器学习算法将被视为纯粹的噱头和疯狂招聘技术人才的借口。在一些最糟糕的情况下,买家甚至对分析技术的发展没有清晰的愿景,而只是像任何时代潮流一样专注于人工智能/机器学习技术。预测四:大部分机器学习相关的项目只停留在PPT展示阶段,无法带来理想的结果。传统企业的高层会积极聘请咨询公司帮助他们建立自上而下的分析策略和/或制定复杂的策略,但他们对洞察力的可行性和投资回报的确切水平没有正确的认识。这部分是因为今天并不难获得正确的数据结构和灵活的计算基础设施来实现数据分析技术,并且经过36年的不断积累,机器学习在廉价的支持下不再遥不可及。计算资源。实验室产品。预测五:深度学习在商业领域的成功案例将很少然而,以语音识别和图像识别为代表的实际应用解决方案才是真正的发展动力,将有助于这项技术在企业环境下的机器学习场景中发挥实际作用。解释难度大、高水平技术专家稀缺、对大规模训练数据集的高度依赖、极高的计算资源配置要求,将制约2017年深度学习的发展。就目前的情况来看,机器学习技术有点类似于马球。它可以为你带来与富豪名流交往的机会,也可以让你的生意瞬间爆红,但随之而来的还有昂贵的骑行服务、维修费用、设备采购、昂贵的俱乐部会费。因此,与缺乏重大研究突破和独特优势的深度学习相比,企业通常可以通过专注于增强学习和机器学习技术来获得更快、更真实的结果。预测六:基于不确定性的原因和有计划的探索将把机器学习推向新的高度机器学习本身只是人工智能的一小部分。相当多的初创公司已经开始提供基于相关原因的研究应用和基于不确定性的规划探索工作,而这实际上会帮助我们找到超越模型认知的新的技术扩展空间。Facebook的马克·扎克伯格(MarkZuckerberg)在经过一年的AI/机器学习研究后,推出了自己的私人智能助理“贾维斯”——其基本特征与电影《钢铁侠》中虚构的智能管家大致相似。预测7:虽然机器学习的部署不断扩大,但人类仍将在决策中发挥核心作用一些公司最初会部署速度更快、基于证据的决策机器学习解决方案,但人类仍将参与决策发挥核心作用。智能应用的早期落伍将集中在特定行业,但差异化的监管框架和严格不平衡的分析能力的存在将催生经济层面的创新管理方式、竞争压力、复杂的客户需求、优质的体验等.一些价值链因素导致指南相互矛盾。尽管关于机器学习甚至人工智能改变未来的讨论很多,但冷静的技术领导者非常清楚,真正的智能系统真正出现还需要很长时间。与此同时,公司将慢慢学会相信他们的模型和预测,并意识到这样的解决方案确实可以在各种任务领域提供超人的表现。预测八:敏捷机器学习将悄然成为AI营销的主力军更现实、更敏捷的机器学习采用方法将悄然主宰新的一年。实施团队乐于亲身体验并利用丰富的企业数据储备,同时也能够完全绕过与“大数据”相关的炒作。他们更务实,希望通过成熟的算法和小规模的抽样数据,用最具针对性和适用性的预测手段来解决问题。在这个过程中,他们会逐渐对自己的分析能力建立信心,在实际产品中部署相关解决方案,同时增加更多可行的用例。由于他们不再受制于数据访问问题和部署工具的复杂性,他们可以真正使用数据技术来改善他们的核心业务,同时积极尝试具有更高风险和回报的实验方法,将预测用例视为品牌的新来源收入。实现方式。预测9:MLaaS平台将成为传统企业机器学习采用工作的“AI骨干”MLaaS平台将成为加速敏捷机器学习实践领域的“AI骨干”。基于此,新一波基于MLaaS基础设施的应用将进一步降低商业机器学习解决方案的实施成本,尤其是通过以下方式“民主化”机器学习:通过消除供应商合同的复杂性显着降低成本,因为固定或前期投资。提供预配置框架,包含大量高效算法。以抽象的方式帮助终端用户摆脱基础设施设置和管理带来的复杂因素。通过RESTAPI和捆绑包提供简单的集成、工作流自动化和部署选项。预测10:无论是否有足够的数据科学家,开发人员都将继续向其企业引入更多机器学习元素。新的一年,开发者将积极投入机器学习阵营——企业是否已经拥有足够的数据科学家和其他相关人才。开发者将基于MLaaS平台快速构建和扩展此类应用,并以此抽象和剥离难以处理的细节(如集群配置和管理、任务队列、监控和分发等)。“即服务”解决方案的流行将允许开发人员仅通过精心设计和文档齐全的API来实现机器学习技术应用程序,而无需了解LR(1)解析器来编译和执行他们的Java代码,或者掌握基于决策树的预测用例的信息增益或威尔逊评级机制。我们仍处于“分析时代”的早期阶段,因此是时候为光明的未来感到兴奋,而不是被过去的小挫折所淹没。虽然我们在这篇文章中做了相当多的相当悲观的预测,但这纯粹是为了帮助兴奋的朋友们冷静下来,认识到商业成功、数学奥秘、软件和管理最佳实践以及数据科学之间仍有待弥合的鸿沟。实现能力。总之,祝大家2017年好运!