了解机器学习,只需要了解“三大法宝”。急速加速的时代。但是创造一个完全有知觉的生物——其电子“大脑”可以使用公正的道德判断完全参与复杂的认知任务——目前超出了我们的能力。 不幸的是,当前的发展导致人们普遍担心人工智能的未来可能会变成什么样。它最近在流行文化中的表现表明我们对这项技术是多么谨慎和悲观。恐惧的问题在于它会产生严重的后果,有时还会助长无知。 理解人工智能的内部运作是消除这些担忧的良药。而且,这种严肃性可以导致负责任和令人放心的参与。 人工智能的核心是机器学习,这是一种优雅且广泛使用的工具。但要了解机器学习的含义,我们首先需要检查其潜力如何绝对超过其缺点。 数据是关键 简单来说,机器学习就是指教计算机如何通过算法分析数据来解决特定的任务。例如,对于手写识别,可以使用分类算法来区分不同人写的字母。另一方面,住房数据集利用回归算法来量化房产的售价。 好吧,机器学习最终归结为数据。几乎每个企业都以这样或那样的方式生成数据:想想市场研究、社交媒体、学校调查和自动化系统。机器学习应用程序试图在大数据集的混乱中找到隐藏的模式和相关性,以开发可以预测行为的模型。 数据有两个关键元素——样本和特征。前者代表群体中的个体元素;后者代表了它们的共同特征。 以社交媒体为例:用户是样本,他们的使用可以转化为特征。例如,Facebook使用“喜欢”活动的不同方面(因用户而异)作为定向广告的重要特征。 Facebook好友也可以作为样本,他们与他人的联系也可以作为特征,构建一个可以研究信息传播的网络。 我的Facebook好友网络:每个节点都是一个朋友,可能会或可能不会连接到其他朋友。节点越大,连接越多。相似的颜色也代表相似的社交圈。 除了社交媒体之外,在工业过程中用作监控工具的自动化系统对整个过程的时间快照进行采样,其特征是在特定时间进行的传感器测量。这使系统能够实时检测过程中的异常情况。 所有这些不同的解决方案都依赖于为机器提供数据,并教它们根据获得战略评估的信息做出自己的预测。这就是机器学习。 以人类智能为起点 任何数据都可以转化为这些简单的概念,任何机器学习应用程序(包括人工智能)都可以基于这些概念构建。 一旦理解了数据,就该决定如何处理这些信息了。机器学习最常见和最直观的应用之一是分类。系统学习了如何根据参考数据集将数据放入不同的组。 这与我们每天所做的各种决定有直接关系,无论是将相似的产品分组(例如美容产品的厨房用品),还是根据过去的经验选择一部好电影。虽然这两个示例看起来完全脱节,但它们依赖于一个基本的分类假设:定义为已识别类别的预测。 举个例子,当我们拿起一瓶润肤露时,我们使用特定的特征列表(例如容器的形状,或者产品的气味)来准确预测它是美容产品。类似的策略是通过评估一组特征(例如导演或演员)来预测电影是否属于以下两个类别之一:好或坏。 通过掌握与一组样本相关的各种特征之间的不同关系,我们可以预测一部电影是否值得观看,或者更好的是,我们可以创建一个程序来为我们做这件事。 但要掌握这些信息,我们需要成为一名数据科学专家,精通数学和统计学,并拥有足够让艾伦图灵和玛格丽特汉密尔顿感到自豪的编程技能,对吧?不完全的。 我们在日常生活中对母语的了解已经足够了,即使我们中只有少数人涉足语言学和文学。数学也一直伴随着我们,所以从购物或测量配料到遵循食谱的转变并不是一种负担。同样,掌握机器学习并不是有意识和有效地使用它的必要条件。 是的,世界上确实有非常优秀和专业的数据科学家,但是,任何人都可以毫不费力地学习数据的基础知识并改进他们观察和利用信息的方式。 解决问题的算法 回到分类算法,让我们考虑一种模仿我们决策方式的算法。我们是社会人,那么社会互动呢?***印象很重要,我们都有一种内在模式,会在见到某人的最初几分钟内评估我们是否喜欢某人。 有两种可能的结果:好印象或坏印象。对于每个人,根据过去的几次遭遇(样本)考虑(甚至是无意识地)不同的属性(特征)。它可以是语调或外表,或礼貌程度等。 对于我们遇到的每张新面孔,我们头脑中的模型都会接受这些输入并做出预测。我们可以将这个模型分解为一组输入,根据它们与最终结果的相关性进行加权。 对某些人来说,吸引力可能非常重要,而对其他人来说,幽默感或对狗的喜爱更能说明问题。每个人都会开发自己的模型,这完全取决于她的经验或数据。 不同的数据导致不同的模型被训练得到不同的结果。我们的大脑发展出机制(尽管我们并不完全理解这一点)来确定这些因素将如何影响我们对因素的权重。 机器学习所做的是为机器开发精确的数学方法来计算结果,尤其是在我们无法轻易处理的数据量的情况下。现在,数据比以往任何时候都更加庞大和持久。拥有一个可以主动利用这些数据来解决实际问题的工具,比如人工智能,意味着每个人都应该也可以探索和利用这个。我们这样做不仅是为了创建有用的应用程序,也是为了让机器学习和人工智能处于更光明、更轻松的境地。 现在机器学习的资源很多,但是这些资源确实需要一定的编程技巧。许多适合机器学习的流行语言都提供基础教程到完整课程。只需一个下午即可开始您的冒险之旅,并取得明显成果。 所有这些并不是说我们不应该担心具有人类思维的机器的概念。但是更多地了解这些想法将如何发挥作用将使我们能够成为积极变革的推动者,这样我们就可以保持对人工智能的控制,而不是相反。 (来源/Dataconomy翻译/机小易校对/文玮)
