福布斯最近写了一篇文章,介绍了Facebook使用深度学习技术全面了解用户的四种惊人方式。它们是文本分析、人脸识别、定向广告和设计AI应用程序。近年来,媒体对机器学习、深度学习等人工智能技术进行了大量的基础介绍。开展相关研究的企业不在少数,那么企业具体是如何应用的呢?Facebook通过了解其用户并为广告商“打包”该数据来开展业务。它从经营业务中赚取的资金将重新投资于为用户提供有用的新功能,目前主要是视频和购物功能。然后,它还使用这些功能服务来了解有关用户的更多信息。随着社交网络带给人们的交流和对话的方式被证明对我们很有价值,它成为了一块能够吸纳海量用户数据的磁石。这些数据是关于用户是谁、他们如何度过时间、他们喜欢什么等等。对于从事数据挖掘工作的Facebook数据科学家来说,挑战在于大部分数据非常分散且非结构化。尽管Facebook平台上的12亿用户每分钟上传136,000张照片并更新293,000个状态,但直到最近,Facebook还只能希望从其少量的非结构化数据(不易量化和包含)中学习。价值是从计算机使用图表分析的信息中挖掘出来的。深度学习正在帮助解决这个问题。深度学习技术允许机器自行对数据进行分类。一个简单的例子是深度学习图像分析工具,它学习识别包含猫的图像而无需被告知猫长什么样。通过分析大量的图像,它可以从图像的背景中学习信息——比如猫图片中还可能出现什么?哪些文本或元数据可能表明该图像包含猫?它通过使非结构化数据可量化并以有助于分析工具洞察的形式呈现数据来帮助构建非结构化数据。Facebook的研究人员试图回答这样的问题:该公司的产品多久出现一次猫的图像?我们应该专注于向喜欢猫的人展示我们的广告吗?这个基本原理解释了为什么深度学习适用于Facebook,并且随着深度学习算法变得更加先进,它们可以应用于我们共享的更多数据,从文本到图像再到视频。这里有几个具体的用例,解释了深度学习如何用于获取价值,帮助Facebook为用户提供更多便利,从而能够进一步了解他们的目标。1.文本分析Facebook上分享的数据很大一部分仍然是文本。视频可能涉及更多数据,但在获取见解方面,文本仍然同样有价值。一张图片可能包含1000个字,但如果你只是想回答一个简单的问题,通常不需要回答1000个字。任何无助于回答您的问题的数据都是噪音,并且会浪费用于存储和分析的资源。Facebook使用其内部开发的名为DeepText的工具来学习分析用户帖子的上下文以提取单词的含义。通过分析单词之间的关系,神经网络能够根据这些单词周围的单词理解含义的变化。由于这是一种半监督和半无监督的学习,那些算法不一定有解释每个单词含义的参考数据,比如字典。相反,DeepText根据单词的使用方式自学。这意味着DeepText不会被拼写更改、俚语或特殊的语言用法所困扰。事实上,Facebook称这项技术是“支持语言的”——由于它标记单词的方式,它可以轻松地在语言之间切换,将从一种语言中学到的知识应用到另一种语言中。另一种语言。目前,该工具被用于根据人们的谈话内容将他们指向他们可能想要购买的产品。Facebook发布了一段视频,解释了DeepText如何根据上下文决定是否向用户提供购物链接。2.面部识别Facebook正在使用名为DeepFace的深度学习应用程序来教它识别照片中的人物。该公司表示,其先进的图像识别工具比人类更准确地识别两张不同照片中的人是否是同一个人——DeepFace的成功率为97%,而人类的成功率为96%。这种技术的使用显然是有争议的。隐私倡导者表示,该工具走得太远了,允许Facebook根据人群的高分辨率照片标记数十张面孔,这对我们在公共场所匿名行走的自由构成明显威胁。欧盟监管机构同意,并在2013年说服Facebook从欧洲公民的账户中删除该功能。当时,这家社交媒体巨头使用的是未使用深度学习的面部识别工具的早期版本。自该技术首次获得广泛关注以来,Facebook一直对其进展保持沉默。也许它正在等待一些隐私案件得到决定,并希望等到那时再宣布其发布计划。3.定向广告Facebook使用深度神经网络(深度学习的基石)来决定向哪些用户展示哪些广告。这一直是其业务的基础,让机器自己尽可能多地了解我们,在投放广告时以最有洞察力的方式将我们聚集在一起,该公司希望继续关注谷歌等其他竞争者.高科技竞争对手在市场上的竞争优势。4.设计人工智能应用Facebook甚至决定,确定那些可以通过人工智能和深度学习改进的操作的任务可以由机器来处理。它实施了一个名为Flow的系统,该系统使用深度学习分析每月对300,000个机器学习模型运行模拟,使工程师能够测试他们的想法并找出提高运营效率的机会。开源Facebook非常支持开源,其名为Facebook人工智能研究(FAIR)的AI实验室的大部分研究成果都可以免费提供给任何人使用或修改。Facebook的深度学习技术主要基于Torch平台,专注于深度学习技术和社交网络的发展。该公司甚至开源其GPU驱动的AI硬件设计。这台超快的计算机针对深度学习任务进行了优化,这些任务往往需要大量的处理能力,因为它们涉及大量计算和高速处理输入数据。展望未来深度学习很可能会继续在Facebook的未来发展中发挥重要作用。虽然它一直对潜在的新应用守口如瓶,但它提出的想法包括自动生成图片的语音描述以帮助视障人士,以及预测哪些地方需要更大的覆盖范围以推动全球连接。的职责。从长远来看,他们强大的AI和深度学习实验室很可能并且将使无数组织受益,无论是通过直接使用他们的服务还是通过他们对开源的支持间接。
