当前位置: 首页 > 科技观察

谷歌大脑:重建谷歌帝国的人工大脑

时间:2023-03-22 11:19:31 科技观察

这是互联网上最无聊的工作之一。一群谷歌员工日复一日地盯着电脑屏幕,查看街景图片,不断地问自己:“我看到的是地址吗?”然后点击Yes,点击Yes,点击No。这是谷歌构建其地图服务工作中极其关键的部分。了解建筑物的确切地址对于制图师来说非常有用。但这并没有让可怜的谷歌人的生活变得更好,他们必须弄清楚谷歌街景汽车捕捉到的一串数字是电话号码、涂鸦还是合法地址。几个月前,他们的困境烟消云散,因为谷歌工程师训练了公司的计算机来处理这项吃力不讨好的任务。过去,计算机一直在为如此先进的图像识别而苦苦挣扎,谷歌终于用他们最先进的人工智能系统“谷歌大脑”解决了这个问题,谷歌现在可以在一个小时内完成。转录法国街景中的所有地址。“谷歌实际上不是一家搜索公司,而是一家机器学习公司。”自三年前公司神秘的XLabs诞生以来,GoogleBrain项目就一直在公司内部活跃,使得其软件工程师Teams派上用场,应用最新的机器学习算法来解决越来越多的问题。在许多方面,该项目可以让谷歌在未来十年内在其他领域领先一步,就像谷歌的搜索算法和数据中心专业知识在过去十年帮助其建立了非常成功的广告业务一样。.“谷歌实际上不是一家搜索公司,它是一家机器学习公司,”图像搜索初创公司Clarifai的首席执行官马修泽勒说,他曾两次在谷歌大脑实习。他说,谷歌的几个最重要的项目,如自动驾驶汽车、广告和谷歌地图,一直受益于此类研究。“机器学习实际上推动了公司的一切。”不仅谷歌地图,Android的语音识别软件和Google+图像搜索也受益于谷歌大脑。但根据该项目背后的主要思想家之一杰夫·迪恩(JeffDean)的说法,这仅仅是个开始。他认为GoogleBrain项目有助于公司的搜索算法并提高GoogleTranslate的性能。“谷歌现在有30或40个团体使用我们的基础设施,”迪恩说。“一些团队正在将它用于生产,其他团队正在探索它并将其与现有系统进行比较,总的来说,它适用于许多类型的问题。”该项目的负责人向说,这是向一种叫做“深度学习”的新型人工智能转变的一部分。Facebook也在做类似的工作,微软和IBM等其他公司也在做类似的工作。但谷歌似乎在技术上更先进——至少目前是这样。人工智能即服务2011年,谷歌大脑项目启动。这只是一个内部代号,不是官方名称。当时,斯坦福大学吴恩达教授带着“探月”之意加入了GoogleX实验室团队,开展深度学习。实验。一年后,谷歌将Android语音识别错误率降低了惊人的25%。不久之后,谷歌开始尽可能多地招聘深度学习专家。去年,谷歌请来了世界顶级深度学习专家之一杰夫·辛顿(GeoffHinton)。然后在1月份,它斥资4亿美元收购了神秘的深度学习公司DeepMind。使用深度学习技术,计算机科学家构建了在一定程度上模仿人脑学习模型的软件模型。然后可以对这些模型进行大量新数据的训练、微调,并最终应用于全新的任务。例如,GoogleImageSearch构建了一个图像识别模型,也帮助GoogleMaps团队解决问题。为谷歌搜索引擎构建的文本分析模型也可以被谷歌+使用。GoogleBrain可以理解的街景图像示例。谷歌在公司的内部网上建立了几个人工智能模型,迪恩和他的团队编写了后端软件,使谷歌的服务器场能够处理数据并将结果显示在开发人员可以看到的软件界面上。AI代码的效果如何。“它看起来像核反应堆的控制面板,”迪恩说。而一些项目,例如Android语音识别,需要JeffDean的团队做出一些重大改变,以使机器学习模型适应手头的任务。但也许有一半使用GoogleBrain软件的团队只是简单地下载源代码,微调配置文件,然后将数据输入GoogleBrain。“如果你想在这个领域做前沿研究,超越现有技术,为新问题建立合适的模型,你必须接受多年的机器学习培训,”Dean说。但是如果你只是想应用这种技术,并且你正在处理的问题与深度模型已经解决的问题有些相似,那么人们已经使用它取得了巨大的成功,你不需要成为深度学习专家.“像新版本的MapReduce这样的内部代码共享也对谷歌的另一项领先技术MapReduce产生了重大影响。Dean在十年前编写了MapReduce,使其成为利用谷歌数万台服务器的可行解决方案。”并训练他们解决单个问题,例如为万维网编制索引。MapReduce的代码最终在内部公开,Google敏捷的工程师想出了如何训练它来解决新的大数据计算问题MapReduce背后的思想最终被写进了开源项目Hadoop的代码,让世界有了超强的数据处理能力曾经是谷歌独有的技术。随着谷歌宏伟的人工智能项目的细节不断流出,GoogleBrain可能最终也会做一个开源项目。今年1月,谷歌发表了一篇关于谷歌地图的论文,鉴于谷歌在分享其研究方面的记录,很可能还会发表更多论文。考虑到深度学习算法要解决的问题范围非常广泛,谷歌需要用Dean和他的团队的代码做很多工作。他们发现使用的数据越多,这些模型就越准确。那可能是谷歌的下一个大目标:建立十亿个数据点级别的AI模型,而不是最好的。正如Dean所说:“我们正在努力将可扩展性提升到一个新的水平,我们可以训练准确的、真正的大数据模型。》原文链接:ROBERTMCMILLAN翻译:伯乐在线-toolate翻译链接:http://blog.jobbole.com/73825/