最初是为了支持谷歌系统的可扩展性而设计的,而现在TensorFlow已经面向每一位用户开放。作为谷歌专门为应用智能而创建的开源机器学习项目,大家可以轻松选择TensorFlow,它还会根据各种头条预测用户行为和偏好。不过,除此之外,该项目还有一个更加雄心勃勃的目标,即随着数据规模的不断增长,成为不断壮大的开源机器学习系统生态系统中不可或缺的一部分。以下是TensorFlow值得技术从业者关注的四个重要原因。1.将成为谷歌内部机器学习系统的下一代解决方案。根据GoogleCEOSundarPichai的博客文章,TensforFlow的目的与Google发布的许多其他开源解决方案的目的相同:解决Google内部的机器学习问题。面对大规模数据时遇到的实际问题的解决方案。在另一篇博文中,Google研究员JeffDean(参与过BigTable和MapReduce项目)提到了Google早期深度学习系统DistBelief的很多细节,包括它在运行过程中面临的诸多限制。除了与谷歌的内部基础设施联系过于紧密之外,它还专门设计用于处理神经网络侮辱。Dean在YouTube视频中进一步解释了这一点,包括DistBelief非常适合生产中的可扩展性和培训,但他也提到它不够灵活,无法用于研究工作。相比之下,TesorFlow可以与任何基于梯度的机器学习算法协同工作,应用范围更广。TensorFlow是为了速度而用C++编写的,不需要开发人员对底层硬件有任何了解。它可以同时运行在多种设备和架构上,因此其适应平台从手机等片上系统设备到配备数十个GPU的分布式系统。考虑到硬件设备的发展速度和抽象层变得无处不在的速度,这种设计方法非常有意义——事实上,即使像C++这样的语言在它和它运行的设备之间也有抽象层。这是一种前瞻性的设计策略,可以让谷歌使用先进的硬件以经济高效的方式构建一个大规模的系统,同时确保TensorFlow始终能够与其平滑连接。TensorFlow是Google公开可用基础设施的组成部分。本来谷歌曾经大规模推广容器编排工具Kubernetes,现在却被广泛认为是容器生态的重要成员之一。2、来自Google的支持,让TensorFlow有了更深层次的意义。如果能够得到谷歌这样的巨头公司的支持,尤其是机器学习等技术概念极其复杂的解决方案,开源项目将能够迎来更加可观的发展。开发人员社区支持的增长潜力和热情。因为这种来自巨头的支持,往往意味着这些解决方案已经在这些老牌公司内部使用——谷歌宣布TensorFlow时正是这样。在这种情况下,开源项目中最关键和关键的漏洞已经在其内部使用中得到解决。另外,当支持方像谷歌这样具有相当规模的时候,那么这个开源项目往往应用场景非常广泛。开源该项目意味着更多的用户将能够为其做出贡献,并成为其发展背后的推动力。很少有贡献者拥有Google的运营规模,但他们仍然有机会思考和设计Google自己根本无法想象的可能用例。3.出色的易用性——这一点非常重要在使用任何框架处理数学、统计或机器学习任务时,我们面临的第一个困难就是易用性。ApacheSpark之所以吸引众多支持者,不仅是因为其极具吸引力的内存处理速度优势,还有其使用的相对简单的编程接口。IBM曾经使用Spark来编写其重要的数据处理产品DataWorks,蓝色巨人强调,这一选择成功地将其原本4000万行代码缩减为500万行。同样,TensorFlow的内在优势之一是其易用性。除了能够被其他C++应用程序直接访问外,它还提供了一个面向Python的接口——包括对Ipython/Jupyternotebooks/的支持,这使得使用体验更加直观易懂。目前,开发团队仍在为包括GoogleGo在内的其他语言构建更强大的前端。此外,Python3支持问题已被标记为需要尽快修复的错误。虽然TensorFlow的构建要素还不完整,但目前的储备和阵容已经相当可观。4.压力让机器学习默认选择开源路线。谷歌的MttCutts提出了这一观点,并指出以Hadoop为代表的“整个山寨行业”正在努力重构谷歌发布的MapReduce技术论文。“但结果并不理想,”他写道,“因为外部代码通常有一系列我们已经在谷歌解决的问题。”以专有方式开发算法代码的优势正在逐渐减弱。.算法不再是机器学习解决方案中最重要的组成部分——尤其是当机器学习部署在云环境中时。相反,算法导入用于训练自身的数据以及它需要与之交互的真实世界数据源是最重要的元素。考虑到IBM最近刚刚收购了Weather公司,很明显,蓝色巨人不仅需要实时的真实世界数据流,还需要更多传感器阵列来生成这些数据。而只有当相关算法和框架的开发有足够的人力介入时,其数据处理的实际效果才能真正达到顶峰。原标题:关于谷歌机器学习项目的4个无牛外卖
