当前位置: 首页 > 科技观察

刚刚,一家跨国公司发生了运维大事

时间:2023-03-17 20:53:01 科技观察

FreeWheel成立于2007年,总部位于美国硅谷。创始人是DouglasKnopper、JonHeller和DianeYu。公司已经发展了十年。目前,美国传统电视媒体和运营商约80%的数字视频广告业务使用FreeWheel的服务。ComScore排名前10的视频网站中,大部分都是该公司的客户或合作伙伴。2017年开始,FreeWheel将重点开拓欧洲市场,在已经占据约50%市场份额的基础上进行升级。在很多初识FreeWheel的人看来,FreeWheel的很多做法都出乎意料:公司的业务、销售、市场都在欧美,但技术研发团队主要在中国;女性程序员稀缺如大熊猫在飞轮科技IT职场,飞轮北京研发中心近300人,女性员工约占40%;公司标榜求贤若渴,但为了留住FreeWheel这样喜欢的工程师,可以特意帮他在纽约建了多少新办公室?除了FreeWheel外在的“幻想和任性”吸引了众多求职者的关注,还有公司内部的IT架构和运维。FreeWheel成立已有10年。从成立之日起,全年累计广告播放量100万次,单日广告投放量近10亿条。运维部门用什么来保证产品稳定的应用环境?作为对新兴技术非常敏感的高科技企业,如何选择最合适的技术产品?这家被美国90%的主流电视媒体和运营商使用的跨国公司,如何保证欧美、中国协同办公的效率?FreeWheel联合创始人DianeCTOYu和运维副总裁VitoLeung为我们解答了以上问题,还原了一个真实的FreeWheel。同时希望能为面临IT运维困惑的跨国公司、高科技公司、创新型公司提供更多参考。工程团队搭建并磨合。这家公司充满活力。它既没有历史包袱,也没有缺乏代码专家。他们对产品有清晰的定位,对新技术有理性的判断和尝试,对IT规划有预判和冷静。值得借鉴的地方很多。反其道而行之的研发中心熟悉FreeWheel的人都知道,这家跨国公司的研发中心从成立之初就位于北京。有人将其归因于其CTODiane是土生土长的北京人,有故乡情节。其实,真相并非都是如此。Diane在美国工作九年,接触过很多中国程序员。她很早就发现,中国工程师基本功扎实、吃苦耐劳、能力出众,但往往苦于语言。另一个劣势是中国的IT人才分布在不同公司的不同部门。没有形成团队,不能互相支持和帮助,很难共同提高。当时她就在想,为什么不招募国内最优秀的工程师来组建研发团队呢?后来,她遇到了FreeWheel的另外两位创始人,提出了在北京建立研发中心的想法,很快被他们接受。立足中国,国内人才堪比硅谷FreeWheel研发中心招收清华、北大、中科院、哈工大等一流大学的尖子生。组队之初,除了明显的语言劣势外,中外思维方式的差异也经过一段时间的调整。许多黛安以前从未想过的微小细节,也可能引起误会。例如,研发团队在发送邮件时,通信时间的书写往往按照中国习惯“年-月-日”来标注,而美国人标注时间的习惯是“月-日-年”。团队的团队想不通会议是在雨中进行的。但很快,在经历了痛苦的“磨合期”后,中国的研发团队爆发出惊人的研发能力。一方面,团队非常有思想,研发能力强,能够快速响应美国产品部门的需求;另一方面,FreeWheel研发团队中有三分之一的人有去美国或欧洲“值班”轮岗的经历。他们近距离接触过产品应用和客户服务,更了解研发的重点和方向。当然,还有一个不用多说的好处就是英语沟通能力的快速提升。事实证明她的决定是正确的,现在她的合作伙伴已经在各种场合告诉客户或者投资人,FreeWheel之所以能走到今天,与Diane决定在北京设立研发中心是分不开的。“有一个阶段我非常紧张,但我很高兴事实证明我是对的。”运维团队遇到的挑战及解决方案以最少的试错成本管理好运维团队,是运维一副总裁Vito的重要职责。FreeWheel将60多人的运维团队分成几个小团队,一部分负责网络,一部分负责基础运维,一部分专注于产品应用运维。整个运维团队主要负责三件事:学习和借鉴外部新兴技术;随时跟进公司产品开发与支持;与不同部门进行沟通和协调,以满足他们的需求。这三件事说起来容易,真正做到却不容易。以第一件事为例,Vito需要解决FreeWheel在IT开发过程中遇到的各种挑战,其中他需要以最少的试错成本找到最有效的解决方案。他举了两个例子:数据库选型之路在互联网广告行业,基于用户信息和历史兴趣行为的精准投放已经成为基本要求。为了满足这一需求,需要构建一个支持高并发、低延迟、可扩展、高可用的用户数据库系统。这是很多实时广告系统面临的一个非常大的技术挑战。FreeWheel的用户数据已经从最初的几万条、几十GB发展到现在的6亿条、TB级的规模。每天更新的数据高达1亿条,需要以毫秒(ms)为单位的跨数据中心数据访问性能,以保证数字广告的实时性。为此,FreeWheel在产品选型、编程接口、软件设计、用户数据库运维等方面进行了多次尝试、探索和改进。在初始阶段,数据量很小。基于访问性能的考虑,FreeWheel首先尝试了业界非常流行的开源软件产品Memcached来实现全内存访问,并取得了不错的效果。随着数据量的不断增加,全内存存储已经不能满足需求。接下来研发和运维的同事们开始对Leveldb进行测评,根据FreeWheel的业务需求做了一些特殊的定制,从而实现了数据持久化到磁盘上。存储,摆脱内存容量的限制。然而,后续的问题和挑战也随之而来。从运维的角度来看,很多问题都没有很好的解决,比如实现高可用难度大,增加节点成本高,跨数据中心延迟大等。这时,FreeWheel开始积极寻求和尝试更多的软件产品和解决方案,最终选择了Aerospike这样的产品。在API实现、数据访问性能、命名空间定义、低延迟数据同步、SSD硬盘访问优化、高可用实现、运维友好性等方面具有突出优势,使得FreeWheel的广告投放系统不仅在响应速度有了巨大的提升,跨数据中心同步的平均延迟控制在毫秒级(ms)。产品小贴士:Memcached:是一个高性能的分布式内存对象缓存系统,用于动态web应用降低数据库负载。LevelDB:是Google实现的一个非常高效的kv数据库,可以支持亿级数据量。Aerospike:是一个具有键值存储的高性能实时NoSQL(灵活模式)数据库。网络文件系统的演进在FreeWheel中,运维团队使用NFS(NetworkFileSystemNetworkFileSystem)解决方案,实现多系统和服务器之间的数据共享。NFS是Linux/Unix操作系统下应用广泛且非常成熟的共享文件系统,可以通过TCP/IP协议在计算机之间共享资源。在运维团队的推动下,NFS的应用在FreeWheel中经历了几个阶段。在最初的业务阶段,他们只使用一台NFS服务器为前后端产品提供所有数据共享服务,包括广告创意文件、用户数据报告、广告日志等。随着FreeWheel产品的不断升级和业务模型的扩展,数据量和读写吞吐量也越来越大,单一的NFS服务器已经不能满足需求。因此,新的解决方案是将现有的数据资源按照业务逻辑进行拆分,分布到多个NFS服务器上,从业务逻辑的角度对数据资源进行隔离。同时,这也需要推动产品和开发部门的同事调整应用程序设计以适应这种改进。在基本解决了容量和性能问题后,运维团队进一步提升了多台NFS服务器的高可用和可扩展性。经过研究比较,最终选择了RedhatClusterSuite作为解决方案,实现了从2节点互备到4节点多对多互备,一直到现在的7节点多对多互备架构,使共享资源的读写性能、服务可用性水平、系统冗余度、水平扩展能力等为系统提供强有力的支持。美欧中同步协同作为一个需要在全球多地协同工作的运维团队,最头疼的不是产品业务的问题,而是如何让运维团队在不同区域有一致的目标和优先事项。FreeWheel在美国、欧洲和中国的多个办事处,主要职能各不相同。一些办公室更喜欢与用户沟通,如何更快更好地处理客户需求是重点关注的问题;有些办公室更喜欢工程,如何更好地为工程团队服务是当务之急。因此,不同办公室的运维团队面临和需要解决的问题是不同的。作为一个整体的全球运维团队,如何将各个区域的需求放在一起,确定优先级,并作为一个整体,共享一个backlog(工作列表),成为了FreeWheel运维面临的一大挑战。***解决这个问题的方法是建立一个“全球运营项目管理”流程。简单来说,各地运维团队的领导和公司的IT架构师需要定期沟通,列出优先级,确保大家保持一致。在协作方面,随着公司的成长,为了提高客户服务质量的标准,FreeWheel的SLA(服务水平协议)越来越严格,流程越来越成熟,临时需求越来越少.取而代之的是SOP(标准作业程序)和硬件需求申请流程,使得团队之间的沟通与合作越来越顺畅。FreeWheel运维的未来,拥抱DevOps随着业务需求的变化,FreeWheel已经从只有两台机架服务器(ui?adserver?db)的简单系统发展到跨越多个机房的数千台服务器,涵盖缓存、Reporting、forecasting、nosql等多层复杂系统架构。前几年,FreeWheel采用了私有云的方案,最近FreeWheel开始研究混合云的方向,公有云和私有云都用。FreeWheel的下一个发展重点将放在Devops上。美国和中国的运维在这方面有很大的不同。在美国,大部分运维工程师必须同时具备运维(系统+网络)能力和开发能力。在国内,传统的运维工程师还是更专注于运维。“随着中国科技产业的进步,运维领域也开始要求运维工程师除了运维思维之外,还要有更多的开发思维。”如何支持越来越快的版本迭代?这不仅是一个快速的问题,更重要的是可以保持生产环境系统的高质量和稳定。这将涉及对技术本身和产品架构改进的研究和投资。后记采访完FreeWheel,记者在职业之外有了很多感受。这家公司成功的背后,有很多必然性:严谨的市场调研、理性的技术判断、精准的市场定位、高效的三地协同、对产品应用开发的足够重视……他们的很多做法看似这与常规做法背道而驰,但仔细想想又是“合理”的。在国内企业走出去的大趋势下,记者也建议其他企业可以参考FreeWheel的理性思考,不要选择最著名的,只选择最适合自己的发展路径。互联网与安全频道主编周雪【原创稿件,合作网站转载请注明原作者及出处.com】

猜你喜欢