当前位置: 首页 > 科技观察

Telstra使用深度学习来应对网络挑战!_0

时间:2023-03-18 14:45:17 科技观察

Telstra正在其网络数据上运行深度学习算法,以及早预测设备故障并找到打击语音和文本诈骗的方法。数据科学(网络)团队经理TimOsborne最近在IBM的Think2020会议上发表讲话,透露了代号为TelstraAILab或TAIL的项目。TAIL在IBM帮助下??构建的仍在改进的应用数据科学平台上运行。它结合了现有的CiscoUCSC240和新的IBMPowerSystemAC922进行计算,顶部是基于Kubernetes的堆栈,包括用于在Kubernetes上运行机器学习算法的Kubeflow。Osborne表示,TAIL得到了一个由25名数据科学家和工程师组成的团队的支持,他们“与整个公司的网络工程人员充分整合,以解决数据科学中最具挑战性的问题。”TAIL应对的早期挑战包括网络优化、电源优化、欺诈和其他与电信相关的诈骗。“对我们来说,网络优化就是能够预测、检测和诊断我们看不到的问题,”他说。“关键是能够在我们的业务运营中取得积极成果,为我们的客户带来积极成果,并努力思考我们如何拥有自组织网络。同时能够使用深度学习算法来理解机器代码和弄清楚这意味着什么,这样我们就可以及早修复故障,这真的很酷,这就是我们现在正在做的事情。”在电力优化方面,Osborne表示公司正在探索供暖、通风和空调(HVAC)优化,但他拒绝透露细节。他还表示TAIL现在被用来打击电信诈骗。在过去的一年里,Telstra和其他运营商在这方面面临监管压力。有人打电话给你回电话,打电话要花钱。Osborne说,这项工作可以追溯到六个月前。Telstra已经要求IBM建立一个应用数据科学平台,使TAIL能够顺利运行。他说:“我们有人才,我们有使用场景,机会就在眼前,何况我们还有数据。我们只是没有平台。早在2019年12月,我们就开始与IBM合作。这种合作绝对堪称典范。“我们有相同的最终目标。IBM有兴趣与使用其平台、Kubernetes和Kubeflow的客户一起获得更多经验,我们有兴趣在公司内部使用这些工具并进行扩展。“我们现在拥有一个很棒的机器学习平台,并且我们的数据科学家很满意。Osborne表示,数据科学平台使团队能够快速调查网络业务的需求,并针对真实世界的使用场景快速扩展。“随着我们的业务越来越受欢迎,我们可以添加更多的机器,更多的机器可以添加到集群中,并根据需要扩展资源。据IBM的AI技术专家AdamMakarucha介绍,应用数据科学平台已于去年晚些时候部署今年年初,本来是基于原生Kubernetes构建的,现在计划迁移到RedHat的OpenShift容器管理平台,因为OpenShift4.3版本支持PowerSystem。在硬件方面,Marakucha说有“六台机器和六个节点”总共。”他说:“计算量可能看起来并不大,但这种部署环境的关键在于这些节点中的每一个都具有GPU加速功能。这实际上意味着该机器上的计算总量和功能实际上远远超出了6节点系统的容量。事实上,它的总性能可能相当于160个节点。该平台总共拥有237.6Teraflops的[GPU]单精度性能。”Marakucha说,虽然Telstra想使用PowerSystemAC922,但它也想充分利用它购买的CiscoUCS硬件和其他设备和服务。AC922,因为他们在超大数据集的深度学习和他说:“大型模型。虽然这种混合环境可能难以管理,但Kubernetes可以处理大部分繁重的工作。”.限制以防止资源被垄断。如果你是数据科学家,你可能会这样做:我会尝试获得尽可能多的CPU内核和计算资源,即使我不会同时使用这些资源。这种环境中的许多数据科学家都在做同样的事情,这意味着我们很快就会耗尽计算资源,因为我们正在消耗所有的核心。“所以我们严格限制核心数量为两个,这意味着我们有灵活性,因为Kubernetes的优势是如果你要求两个核心,至少你有两个核心,但它允许你扩展到更多的核心,如果任何空闲的。我们只是锁定一些配置以防止过度配置。”原标题:Telstrathrowsdeeplearningatitsnetworkchallenges,作者:RyCrozier