随着企业着手深度学习(DL)项目以使其数据发挥作用,他们必须保护这些数据,而数字双胞胎是成功的关键。当今世界,数据为王。无论是亚马逊、苹果、Facebook、谷歌、沃尔玛还是Netflix,世界上最有价值的公司都有一个共同点:数据是他们最有价值的资产。所有这些公司都在使用深度学习(DL)来利用这些数据。无论您的业务是什么,数据都是您最宝贵的资产。您需要通过实施自己的DL来保护这些资产。深度学习成功的最重要因素是拥有足够的正确类型的数据。这就是数字孪生的用武之地。数字孪生是实际物理过程、系统或设备的数字副本。简单来说,数字孪生就是在虚拟世界中再造一个真实世界。最重要的是,数字孪生可能是深度学习项目成功的关键,尤其是那些涉及危险、昂贵或耗时过程的项目。深度学习的前景到目前为止,包括半导体制造在内的几乎每个行业都已经意识到深度学习在创造战略优势方面的潜力。深度学习使用神经网络来执行高级模式匹配。深度学习已应用于面部和语音识别、医学图像分析、生物信息学和材料检测等多个领域。在半导体制造中,深度学习已经应用于产品缺陷分类等领域。大多数领先的公司都在争先恐后地在这个充满希望的新竞争环境中获得优势。随着企业开始探索深度学习及其如何帮助他们,许多人发现了两件事:首先,获得深度学习原型很容易;其次,从“好的原型”到“生产质量”的结果很难。借助当今可用的所有低成本到免费的深度学习平台、工具和套件,与传统应用程序开发相比,深度学习应用程序的初始开发快速且相对容易。然而,将深度学习应用程序产品化并不比将传统应用程序产品化更容易,甚至更难。原因是数据。在无法提供生产质量结果的深度学习应用程序和彻底改变您解决特定问题的方式的深度学习应用程序之间,通常有足够的数据和足够的正确类型的数据。深度学习的数据差距深度学习基于模式匹配,通过向神经网络呈现代表要匹配的对象的数据来“编程”。大量数据用于训练网络识别对象(并知道它们何时不存在)。深度学习对于快速原型制作和概念验证非常有用。但深度学习真正的优势不在于开发速度。这是真的,它释放了数据的力量来做其他任何方式都做不到的事情。任何深度学习应用程序的成功取决于训练中使用的数据集的深度和广度。如果训练数据集太小、太窄或太“正常”,那么深度学习方法将不会比标准技术做得更好。事实上,它可能会做得更糟。使用足够的数据来训练网络以表示所有重要状态或数据演示非常重要,这样网络才能学会掌握手头问题的正确性质。某些领域的困难,例如自动驾驶或半导体制造,是一些最严重的异常很少发生(非常幸运)。但是如果你想让一个深度学习应用程序识别一个在车前跑来跑去的孩子(或者一个致命的掩蔽错误),你就必须用很多这样的案例来训练网络,而现实世界没有太多。更多这些数据。数字孪生是创建足够多的异常数据以正确训练网络识别这些条件的唯一方法。上图是具有标准差的正态分布图。在半导体制造中,与驾驶一样,“异常”事件非常罕见,但神经网络必须尽可能多地训练,因为最坏的事件会导致芯片失效。以至于整体平均效果不够好。数字双胞胎缩小差距数字双胞胎,或实际过程、系统和设备的虚拟表示,是创建正确数量和类型的数据以成功训练深度学习网络的关键工具。使用数字孪生来创建DL训练数据有几个原因:您所在的数据可能属于您的客户,因此您不能将其用于深度学习训练。您可能需要将资源用于创建深度学习所需的数据,完全用于客户项目。您已经开发了一个深度学习应用程序,但发现您需要特定的数据来调整和训练您的神经网络以达到所需的精度,但使用晶圆厂资源创建数据的成本高得令人望而却步。您知道您将无法找到足够的异常数据来正确训练深度学习网络。最后一种情况几乎是普遍的。理想情况下,为了保持对数据的完全控制,您需要三个数字孪生:在生产流程中先于流程/设备提供输入数据以模拟您自己的流程的数字孪生;你自己的过程/设备的数字双胞胎;以及您的过程/设备的数字双胞胎,它会跟随您完成整个生产流程,以便您可以将输出提供给下游进行验证。在2019年SPIEReticle技术大会上,D2S发表了一篇论文,展示了使用深度学习技术创建的两个数字孪生,扫描电子显微镜(SEM)数字孪生和椎间光刻(ILT)数字孪生(图2显示了SEM数字孪生的输出双胞胎)。虽然数字孪生的输出通常不足以用于制造,但这些数字孪生已被用于训练深度学习神经网络和进行验证。重要的是,这些数字孪生是由深度学习而不是模拟生成的。这是使用深度学习作为工具来生成其他DL所需数据的示例,它显示了投资深度学习的复合效益。上面SEM数字孪生生成的蒙版SEM图像和真实SEM图像的两个示例。还显示了同一位置的水平切割线处的图像强度。不仅图像看起来非常相似,而且边缘处的信号响应也相似。深度学习成功的路线图所有这些听起来像是要做很多工作。为什么不用咨询公司为你做深度学习呢?因为,请记住,数据为王!保护数据并自行执行深度学习。值得庆幸的是,我们可以遵循一条既定的成功之路。首先,您需要确定将对深度学习产生影响的项目。确实要慎重选择,深度学习是模式匹配,所以要选择属于那个领域的东西。基于图像的应用程序(如缺陷分类)是一个很好的匹配。晶圆厂中的所有设备都会产生大量的运营数据,除非出现问题,否则这些数据很少被引用。您不仅可以在事后仅将这些有价值的数据用作诊断工具,还可以持续监控Fab中的数据并训练深度学习应用程序以标记问题之前的模式,以便您可以在问题产生影响之前识别和解决问题。纠正问题并节省停机时间。例如,Mycronic在2020年SPIE高级光刻会议的eBeamInitiative午餐时间演示中透露了该公司如何利用其机器日志文件中的数据来将深度学习用于预测“mura”(不均匀烦人)等异常情况,但这是众所周知的图像处理算法很难在平板显示器(FPD)掩模上检测到。通常,操作员执行非常繁琐且容易出错的过程,但很难使用传统算法实现自动化,因此这是深度学习的一个很好的候选者。无论是通过目视检查还是其他方式,检查特定情况的专业人员都很有可能正确执行任务。但面对许多类似情况的例子,人类会犯错误并变得越来越不可靠。在特定情况下,深度学习可能不如人类。但它在某些方面比人类做得更好。随着执行任务所花时间的增加,人类会犯更多错误;而深度学习的成功概率不会随着数量或时间的增加而降低。帮助缩小深度学习成功的差距一旦您确定了一个深度学习项目,有多种可用资源可以带您走上成功之路,同时仍然让您严格控制您的数据。如果您是深度学习的新手,并希望为深度学习试点项目提供全面支持,您可以加入电子制造深度学习中心(CDLe,www.cdle.ai),这是一个行业领导者联盟,旨在联??合人才和资源,以在我们独特的问题空间中推进深度学习的最先进水平,并加速在我们整个企业的每个产品中采用深度学习,从而改善我们为客户提供的服务。如果您已经开始一个深度学习项目,但由于深度学习数据缺口而遇到问题,D2S可以帮助您构建数字孪生,您需要增强和调整DL才能成功。
