2020年对于公共卫生、职业生活、经济以及日常生活的几乎所有其他方面来说将是独特的一年。虽然一些机会正在消失,但另一些机会正在改变他们的商业模式,而且企业不受影响的情况很少见。尽管如此,仍有一些行业正在蓬勃发展,而不仅仅是虚拟会议或医疗保健。自然语言处理(NLP)就是这样一个领域。事实上,根据MarketsandMarkets?研究,NLP市场规模预计将从2019年的102亿美元增长到2024年的264亿美元。使用案例在医疗机构中帮助患者和从业者,简化客户服务查询,甚至虚拟地帮助购物者,有几个增长因素推动了NLP技术的增长。无论您是新手还是经验丰富的数据科学家,NLP都可以帮助用户更快、更智能、更准确地工作。要了解NLP在未来几年的发展方向,我们首先需要了解NLP现在所处的位置——挑战、成功、最普遍的用例等。为此,JohnSnowLabs与GradientFlow合作,最近发布了一份新的研究报告,探讨了NLP在不同行业、地区和应用层面的使用情况。知识就是力量,本次调查的目标是通过了解组织如何使用NLP技术,帮助IT领导者充分发挥NLP的潜力。该全球调查询问了来自50多个国家/地区的近600名受访者,以全面了解2020年NLP的采用和实施状况。以下主要调查结果将有助于为行业设定基准并预测我们在NLP中的发展方向来年。NLP支出正在上升:尽管今年IT支出下滑,但有趣的是看到NLP预算全面增加,据报道NLP技术预算比去年增加了10-30%。考虑到该调查是在全球COVID-19大流行最严重的时候进行的,当时全球IT支出正在下降(Gartner),这一点尤为重要。53%的技术领导者受访者表示,他们的NLP预算与2019年相比至少增加了10%,31%的受访者表示他们的预算与上一年相比至少增加了30%。同样的趋势也适用于大型公司(员工人数超过5,000人),其中61%的受访者表示他们的预算将在2020年增加。云计算的使用带来了挑战。77%的受访者表示,他们至少使用所列四种NLP云服务中的一种——谷歌、AWS、Azure或IBM。尽管基于云的服务很受欢迎,但受访者认为成本是他们在使用NLP云服务时面临的主要挑战。此外,还有对可扩展性的担忧,因为许多NLP应用程序依赖于特定领域的语言使用,而云提供商在满足这些市场需求方面进展缓慢。尽管如此,53%的受访者表示至少使用两个最大的NLP库之一,即SparkNLP和spaCy,这是一种更准确且更具成本效益的选择,这并不奇怪。准确性很重要,也很有挑战性。超过40%的受访者表示,准确性是他们评估NLP库的最重要标准。考虑到在电子健康记录等关键应用中使用NLP或在医疗机构中检测不良药物事件,这一点尤为重要。另一方面,准确性也是所有受访者最常提到的挑战。然而,在观察技术领导者时,情况略有不同。集成问题、语言支持和可扩展性与准确性并列为紧迫的挑战。幸运的是,语言支持等领域正在显着改善。谷歌和Facebook等公司正在发布150多种语言的预训练嵌入。NLP图书馆也在效仿。分类和NER是主要用例。NLP最流行的四种应用是文档分类、命名实体识别(NER)、情感分析和知识图谱。来自医疗保健领域的受访者将去识别化识别为另一个常见的NLP用例。自动化的NLP过去是一个极其手动和劳动密集型的过程,现在已经大大减轻了这种负担。NER和分类是另外两个NLP用例,医疗保健组织在这些用例中看到了巨大的价值。例如,这些应用程序可以帮助医疗专业人员快速准确地识别患者的药物不良事件(ADE),改善护理服务,并减轻医疗保健系统的负担和成本。数据源。来自文件(例如pdf、txt、docx等)和数据库的数据在NLP项目中使用的数据源列表中名列前茅(61%)。从法律合同和新闻文章到医疗记录和SEC文件,这些输入文档通常以PDF格式存储。虽然深度学习模型在过去几年有所改进,但从PDF中提取文本时仍存在许多困难和数据质量问题。有趣的是,仍在探索NLP的公司与采用曲线更靠后的公司之间的数据源存在一些差异。处于探索阶段的受访者表示使用音频数据(29%)的比例高于处于探索阶段的受访者(22%)。根据NLP过去一年的增长轨迹,很明显它的势头将持续到2021年。观察采用和用例如何随着时间的推移以及即将到来的技术增强而演变将会很有趣。NLP有能力改变我们的工作方式、提供和接受医疗服务、购物以及与客户服务的交互方式。虽然其中一些案例可能比其他案例更有影响力,但它们都会塑造我们更好的工作和生活方式。本文转载自雷锋网。如需转载,请在雷锋网官网申请授权。
