自然语言处理(NLP)的定义自然语言处理(NLP)是人工智能技术的一个分支,它使计算机能够像人一样理解、处理和生成语言,并且在商业应用中迅速增长。虽然术语自然语言处理(NLP)最初指的是人工智能系统的阅读能力,但它已成为所有计算语言学的口语化术语。它的子类别包括自然语言生成(NLG)(计算机自行创建通信的能力)和自然语言理解(NLU)(理解俚语、发音错误、拼写错误和其他语言变体的能力)。自然语言处理(NLP)的工作原理自然语言处理是通过机器学习(ML)进行的。机器学习系统存储单词以及它们如何像任何其他形式的数据一样组合。短语、句子,有时甚至整本书都被输入机器学习引擎,并根据语法规则和人们在现实世界中的语言习惯(或两者)进行处理。然后计算机使用这些数据来寻找模式并推断下一步该做什么。以翻译软件为例:在法语中,“I'mgoingtothepark”是“Jevaisauparc”,因此机器学习预测“I'mgoingtotheshop”也会以“Jevaisau.“自然语言处理应用程序机器翻译是更好的自然语言处理(NLP)应用程序之一,但它不是最常用的应用程序。每次人们在Google或Bing搜索引擎中查找内容时,他们都会将数据输入系统。单击搜索结果时,搜索索引将其视为已找到正确结果的确认,并使用此信息在将来进行更好的搜索。聊天机器人的工作方式相同:它们与Slack、MicrosoftMessenger和其他聊天程序集成,它们可以在其中读取人们所说的语言,然后在说出触发词时将它们打开。当像Siri和Alexa这样的语音助手听到“嘿,Alexa”这样的短语时,他们会做出回应。这就是为什么批评者指责这些程序一直在收听:如果不是,他们永远不知道人们什么时候需要它们。除非人们自己打开应用程序,否则自然语言处理程序将在后台运行,等待短语出现。自然语言处理(NLP)对人们利大于弊。人们可以想象没有谷歌搜索或拼写检查器的生活。它使用自然语言处理(NLP)将输入的单词与字典中的单词进行比较。通过比较两个数据集,拼写检查器可以发现问题并提供建议。自然语言处理(NLP)示例搜索引擎和拼写检查在今天非常普遍,以至于人们常常认为它们是理所当然的,尤其是在NLP可以显着提高生产力的工作中。例如,如果您想知道您还剩多少休假时间?你不必问人力资源部门。使用Talla节省时间,这是一个搜索公司政策以寻找答案的聊天机器人。需要查看手机中保存的电话号码才能拨打电话?您可以使用语音提示,通过语音搜索启动SecondMind,会给出所需的号码。这种集成的搜索工具加快了员工与客户的沟通。自然语言处理还可以帮助招聘人员对简历进行分类,吸引多样化的候选人并雇用更多合格的员工。检测垃圾邮件可以使用自然语言处理(NLP)来防止垃圾邮件到达人们的收件箱;Outlook和Gmail等程序可用于将某些人的邮件分类到创建的文件夹中。情绪分析等工具可帮助企业快速识别推文的好坏,从而了解客户的担忧。情感分析不仅可以处理社交媒体上的词语,还可以分解词语出现的上下文。对于来自分析公司Periscopic的数据可视化工具SkyeMorét,只有30%的英语单词是正面的,其余的是中性或负面的。因此,自然语言处理(NLP)可以帮助商家更充分地理解一个帖子:这些中性词的背后,消费者表达的情绪是什么?传统上,企业使用NLP将反馈分为正面和负面类别。但FleishmanHillard社会与创新高级副总裁RyanSmith表示,如今的自然语言处理工具可以识别更精确的情绪,例如悲伤、愤怒和恐惧。自然语言处理(NLP)软件无论人们是在构建聊天机器人、语音助手、预测文本应用程序,还是其他以NLP为核心的应用程序,企业都需要采用工具。据调查,最受欢迎的自然语言处理软件包括:NaturalLanguageToolkit(NLTK)。自然语言工具包(NLTK)是一个开源框架,用于构建Python程序来处理人类语言数据。它由宾夕法尼亚大学计算机和信息科学系开发,提供与50多个语料库和词汇库、文本处理库、自然语言处理库和论坛的接口。NaturalLanguageToolkit(NLTK)在Apache2.0许可下提供。SpaCy。SpaCy是一个用于高级自然语言处理的开源库,专为生产目的而不是研究目的而设计。SpaCy在设计时考虑了先进的数据科学,并允许进行深度数据挖掘。它由麻省理工学院授权。Gensim。Gensim是一个用于自然语言处理的开源Python库。独立于平台的库支持可扩展的统计语义、语义结构的纯文本文档分析以及检索语义相似文档的能力。可以在没有人工监督的情况下处理大量文本。亚马逊理解。这项亚马逊服务不需要机器学习经验。它旨在帮助组织从电子邮件、客户评论、社交媒体、支持票和其他文本中获得洞察力。它使用情感分析、词性提取和标记化来分析词语背后的意图。IBM沃森音频分析器。这种基于云的解决方案专为社交聆听、聊天机器人集成和客户服务监控而设计。它可以分析客户帖子中的情绪和语气,并监控客户服务电话和聊天对话。谷歌云翻译。此API使用自然语言处理来检查源文本以确定语言,然后使用神经机器翻译将文本动态翻译成另一种语言。该API允许用户将功能集成到他们自己的程序中。自然语言处理(NLP)课程有许多资源可用于学习创建和维护NLP应用程序,其中许多是免费的。其中包括:DataCamp中的Python自然语言处理。这个免费课程提供15个视频和51个练习文件,涵盖了使用Python进行自然语言处理的基础知识。它涵盖了如何识别和分离单词、如何提取文本中的主题以及如何构建您自己的假新闻分类器。Udemy的自然语言处理(NLP)。本入门课程提供使用Python和自然语言工具包处理和分析文本的实践经验。它包括三个小时的点播视频、三篇文章和16个可下载资源。该课程的费用为19.99美元,并附有结业证书。Udemy的Python自然语言处理(NLP)。本课程面向具有基本语言编程经验、了解面向对象编程概念以及具有基础到中级数学和矩阵运算知识的个人。它完全基于项目,涉及构建一个文本分类器来实时预测推文的情绪,以及一个获取文章并提取摘要的文章摘要器。该课程包括10.5小时的点播视频和8篇文章。该课程的费用为19.99美元,并附有结业证书。edX的自然语言处理(NLP)。微软公司通过edX提供的为期六周的课程概述了自然语言处理和经典机器学习方法的使用。它涵盖了统计机器翻译和深度语义相似性模型(DSSM)及其应用。它还涵盖了应用于自然语言处理和视觉语言多模式智能的深度强化学习技术。这是一门高级课程,完成课程的人只需支付99美元即可获得认证证书。Coursera的自然语言处理。本课程是Coursera高级机器学习专业的一部分,涵盖自然语言处理任务,包括情感分析、摘要、对话状态跟踪等。Coursera表示这是一门高级课程,需要学习五周时间,每周学习四到五个小时。自然语言处理支持社会公益除了帮助企业处理数据,情感分析还可以帮助人们了解社会动态。例如,Periscopic将自然语言处理(NLP)与视觉识别相结合,创建了TrumpEmoticoaster,这是一种处理语言和面部表情以了解特朗普总统情绪状态的数据引擎。类似的技术可以防止校园枪击事件:在哥伦比亚大学,研究人员已经处理了来自9,000名暴力青年的200万条推文,并正在寻找这个问题的答案:随着青少年变得更加暴力,那么他们的语言会发生怎样的变化?“有问题的内容会随着时间的推移而演变,”Coursera的项目主管德斯蒙德巴顿博士说。表达。然后,自然语言处理会标记有问题的情绪,以便社会工作者进行干预。与Periscopic一样,Columbia将情感分析与图像识别相结合来提高准确性。计算机视觉分解推文中的图片,然后机器学习将它们与语言一起处理,以讲述“图片的真实情感”,Patton说。这张图片是关于悲伤的吗?这是威胁的形象吗?这些图像中还发生了什么,可以帮助人们更好地理解?”除了校园枪击事件,哥伦比亚项目还希望利用该技术来防止帮派暴力。自然语言处理(NLP)来提高个人水平自然语言处理(NLP)还可以帮助人们监控他们的情绪状态。Woebot是一种电子治疗师,可以通过FacebookMessenger聊天机器人或独立应用程序与用户联系。不过,如果没有先进的情绪分析技术,Woebot实际上只能跟踪抑郁和焦虑的词语,这可能表示用户正面临紧急情况。
