当前位置: 首页 > 科技观察

人工智能的核心难点之一:情感分析的常见类型与挑战

时间:2023-03-19 21:37:38 科技观察

情感分析或情感人工智能,在商业应用中常被称为意见挖掘,是自然语言处理(NLP)的一种非常流行的应用。文本处理是该技术最大的分支,但不是唯一的分支。共有三种类型的情感人工智能及其组合。他们都面临着自己的挑战,目前处于不同的发展阶段。在本文中,作者简要介绍了这三种类型以及它们在实际应用中面临的挑战。文本情感分析作为自然语言处理的一个子集,文本分析和书面意见挖掘是迄今为止最简单和最发达的情感分析类型。它们需求量大,发展历史悠久,是企业和公共部门最常采用的技术。基本的情绪分析,特别是对于商业用途,可以概括为将句子、段落、帖子或文档分类为负面、中性或正面。其中,更复杂的情绪和态度处理、意义提取、意图分类和基于语言学的情感分析也越来越受欢迎。自动情感分析通常是通过有监督的深度机器学习、基于字典的无监督过程或两者的结合来实现的。我们有许多现成的数据集,例如社交媒体、各种评论平台和公开可用的问答服务。爬取流行网站(经许可)以提取新数据也很流行,Twitter和亚马逊是特别受欢迎的选择。视觉情感分析作为多媒体情感分析的一部分,与基于文本的分析相比,视觉情感AI在开发和商业融合方面还远远不够。当前情绪分析应用的一个很好的例子是在数字图像存储库中通过情绪标识符(“快乐”、“爱”、“快乐”、“愤怒”)搜索视觉内容,以及自动图像和视频标签预测。即将推出的应用程序是自动理解人们的情绪,用于教育、政治、文化、安全和其他目的。目前,视觉/文本分析以及图像注释和伴随文本的分析仍然是旨在为视觉情感分析创建AI的机器学习过程的主要来源。用于视觉情感分析的数据也可以来自社交媒体:图片来自Flickr、Twitter、Tumblr;公开托管的视频平台(YouTube等)进行解释和分类。复杂或抽象图像以及视频和实时视觉的情感分析是一个更大的问题,尤其是当涉及到缺少特定标签,或强迫和不准确的表达时。复杂的视觉情感分析需要更高层次的抽象、文化知识以及对主观性、概念和线索的理解。获得标记的数据集很困难,创建模型以学习提取和预测表达的含义也很困难。虽然最近的研究给了我们很多希望,但更重要的是,它们首先还表明,在我们发明视觉测谎仪和威胁检测安全系统之前,我们可以结合潜意识面部表情和肢体语言来分析潜在威胁。离险境还有很长的路要走。音频情感分析语音聊天机器人正成为我们生活中越来越重要的一部分,在客户服务电话中经常听到某种“固定”响应或问候语。这些语音助手要么已经在使用,要么即将使用情感分析技术,尽管它还远非完美。从语调和环境中检测压力、沮丧和其他情绪是机器已经能够完成的任务之一。理解和模拟韵律和音调的能力是当今语音处理和合成的重要组成部分。现有的用于音频情感分析的情感检测方法通常与语音识别相结合。该分析的参数是一组可检测的声学特征:音高、强度、节奏、频谱系数等。慕尼黑开源情感和情感识别工具包(openEAR)是最受认可的情感分析工具包之一,能够提取更多信息超过4000个特征(56个声学低级描述符中的39个特征)。情感分析和情感人工智能的主要挑战是什么?情感AI开发人员仍然需要克服几个挑战。当今机器学习中的一个普遍概念是,情感人工智能“训练”的成功始终取决于输入数据的质量。需要更大、更好、更清洁的数据集来避免“输入垃圾,输出垃圾”的情况,这种情况会带来挑战,例如:文本情感分析中的挑战:无法识别双重含义、笑话和影射;无法解释语言和非母语人士在语音结构方面的区域差异。例如:处理书面演讲中的讽刺对于情感AI来说可能是一项艰巨的任务,因为对意义和意图的理解可能存在偏差。虽然社交媒体通常是机器学习算法挖掘的意见和意图的来源,但其中的语言无疑是特定的,不一定是现实生活中的真实言论。臭名昭著的事件,如“AI聊天机器人在推特上玩了一天后变成了种族主义者”虽然很搞笑,但仍然很常见。视觉情感分析的挑战:无法区分真实与强迫或夸大的情绪表达;不包括肢体语言;处理概念和抽象图像的问题。示例:情绪和情绪分析的一个显着应用是安全和防御应用,例如视觉测谎仪。到目前为止,与算法感知水平相关的问题存在于理解真实情感或缺乏真实情感的领域。虽然最近有一些成功的研究和开发旨在识别真实和虚假的面部表情,但这些研究和开发仍然相对较小且非常精细,例如当只涉及微笑时)。ChallengesofSpeechSentimentAnalysis:没有考虑到各种口音、地域语言模式、个人发音习惯等,很多非母语人士在说第二语言时会保留口音。除其他外,口音可以表现为过渡音调、语速和停顿变化,这些变化并非第一语言所独有。我们需要对此有一个明确的解释,否则这些转变会导致对情绪和意图的误解。这些是我们在改进聊天机器人、智能助手、家庭和商业环境中的机器人向导以及最终具有自我意识、同理心和真正理解人类表达的人工智能的过程中需要克服的问题。