当前位置: 首页 > 科技观察

5对业务产生重大影响的人工智能技术

时间:2023-03-12 20:14:46 科技观察

企业需要了解图像识别、语音识别、聊天机器人、自然语言生成和情感分析如何改变其业务运营方式。人工智能技术正在融入业务的方方面面。一些重要的人工智能技术包括图像识别、语音识别、聊天机器人、自然语言生成和情感分析。需要明确的是,每种人工智能技术代表一个广泛的类别,通常包含数十个甚至数百个底层组件。反过来,这些组件通常会重新组装成更复杂的应用程序,从而为企业创造价值。例如,百货公司的人工智能机器人可以在工作中使用图像识别、视频和语音识别技术。图像识别软件将使其能够检查货架上库存的位置、价格和数量;视频将帮助它避开任何障碍物并确定其在商店中的位置;和语音识别组件将使它能够引导和招待客户。为了实现这一壮举,这些企业中的AI技术通常结合各种算法和技术,为整体任务的特定部分量身定制。它们包括符号处理、统计分析、神经网络等。下面是对五种人工智能技术的深入研究,这些技术随着时间的推移而发展,极大地改变了企业处理、分析和生成数据的方式。1.图像识别企业使用图像识别的各种方式包括:工厂生产线的自动化检查、保险中生成损失估计、识别图像中的对象、统计人数、控制制造过程、检测顾客进入商店等事件和事件和生成真实世界的模型。人工智能技术必须找到一种方法来使用各种人工智能算法可以处理的数字来描述世界。在视觉方面,研究人员发现了如何将图像划分为像素网格,以便每个像素都可以表示为一个数字。早期是用一个数字来描述每个像素点的亮度。后来发现可以用三个或更多的数字来描述每个像素中不同颜色的亮度。在1960年代,研究人员开始探索如何使用软件的图像识别功能来识别数字文档中的字符,这是光学字符识别(OCR)技术的一种原始形式。其他研究人员开始探索基于图像的场景解释技术,试图从2D图像重建3D图像。多年来,这些技术一直是机器视觉行业工具包的一部分。后来,研究人员发现图像识别可以组织成一个层次化的过程,从而更容易解释日益复杂的现象。例如,黑色和白色像素可能被识别为直线和曲线,而它们又被识别为数字的一部分。训练一种算法来学习根据这些曲线模式而不是每个像素的亮度来解释字符要容易得多。类似地,根据图像是否包含两只眼睛和适当形状的耳朵比根据每个像素中颜色的原始亮度更容易确定图像是否是猫。这种类型的处理有望推动图像识别领域的发展。然而,直到2012年左右,随着AlexNet(一种旨在支持图像识别的八层卷积神经网络)的开发,研究人员才弄清楚如何扩大识别数千种不同类型物体的过程。AlexNet等深度学习技术的美妙之处在于,模型可以自动学习执行各种图像识别任务,无需人类以编程方式指定每个步骤。研究人员展示了神经网络如何应用于不同类型的问题,这种能力也促进了深度学习在其他类型应用中的使用。今天,图像识别被用于识别货架上的产品、图片或视频中的人物、生产线上的缺陷以及自动驾驶汽车在街上遇到的物体。随着冠状病毒爆发的出现,许多企业都在开发应用程序来监控社交距离规则。商业领袖的一个重要见解是,通过在应用程序中使用多种类型的图像识别,通常可以创造更多价值。例如,智能文档处理和文档智能结合了一系列人工智能技术,包括自然语言处理和机器学习,以难以识别的格式捕获和分类数据。与光学字符识别(OCR)结合使用,智能文档处理可以分析文档的视觉布局,以确定哪个部分代表产品、发票金额或销售条款,并将该信息提供给其他业务应用程序。值得注意的是,企业中的大多数图像识别应用程序都高度依赖上下文。供应商和研究人员经常吹捧新的图像识别改进,例如在识别肿瘤方面击败医学专家的软件。但在实践中,只有在以正确的角度捕获图像的情况下,AI才能使用一组特定的设备处理这些放射图像,而人类擅长分析从许多不同角度捕获的各种图像。研究人员还发现这些图像识别应用程序的某些实现中潜伏着偏见。为了减少偏差,专家建议使用代表将要处理的特定图像类型的数据来训练这些应用程序。2.语音识别需要多种算法将语音转换为文本并为数字处理做准备。虽然语音识别系统越来越好,但即使是今天更好的语音识别系统仍然容易出错,需要在医疗数据采集等安全关键型应用中进行一些验证。贝尔实验室的研究人员于1952年开发了第一个用于识别单个数字的语音识别系统。到1962年,IBM推出了Shoebox机器,它可以理解16个单词。到20世纪80年代中期,研究人员使用隐马尔可夫模型等统计技术来开发可以理解20,000个单词但单词之间有停顿的应用程序。1990年推出第一款消费级听写产品DragonDictate,可以根据语音自动输入文字。然后AT&T推出了一款语音识别应用程序,无需人工即可转接电话。这些早期系统要么具有适合特定上下文的小词汇表,需要通过个人声音进行大量训练。从2010年开始,研究人员发现了将深度神经网络应用于语音识别的方法。这种增长的主要驱动力之一是需要找到更好的方法来表示不同类型智能扬声器的声音特性。这需要探索更好的方法将原始音频数据转换为人类习惯听到的独特声音(称为音素)(例如,单词“car”中的“c”)。研究人员还将基本的语音识别结果与更好的场景相结合,以区分同音字(bear/bare)。云计算服务现在提供各种核心语音到文本服务,开发人员随后将这些服务集成到各种企业工作流中。基本语音识别功能通过MicrosoftCortana、GoogleNow和AppleSiri等云计算服务嵌入到现代智能手机和计算机中。Amazon.com推出了一种使用语音识别技术通过其Alexa语音服务连接到智能手机之外的互联网的新方法。这些服务通常在云中承担繁重的工作。最近,谷歌通过开发更高效的算法提高了标准,这些算法可以在其Pixel手机上的语音识别应用程序中本地运行。语音识别技术在企业中的使用越来越多。一些供应商还开始开发用于自动记录电话会议和面对面会议的应用程序,以达到合规目的或更好地记录决策过程。自动语音识别还可以帮助监控呼叫中心的活动,以确保工作人员遵循正确的程序,使管理人员不必听到每一个电话。语音识别应用程序也被用于为国际旅行者自动进行语言翻译。该AI技术的其他商业应用包括家庭自动化、视频游戏交互和用于视频索引的自动隐藏式字幕。3.聊天机器人对话式人工智能技术允许应用程序以自然的方式与人类互动。第一个聊天机器人Eliza于1964年至1966年在麻省理工学院人工智能实验室开发。最早的聊天机器人在词汇量和允许的交互类型方面受到限制。这些应用程序使用决策树,这些决策树根据查询或用户对问题的回答遵循各种路径。在1980年代和90年代,这些技术扩展到自动化电话应用程序,其中交互由拨号音响应或使用IVR技术的简单单词控制。聊天机器人应用最近激增,这要归功于用于解释和响应文本查询的更好的自然语言处理技术,以及与其他服务更好的集成,使企业更容易自动设置聊天机器人来响应常见问题、接受命令或自定义响应对于给定的用户。对聊天机器人最近适用性的一个关键洞察是开发用于表示用户意图和适当响应的应用程序编程框架。面向外部的聊天机器人可以帮助自动化客户交互的许多方面。它们还允许企业以更具吸引力的方式在Facebook等各种社交媒体渠道中进行推广。企业的应用程序开发和部署方面已经见证了聊天机器人技术使用的爆炸式增长,该技术将聊天机器人与可以自动配置应用程序和基础设施并生成报告的操作工具相结合。Chatbot集成允许团队记录他们的流程,从而更容易响应重复出现的问题或确定特定流程过去的执行情况。聊天机器人工具开始进入业务的其他方面,以帮助记录部门??内部或部门之间的各种通信,尤其是随着越来越多的公司采用Slack和MicrosoftTeams等消息传递应用程序。财务部门可以使用聊天机器人来生成和跟踪重要业务指标的状态。销售团队可以使用聊天机器人来收集有关关键客户的数据。聊天机器人还可以帮助促进其他类型的内部交互。例如,员工可能会联系人力资源聊天机器人,询问有关其福利状况的问题或请求休假。企业还使用聊天机器人自动与IT系统管理交互,以处理简单问题或自动对更复杂的问题进行分类。4.自然语言生成随着数据量的增长,很难为员工或客户确定正确信息的优先级。自然语言生成(NLG)应用程序可以帮助查找、组织和总结对给定用户最合适的见解。根据业务用例,这种AI技术有不同的风格。作为Gartner创造的新应用程序类别的一部分,自然语言生成开始作为前端添加到商业智能和分析应用程序中。这些技术结合了解释纯文本查询和生成适当的纯英语分析摘要的能力。例如,NASA构建了一个自然语言生成(NLG)应用程序,以改进它向业务用户提供的有关不同保险产品销售的答案。这种人工智能技术的另一个特点是改进了向用户呈现产品信息的方式。在这些类型的应用程序中,自然语言生成引擎可以根据用户偏好自定义产品描述。例如,可能会向技术性更强的用户深入介绍新手机耳机等产品的技术特性,而对注重时尚的买家则提供其外观和感觉的美学描述。自然语言生成(NLG)还可以帮助改善将内容翻译到新市场的方式。Trulia使用自然语言生成(NLG)自动生成房地产列表的社区描述。自然语言生成(NLG)也被用于为美联社制作基本新闻文章。EsquireSingapore甚至制作了一期特刊,介绍人工智能应用的故事。然而,这项人工智能技术还处于起步阶段,专家警告说,企业和医疗等关键任务应用需要新型的质量控制。尽管如此,企业仍可能受益于自然语言处理框架最近的各种改进。新的自然语言处理指标正在出现,以帮助企业评估给定框架的效用并改进自然语言生成(NLG)应用程序的这些实现。5.情感分析人们在写事件、品牌、政客和其他事物时,往往会表达不同类型和强度的情感。情绪分析领域始于1950年代,当时营销人员分析了书面文件的语气。但这是一个非常手动的过程。尽管如此,现在几乎每个人都会在社交媒体、博客、新闻评论、评论、支持论坛以及与公司的往来信件中留下情感数字痕迹。包括自然语言处理、机器学习和统计在内的各种人工智能技术被用来分析这些数字足迹的情绪基调。这些工具有助于跟踪产品或服务的变化如何影响客户,而无需直接询问人们。它还有助于密切关注竞争对手的产品和活动。情绪分析的另一个用例可以识别所谓的品牌影响者,使企业能够与可以就如何改进服务或产品提供更好建议的个人建立更牢固的关系。情绪分析还可以帮助确定有关客户或潜在客户可能感兴趣的重要趋势,以便企业可以改进其当前产品或创建新产品来满足这些需求。企业还可以使用情绪分析来确定其品牌可能遭受损失的具体原因,例如等待时间长、质量差或概念不佳。企业正在内部和业务中使用这种人工智能技术来帮助了解和提高员工士气和福祉。在此用例中,情绪分析可以分析员工职位,以帮助了解重要问题或管理层变动可能对他们产生的影响。更复杂的情绪分析应用程序使用人工智能来理解语音和面部表情所传达的情绪。此分析有助于识别支持电话期间的情绪变化,或衡量客户对商店货架上新产品的情绪。Netflix甚至尝试使用面部表情情感分析来改进电影预告片。然而,一些研究人员警告说,这些情绪分析的应用可能会受到可靠性、特异性和普遍性问题的影响。