当前位置: 首页 > 科技观察

七分之一的在线评论是假的,人工智能能帮上忙吗?

时间:2023-03-17 22:38:15 科技观察

目测,评论区是中国文学大师密度比较高,骂人比较多,调侃比较多的地方。A站和B站也把评论当成弹幕播放。由于不同的“评论”文化,平台型APP体现出不同的审美和品味。知乎体和叶庆辉已经成为“时尚”代号。在宏观层面,“网民评论”被定义为具有舆论属性和广泛的社会动员能力。因此,调查、约谈、停业、整改、审计等也是管理机构常用的“大锤”。评论区是不可忽视的公共区域。社区拥有一批认同社区品牌的活跃用户,并产出大量优质内容,是社区的幸事。从表面上看,“评论区”肩负着社区氛围群的重任,是互联网的“公共场所”。在幕后,分享意见会影响消费决策,进而影响业务。(根据英国政府数据,仅在英国,在线评论每年影响约280亿美元的葡萄酒和旅游预订交易。)而且评论区也不是乌托邦,大众点评(数量和质量都不高,还有很多没营养的口水评论)小红书(巨魔多,付费版高级评论者很多)淘宝(数量多,看腻了,返现,好评)马蜂窝(举报别人评论)偷偷被锤过)这不是单一现象。媒体CNN甚至抛出一个数字:在全球互联网上,七分之一的葡萄酒酒店在线评论是假的。“评论区”常在青山,柴火不断,但人工智能(AI)的重要方向,自然语言处理(NLP),让计算机像人类一样理解“中文/文字”。群众高呼,请AI赶紧上线,内容检测,喷子识别,淫秽内容删除,不良内容处理。1.自然语言处理技术。说白了,NLP技术已经在各大互联网公司得到了很好的应用。已经应用于搜索、推荐、广告、智能助手等多个系统中。技术团队坚守学术前沿。先看行业,新东方教育在2018年开始有学生用户画像项目进行分层分类。NLP技术对相关结构化数据文本和数据进行标注,并增加用户圈子选择和行为事件分析功能,各业务部门可根据标签对学生进行圈子。汽车之家机器学习组是汽车之家用户产品中心下的认知智能组。NLP技术支持用户选车和多轮对话。2020年,京东智联云利用情感识别、语音交互等智能技术,在双十一首小时为138万人次提供了情感智能客服服务。美团搜索使用机器来理解用户的各种查询意图。但是,用户意图会随着时间的推移而发生变化,在有限的关键词中诠释出非常丰富的信号,用于各种搜索的召回、排名和展示。美团有专门的人工智能平台/搜索和NLP部门。此外,美团大脑通过挖掘关联各种场景的数据,利用人工智能算法让机器“读取”用户对商家的公众评论,了解用户对菜品、价格、服务、环境等方面的偏好,构建信息关于人、商店和产品,场景间的知识关联可以被认为是“餐饮娱乐的知识大脑”,支持搜索、SaaS收银、金融、外卖业务服务。用户评论作为一种非结构化文本,包含大量表达不规范的“词”。根据句子上方的一系列“词”,机器预测后面会跟哪个“词”。预测是概率。句子中的每个“词”都有一个基于上述预测的过程。所有这些“词”出现的概率成倍增加,值越大,说明这句话越像人说的句子,而不是废话、胡说八道。因此,除了人类,机器也能判断哪句话更像人话。“黄鹤楼”这个词可能有三层意思,武昌蛇山顶的名楼,北京的商人,湖北的香烟品牌。AI算法是不傻,预测可以结合上下文,上一篇讲了长江、景点、旅游、门票价格、高层观景,不能推断这里的“黄鹤楼”就是说到香烟,倒是说到景点,可能性更大。又比如猫眼娱乐,可以获取电影、电视剧、艺人等信息,形成“字典”。但是,随着搜索量的增加,搜索的表达方式越来越多。复杂的,词典不能满足用户需求,AI模型将作为词典的补充。再看学术界,诞生了一个名为Transformer(深度神经网络)的模型,基于Transformer的BERT模型(2018年的重大技术进步),GTP模型(硅谷OpenAI实验室出品),都其中使用预训练和微调的思路来解决问题。预训练的语言模型,如同无标签文本的海洋,学习潜在的语义信息,无需为每个任务单独标注大量训练数据。语言模型预训练完成后,利用少量标注语料进行微调,完成特定的NLP任务,如分类、序列标注、句子关系判断、机器阅读理解等。总之,算法的“性能”得到了显着提升,BERT把NLP技术的蛋糕做大了。2.运营群,也是很不错的《亲爱的数据》和几大互联网公司的运营小哥聊了一会,每一个“评论”的运营都费了一番心思。抖音的评论区是双轨制,既有最热评论,也有最新评论。最新的评论可以理解为一个小池子,根据用户的点赞数,看是否继续推送。这样可以保证后面发的大神评论也能排名,是评论区推荐思路的一种应用。抖音搜索算是认了,如果评论区提问的人多了,就会有搜索的建议。但是路径太长,所以直接改成现在高热的社交视频,并且加了今日头条文章的链接。处理评论区数据的一种常用方法是对其进行结构化处理。无论是电商还是九旅APP,都构建了数十亿的评论区。这是指数据的结构化处理,因为计算机可以处理结构。它无法理解结构化和非结构化数据,所以在“理解”的时候需要先对文本进行结构化。NLP对评价进行分析,细化“分词”,加入结构化外联,相当于找到“标签”,提高了用户浏览评论的效率。英雄见仁见智,用户理所当然,人越多,观点越可信。日常生活中,我在淘宝上买的可调桌,“安装效果好”、“质量好”、“用后感觉不错”。选择酒店时,你可以看到有多少人提到了“便宜”和“舒适”,有多少人提到了“安静”和“交通便利”。显然,消费者+社区评论会有门槛,比如淘宝、小红书、大众点评、马蜂窝等,产品没有下单,没有经验的用户无法参与评论。看热闹的是门外汉,逛店的往往是内行。平台会倾向于把好评放在前排促成转化,消费后的诉求会比较多,需要专门的回应和处理。一个纯娱乐、纯讨论社区,评论参与门槛低,如抖音、快手、B站、芒果、豆瓣。总的来说,电商评论运营的不错,有卖货的需求,大家的聊天都跟产品有关。小红书的铁粉们认为,虽然很多评论都是花钱买的。大V粉丝多了就会收到广告。不过小红书整体评价还是比较给力的,和无脑大军不一样。哪怕是托儿所,写的也很诚恳。评论是“UGC(UserGeneratedContent)”,真实、新鲜,可以挖掘潜在的商业价值。对于用户来说,无论是“体验”、“干货”,还是“攻略”,每个人都需要“真实”、“有用”的评价。3、为什么没把“评论”管理好?这么硬的技术,这么高的起点,为什么不能把“评论区”经营好。这里,有三个绊脚石:第一,评论数据质量特别差,注意“特”字。数据治理水平低导致人工智能算法在很多情况下效果不佳。算法的效果与训练数据有很大关系。可以说,有了好的标注数据,普通的算法也能有好的表现。现实中,企业要想做好NLP,首先要打通基础数据。评论资料基础太差,麻袋上的刺绣没用。二是“假装”在用。反正大家都在变聪明,你就得假装在用。使用AI技术正是“老板们”所需要的。有时,工程会退化到自动化阶段,只有一小部分使用算法智能。目前做的很多,就是情感分析,垃圾评论过滤等等。AI用不好,就会变成噱头,可能会退化到最基本的统计分析图表。第三,不注意。很多互联网公司认为,评论区是第二场景,就是二等公民。说白了就是关注度不够,或者是支撑主业“(推荐和搜索)”的技术做得不够好,评论区根本就被忽略了。挖掘不够,应用的深度和广度不够。管理评审背后的驱动力之一就是满足政府行政部门的监管要求。综上所述,NLP技术对运营的号召力还不够强,影响还不够深。NLP和操作还没有形成难分难解的鱼水关系。毕业于英国南安普顿大学的AI算法科学家袁雪瑶在接受采访时也透露:“互联网厂商会采用半人工识别用户发表的评论内容,加上人工数据标注。NLP是现在在情感分析领域比较成熟,舆情分析,用户画像,这些对运营的影响会比较温和。”(一种基于深度学习的情感分类方法,可以从海量数据中主动学习文本中的语义信息,获取文本特征和情感分类,从而达到准确提取文本数据和情感的目的。比如“负面”和“正面”)平安智汇企业有限公司的一位算法专家也认为:“评论里有很多口水,分析就是自动过滤掉有价值的。NLP技术正在解决这个问题,还有很长的路要走,不是药物可以治愈的。”适度这个词特别好,NLP还有很大的战场,需要和运营结盟才能攻克业务端的问题。评论中用到的挖掘技术和方法也有很多种,规则、传统机器学习模型、深度学习模型等。虽然目前似乎还没有专门挖掘“评论”商业价值的明星AI产品,但有人注意到了。东京大学初创公司TDAILab,认为应该将人工智能工具营销到评论网站等,他们分析了4000多家日式拉面店的评论,发布了东京版“人工智能排行榜,百强拉面店”,剔除疑似“好评”与“恶意差评”,人工智能挑选评分高的店铺。“评论区”的分析,并没有直接关系到生死,但也o可以为企业降本增效不容忽视。人工智能技术需要算力、数据、算法模型和应用场景。许多人工智能公司从一开始就想改变高速列车的车轮。抱着这种雄心去敲传统企业大门的成功率很低,因为客户不信任新技术和AI公司。如果出现好评或恶意差评,消费者和餐厅都会蒙受损失。消费者找不到好店,好店也就失去了商机。1968年,加勒特哈丁在《科学》杂志上发表了一篇题为“公地悲剧”的文章。翻译成《公地悲剧》,原文中的commons也包括publicspace。评论区环境的恶化,没有人是赢家。AI点评、AI接管评论区是必然趋势。“评论”需要人才,管理“评论”更需要人才。