当前位置: 首页 > 科技赋能

AI鉴黄师已能识别“黑词” 阿里安全AI语义分析技术再获突破

时间:2024-05-20 02:29:55 科技赋能

近日,阿里安全宣布,面对“多人运动”、“全民运动”等不断变异升级的俚语代码“五排王”,阿里巴巴AI识别黄技术能力升级,精准快速识别拦截。

这对于人工智能技术的发展具有重要意义。

让AI在不扭曲原始语义的情况下引入知识,是训练智能AI模型时需要解决的关键问题。

色情、黑字的变异升级难以识别。

在内容安全场景中,黑灰产品通常会使用黑字来绕过检测引擎。

例如“兄弟,你要来我们这里进行多人运动吗?”之类的句子。

「大号」全套玻璃滤珠、大水瓶、玻璃水壶,随时可以使用。

“这给人工智能技术带来了非常大的挑战。

”阿里巴巴安全高级算法专家开阳表示,谷歌目前发布的BERT自然语言处理模型在文本理解领域取得了突破性进展,但在识别上述俚语时仍然很难发挥作用,目前还没有实现。

可以撕掉俚语的“伪装”,辨别其“色情和毒品”的本义。

对此,凯阳解释说,技术和预训练的语言模型都有一定的局限性。

经过大量公共语料库的学习和训练,模型可以理解词、词、句子之间的语义关系,例如判断“足球”和“多人游戏”。

“运动”属于同一主题; “水壶”、“容器”和“烧水”属于同一主题。

“‘多人运动’等黑字通常是由特定事件引起的,这些事件相对随机,没有规律可循。

”凯阳表示,这样的语料库很难积累,而且比例极低,因此预训练建立建模变得不太容易。

AI技术升级可以理解文本语义。

那么,色情检测机器人能否接收“多人运动”俚语背后的事件信息,做出更准确的判断呢?凯阳表示,阿里巴巴新一代安全架构核心AI技术可以做到这一点。

他介绍,如果说以往的涉黄识别AI只注重识别直观的“图片、字符串、声音”等表面信息,那么升级后的涉黄识别AI可以理解字符串背后更深层次的含义。

如果你看到“兄弟,你要来我们这里和多人一起运动吗?”这样的句子,AI经过智能分析后可以识别为色情信息。

“升级后的AI鉴黄器增加了基于知识图谱的俚语识别能力,引入了人工经验知识,将机器智能和人工经验更好地结合起来,大幅提升了文本理解和语义识别的能力。

”凯阳介绍,这也是技术升级后的最大亮点。

只需要在知识图谱中添加新的俚语知识即可生效。

舆情事件引起的变异时间可能以小时为单位被发现,但识别只需要几十毫秒。

简单来说,就是以热点事件为中心,围绕事件本身,将相关的人物、事件、特定词语绘制成关联图。

以“多人竞技”为例,以作弊事件的新闻为核心,与事件的男女主角相关,还有“多人竞技”、“五排王”等热词。

“P团”事件引发。

由于升级后的技术可以识别出更多晦涩、有内涵的风险内容,AI技术不仅在涉黄识别领域大有可为,也大大提升了其对抗其他黑灰产品变异升级的能力。

“我们的模型可以快速感知新事件,根据事件发现新的相关词,构建知识,提供及时识别新风险的能力。

”凯阳说。