6月21日,WOT2019全球技术峰会暨全球人工智能技术峰会在北京JW万豪酒店举行。峰会围绕人工智能领域共性技术、应用领域和企业赋能三大主题。商业创新、智能产业赋能等,共12场,42个话题的分享与探讨。6月21日下午,通用技术主题峰会正式拉开帷幕。机器学习实践、搜索与推荐算法、知识图谱技术、自然语言处理与语音识别四场专场同步举办。十多位讲师为到场嘉宾带来了精彩的技术分享。. 目前,基于人工智能的搜索推荐算法逐渐占据上风。如何根据自身业务数据的特点设计出适合的深度推荐和搜索算法,同时设计合理的架构保证算法的稳定运行是搜索和推荐算法专场的主要关注点.6月21日下午的搜索推荐算法分论坛,第四范式推荐业务算法团队负责人程孝成、荔枝FM推荐系统架构师庄正中、金山西山居游戏AI技术专家黄洪波,从不同的应用场景出发,详细讲解了搜索推荐算法在不同领域的实际应用和落地案例。 程孝成:构建现代推荐系统需要克服哪些困难 作为本次论坛的第一位演讲嘉宾,第四范式推荐业务算法团队负责人程孝成带来了《搭建现代推荐系统需要迈过哪些难关》的主题分享,介绍了目前的推荐系统,系统如何同时服务于用户增长、业务变现、用户体验等多元化目标,阐述了推荐系统各模块的发展现状,以及各环节实施难点该项目。 推荐系统已被证明可以提高业务效率。在内容阅读场景中,通过推荐系统大幅提升产品流量和收入的案例不在少数。随着推荐系统的发展和成熟,商业应用对推荐系统提出了更高的要求。 程小程表示,推荐是门槛比较高的技术,从头开始很难。而通过云服务的推荐系统,可以帮助其他企业快速布局推荐业务,提高转化率和收入。他认为,要想把推荐做成一个比较高级的系统,需要从三个维度来划分:一是从业务维度看核心算法;二是从算法维度看如何服务好目标;内容是什么。 接下来的时间,程孝成详细介绍了推荐系统的构建过程,从业务语言入手。 程孝成表示,大部分需要推荐的场景和推荐产品,都可以追溯到商业模式,也就是流量变现,而流量变现分为流量和商业目标两部分。从流量的角度来说,指的是有多少人使用了产品,使用了多长时间;从业务目标来看,是指基于流量实现多少收入。程孝成强调,流量变现可以看作是一个漏斗。上层的数据量一定很大,数据量大了才能更快的出效果。接下来要做好产品,根据用户行为精准推送内容,提升产品体验,聚焦产品增长。完成这两步之后,就需要考虑产品的变现,需要优化付费项目,将算法能力输出到广告场景,从而提高点击率、转化率等。 从算法的角度来看,召回、建模、干预是最基本的三步推荐流程。推荐是指选择适合用户的时间段进行推荐,覆盖一屏内容;模型是指算法工程师根据业务建立一套算法模型,并根据不同的业务采用不同的算法模型。最后,必须在业务的各个方面实施干预措施。 程孝成表示,一个成功的推荐系统必须设定足够明确的目标,并且目标必须是可衡量的和可量化的;第二,推荐材料要足够丰富;第三,对产品指标和优化要有一定的了解。他强调,在方法论上,推荐应该尊重经验进行优化,因为算法是一门实验科学。对于好的项目来说,每一个idea都来自于观察提出的假设,以及基于假设的优化计划策略,而这个策略是否真的生效需要最后去验证。因此,在理想和高效的场合下,可以同时在线运行几个或十几个实验。 庄正中:荔枝APPUGC推荐系统探索与实践 接下来,荔枝FM推荐系统架构师庄正中在《荔枝APP的UGC推荐系统探索与实践》上进行了主题演讲。他首先介绍了荔枝的推荐理念,内容理解、用户理解、算法模型、交互设计四大关注点;随后介绍了荔枝推荐系统的主要架构、音频推荐系统构建中遇到的困难和应对策略,以及提取音频内容特征和新的声音发现机制。 庄正中表示,作为以音频为媒介的UGC平台,公司对平台推荐的概念有三个理解:一是让用户听到世界;轻松表达自己。以用户听天下为例,其实就是在用户和内容之间建立联系。推荐系统可以看成一个点对点的模型,用户可以看成一个节点。推荐系统要做的是连接更多的用户节点,连接更多的内容节点,同时让用户节点产生受众,增加节点之间的数量和长度。在这个过程中,推荐算法是推荐系统中间的一个环节。 至于发现语音的才能,就是让用户通过平台来表达自己,发挥自己的才能。由于每天都会产生很多新用户,需要解决资源分配和用户需求的问题,那么如何为推荐算法以最合理的方式分配固定资源,使平台的整体收益最大化,是需要解决的问题。算法呢。 接下来的时间里,庄正中结合荔枝的一些实践,从音频处理、探索新应用、发现声音价值三个方面深入解读了荔枝推荐的一些实践和经验。他表示,在算法方面,荔枝更注重如何帮助长尾新内容的发现更加公平,因为很多推荐算法的长尾能力很差,热度效应很重,这将不断加强系统的马太效应,对头部的依赖性会很大。因此,为内容提出了动态权重。在内容理解和新内容发现方面,先用不同的算法进行语音识别,然后对内容进行分类,再次设置不同的关键词方便搜索,最后重新定义内容,适合什么样的场景,什么样的人群听。 据庄正中介绍,荔枝将使用两个系统来分析新内容的质量。一是主播的价值体系,所有的用户行为反馈都会反馈给主播,评价主播的好坏;塑造漏斗模型,不断吸引粉丝内容和用户。 据了解,荔枝的发现系统(推荐系统)首先会进行内容分析和流量测试,准备不同的流量测试通道暴露在不同的引擎中,每个引擎会同时使用一个算法来提供。对于算法的好坏,会有两个判断指标,一个是点击率是否达到平均值,另一个是评估内容。当然,这些都是有数据分析支持的。因此,能否保证数据的实时性,能否采集到想要的数据,能否保证数据的正确性,都是基于内容的推荐算法。 最后,庄正中从一个新节目的制作过程中详细介绍了推荐算法的实现过程,并着重介绍了一些典型的推荐策略,例如利用强化学习处理用户兴趣探索的Explore&Exploit算法,以及采用DSSM作为长期的Tailrecall尝试,参数降维FFM排序算法,产品运营策略+机器学习融合模型排序等。庄正中表示,推荐系统的最终目标是让主播有希望,让用户发现新的内容,并最终衡量内容的质量和系统的多样性。这是荔枝推荐系统的一个公平性指标。 黄洪波:推荐系统在《剑网3推杆》项目中的实现 作为压轴分享嘉宾,金山西山居游戏AI技术专家黄洪波分享了推荐系统的实现在《剑网3推杆》项目落地体验。他表示,游戏娱乐也是推荐系统的重要应用场景之一。《剑网3推吧》是《剑网3》玩家首选的娱乐聚集地,集官方资讯、趣味内容、玩家社交、创意分析、专业工具、游戏视频及辅助工具于一体,提供实时专业竞技数据和游戏互操作的社交服务APP。 黄洪波分享了如何基于特征选择、离线计算和在线预测三大阶段进行个性化新闻推荐,并结合他在《剑网3推送栏目》的实现经验对推荐进行了详细讲解project系统的结构和流程总结了各种常见问题和解决方案。 《剑网3推吧》推荐系统架构流程是,用户进入AI交互界面后,每一次点击或评论都会记录用户的行为,并将用户的行为放入数据中心进行数据存储和整合,包括线上行为和线下行为;之后通过一套专业的算法计算线上线下数据;最后对计算结果进行排序。黄洪波表示,推吧推荐系统架构将遵循多模型联合评分归一化策略。据介绍,所谓归一化,是指将所有数值压缩到同一个区间内,保证数据在同一个可以比较的区间内进行比较,倒序排序,得出最终结果。 通过推送栏目推荐系统架构流程,剑网3点击率提升53%,阅读率提升11%,点赞数达到15%,评论数达到4%,浏览量的最爱达到了22%。 演讲最后,黄洪波着重分享了召回结果不均的问题及解决策略。他表示,召回结果不平衡主要是召回过多和召回过少。《剑网3推杆》的解题策略是采用多模型组合,因为每个模型都有一个数据级结果,数据级结果的交集命中率会比较高,所以可以排序和辅以多模型联合评分归一化策略。如果召回过多,可按分数从后往前删除。如果召回次数太少,根本原因是模型的质量。这时候可以增加recall算法和扩展参数,使用增量纬度将recall算法从less改成more。补充召回次数后,使用排序策略Sort得到想要的结果。
