【.com原稿】2017年12月01-02日,由深圳中洲万豪酒店主办的WOTD全球软件开发技术峰会将隆重举行。本次峰会以软件开发为主题,数十位专家嘉宾将带来众多精彩纷呈的技术内容分享环节。届时,链家高级技术总监杨峰先生将在深度学习与智能应用开发分会场与嘉宾分享主题演讲《基于数据和机器学习的经纪商评估与管理》,并进行详细讲解如何利用机器学习算法的力量,构建房产经纪人评价体系、经纪人等级状态模型、行为模型等,诚邀您莅临大会,与我们一起分享科技带来的快乐。记者对即将在大会上发表演讲的冯扬先生进行了专访。让我们先睹为快,看看他是如何看待深度学习和智能化应用在券商评估和管理中的应用。房地产行业的属性要求更高效的人员管理。对于房地产行业来说,经纪人是企业的核心“资产”。经纪人的素质直接影响到服务水平和公司业绩。经纪商的管理效率已经成为其核心竞争力。传统的多级人工管理方式在客观性和综合性上都存在效率问题。而链家拥有约15万名经纪人,分布在32个城市,涵盖二手房、新房、租赁、居住等,并随着业务的扩大而不断壮大。因此,对经纪人管理的水平和效率有着极高的要求。构建基于数据和机器学习的经纪人管理系统的出发点,是利用大数据和算法能力,辅助管理者进行判断和决策,提高房地产经纪人的管理水平和效率。它是一种辅助系统,不直接参与管理的实施,而是输出分析结果,辅助管理者进行管理。经纪商测评管理系统的基本架构如下图所示,从下到上依次为数据采集、离线分析、预测计算、结果应用。数据采集??的目的是尽可能全面地收集经纪人的所有数据,包括基本信息、职级、业绩、工作行为等,通过整理、加工成描述经纪人的特征数据;线下分析主要针对券商特征数据进行分析,描述券商个体画像、群体特征,找出不同券商群体之间的典型差异,通过引入人工管理经验,对不同群体进行标注;预测计算是针对不同的判断和预测任务,使用机器学习的方法对每个个体经纪人建立模型并做出预测;预测结果输出到相应的管理系统,作为这些管理系统的输入,辅助经纪商进行能力培训、违规核查处理、人员管理、技能培训等三大方面突出经纪商测评的优势和基于数据和机器学习的经纪商评估管理系统与传统的多层次人工管理方式相比,基于数据和机器学习的经纪商评估管理系统的优势主要体现在三个方面:1.更全面客观地刻画了经纪商的形象。中介。多层次的人工管理方式受管理者的层次、情绪、心理状态等因素的影响较大。不同层级的管理者层次不同,在标准执行和状态判断上存在较大差异。同一个管理者在不同情绪、不同时期的心理状态,也会影响判断和决策。以上缺点正是数据和算法可以弥补的。经纪人的数据和算法的标准和能力来自客观数据,不受情绪、时间和状态的影响。机器学习算法可以全面收集和分析数据。.2、从数据出发,及时发现潜在因素。多级人工管理最容易受限于高级管理人员的经验,而忽略了一些潜在因素,尤其是在面临新问题时。以反作弊为例,当改变发布房源信息的方式,让经纪人查询更方便时,哪些网络行为特征反映出经纪人在进行房漏违规操作,人工管理将耗时较长。在这个博弈过程中,管理者手动掌握信息的速度跟不上行为特征的变化。数据和机器学习的方法,可以从数据出发,及时发现潜在的异常因素,为经纪商的行为管理多了一层保障。3.大大提高数据处理效率机器学习的另一个优势在于数据处理的效率。经纪商的日常工作行为会带来大量的数据输出。这种数据的产生会随着业务的扩大和人员的增加非线性增长。管理者的培训成本决定了需要提高管理效率来应对这一问题。健康)状况。结合数据和机器学习的方法,可以节省大量的人力成本,将重复性、规律性、归纳性、有明确标准的任务交给机器去完成,协助管理者提高管理效率。基于数据和机器学习的经纪商评价和管理系统的实现从经纪商管理的角度来看,数据和机器学习的方法主要解决两个关键问题:一是对经纪商进行表征,从群体中建立经纪商模型。二是对券商进行预测,预测券商在一定约束条件下的潜在能力、成长路径、合规风险等。前者是后验问题,相当于从各个方面“量化”经纪人的特征表达。数据是其量化的基础,通过数据挖掘方法挖掘最大的模式和最突出的特征。后者是先验问题,即利用机器学习的方法,根据智能体的特点,训练出对应任务的预测和判别模型,预测新的样本或未发生的事情。其中,数据是基础,机器学习是数据处理和目标实现的方法。基于数据和机器学习的经纪商评价管理系统的基本原理如下图所示:经纪商的表征包括静态属性特征、地位特征、动态行为特征等,这些特征来自人事、财务、合同等。业务数据、交易、链接操作终端等一系列业务数据的提取和处理,使我们能够结构化地描述每个券商,形成券商的特征数据。特征数据的构建是利用机器学习辅助券商管理的基础。对于由个体经纪人数据组成的特征数据集,一方面,采用无监督学习的方法将个体集合进行分组,采用统计方法分析差异,并结合人力资源管理的经验,构建具有显着意义的经纪人能力。特征模型形成群体画像和能力映射。另一方面,利用监督学习的方法,从状态判断(判断个体agent当前状态的水平,评价是否优于、符合或低于其实际水平),增长agent的路径规划(预测更适合agent的下一步个人发展目标,以及实现这些目标需要改进哪些方面),brokerriskprediction(离职、违规等风险预测)协助经理人进行经纪人的决策和管理。发现应用中的问题、构建经纪人能力模型解决问题、预测经纪人离职风险、判断违规行为和风险预测是??当前基于数据和机器学习的经纪人评估管理系统的主要应用场景。其中,券商能力模型建设包括券商服务能力、专业技能、成长潜力、创新能力、团队贡献能力,覆盖10万券商、20多个城市。经纪人离职风险预测确定的离职风险经纪人半数以上会在一个月内离职(准确率>50%),五分之一的经纪人在离职前能及时发现有离职风险(召回)>20%)。违规判断和风险预测,使券商虚假进场行为判断(模型判断+离线验证)效率比人工策略(策略规则判断+离线验证)提升4倍,每月可自动发现数百例房源泄漏事件(事后,模型判别+人工验证),目前正在研发事前风险预警。在应用过程中,最常见的问题有两个:结果的可解释性和实际效果的验证。1、系统输出的结果适合辅助人力资源管理经纪商,尤其是涉及到判断违规等问题时,需要对结果的原因进行说明,而机器学习本身就是一种相关性计算,以及结果的可解释性随着算法的增加而增加。随着模型复杂度的增加而降低。目前情况下,链家采取的是数据链路回溯的方式。对于高危结果,将计算中的数据链路反向,引入人工方式对链路中的可疑点进行检查判断。2.效果验证,在离线状态下很容易验证模型对测试集的效果,并将结果用于辅助broker管理。当管理者按照预测结果进行干预时,实际结果可能会受到影响(例如,有离职风险的经纪人在管理者介入后放弃了离职的想法)。目前链家采取的应对方式是:在正式上线前不引入管理层干预,评估效果,在正式上线后比较其他相关指标在大时间尺度上的变化(比如月周转率)时间尺度)同比、环比)以及不同城市和地区之间的比较。虽然基于数据和机器学习的方法很好,但它们仍然需要成长。冯洋表示,基于数据和机器学习的方法的使用主要有两个条件:一是行业数据建设的程度,二是行业水平。行业各业务环节的标准化程度。说到底,都是对数据的需求。前者是对数据量的要求,后者要求数据达到一定的规模和业务的覆盖范围;后者是对数据质量的要求,以便能够有效地量化特征。链家之所以能用数据和机器学习的方法,一方面是因为,经过多年的信息化,大部分线下的操作、行为、数据都在线上了,利用线上的信息系统来收集和管理基础经纪人的信息。信息、行为数据、业绩状态、操作流程……,比较全面的经纪商所有数据集合;另一方面,房地产领域经过多年的发展和转型,各个环节都形成了相应的行业规范和基本原则。评价标准。拥抱互联网,开启信息化进程最后,冯扬先生简单介绍了链家的信息化进程。链家从2010年开始信息化和标准化,前期主要通过与第三方公司的战略合作,对房地产交易进行标准化,收集线下信息,进行数字化管理。2014年,链家网正式成立。通过互联网,将经纪人的经营流程、房源和客源管理、信息服务等全面线上化,打通了各业务环节的线上信息接入、线下经纪服务和数据。收集完整的恢复循环。2015年底以来,链家加快房产大数据化进程,以房源信息为切入点,结合线上录入、采集、核实、发布等手段,建立100%真实的房源数据库,逐步整合房源信息。分布在各个业务系统中的房产数据数据被收集、整理、管理,构建以“房子(housing)-客户(customer)-人(broker)”为核心的大数据网络。提高信息在网络中流动的效率。目前“链家网-数据战略部”涵盖大数据、搜索平台、NLP、策略算法等团队,负责链家地产的大数据建设。同时,结合数据挖掘、机器学习等手段,以数据产品、策略产品、数据和能力输出服务于房地产交易的买家、卖家和经纪人,同时依托大数据系统推进标准化进程房地产交易行业。[讲师简介]杨峰,博士北京理工大学信息工程博士,链家网数据战略部高级总监。曾在新浪微博、腾讯、搜狗等互联网公司担任推荐技术专家,从事推荐算法研究和推荐系统研发。研究领域为数据挖掘、机器学习、推荐系统等,主持并实施了社交媒体数据挖掘、社交网络用户关系模型构建、微博推荐系统及系统构建、微博视频语义分析系统等。加入链家。2017年负责链家网数据挖掘、大数据产品、策略算法等方面工作。使用优惠码【2017WOTDSZ】,跟我一起去WOTD全球软件开发技术峰会吧。20%折扣,仅限72小时!详情点击www.wot.51cto.com【原创稿件,合作网站转载请注明原作者及出处.com】
