SocialMedia与传统网络媒体最大的区别在于它通过建立人与人之间的联系,极大地提高了信息的生产和传播。效率。社交媒体中的每个人或组织同时扮演着信息生产者、传播者和接收者的角色。在社交媒体背景下,用户更方便地生产、传播和接收信息,使得之前相对集中的用户兴趣和行为更加碎片化和离散,因此社交媒体中用户模型的构建和应用也发生了翻天覆地的变化。变化。经过六年的发展,微博已经成为国内社交媒体的中坚力量。本文从微博的角度,阐述了微博用户模型的目的、维度和建模任务,作为后续微博用户模型相关文章的总览。1建立用户模型的目的是描述每一个用户,这是任何社交服务都需要面对的问题。不同企业对各自业务的需求不同,建立用户模型的动机和目标也存在一定差异。从微博本身来看,建立用户模型的目的包括:(1)完善和扩展微博用户信息的首要动机用户模型是为了理解用户,从而提供更好的服务。但用户在微博上提供的信息不完整,部分原因是平台引导机制所致(如填写公司和学校信息时,对应的机构名称或学校名称不在列表中),有时用户不愿意或懒惰提供(比如一些非必需的物品),用户输入的内容也很难规范……另外,一些隐含的或经常变化的信息(比如用户兴趣,业务偏好、地理位置变化等)也需要通过用户行为进行挖掘。(2)分析微博生态,不仅要了解用户,更要了解自己。在掌握用户信息的基础上,平台可以分析自身情况,从相对宏观的角度把握微博生态环境,为后续优化发展提供方向。例如,通过对用户信息的聚类,可以对微博用户进行分组,掌握不同群体的活跃度、信息传播和引爆方式、行为和兴趣偏好等。(3)支持微博业务中的所有业务微博与用户模型有着直接或间接的关系,无论是提升用户价值的兴趣推荐,提升商业价值的精准广告,还是针对特定人群的内容运营和用户模型,都是其不可或缺的基础支撑。用户模型可以直接用于兴趣匹配和关系匹配的推荐和投放;间接地,它可以促进基于用户模型中相似兴趣、关系和行为模式的信息和帐户的传播和增长。#p#2微博用户模型的维度划分一个用户可以从多个方面进行描述,也就是说可以从多个维度来考虑和构建用户模型。微博用户作为一种社交媒体,通过平台上的某些行为(如发送微博、点击图片、播放视频、浏览信息流等),以及通过其他行为(如转发、评论、点赞等)产生或获取信息。等)…)传播信息。信息的传播是通过用户之间的社会关系进行的,在信息的生产、消费和传播过程中对信息的选择和过滤反映了用户的兴趣倾向。因此,我们可以按照图1所示的四个维度对微博用户模型进行划分,即属性维度、兴趣维度、社交维度和行为维度。图1微博用户模型维度划分用户属性和用户兴趣是用户画像中通常包含的两个维度。前者描述了用户的静态属性特征,比如用户的身份信息(性别、年龄、受教育程度、学校、工作单位……),后者用来描述用户在信息筛选中的倾向性(比如用户的兴趣标签、能力标签等)。社会维度从社会关系和信息传播的角度描述用户。在社交媒体中,用户不再只是个人。用户与用户之间的社会关系构成了网络。信息在这个网络中高速流动,但这种流动并非无动于衷。信息的起点、经历的关键节点以及这些节点形成的关系圈是影响信息流动的重要因素。社会维度就是量化这些因素以及它们对它们的影响程度。行为维度是一个比较新的研究方向,目的是发现影响用户属性和信息变化的行为因素,分析典型用户群体的行为模式。一方面,可以通过行为模式的复用,促进微博平台用户的增长;另一方面,也有利于平台了解用户,发现新的或异常的用户行为。#p#3用户建模任务3.1属性和兴趣维度(用户画像)属性和兴趣维度用户模型都可以归为用户画像的范畴,即标注用户信息。一方面,标注是将用户信息结构化,便于计算机识别和处理;另一方面,标签本身也准确无误,也有利于人工整理、分析和统计。用户属性是指相对静态和稳定的人口统计属性,例如:性别、年龄段、地区、教育程度、学校、公司……这些信息的收集和建立主要依靠产品本身的引导、调查、第三方-partyprovision等,在此基础上需要Supplementation和cross-validation。用户兴趣是一个更加动态和多变的特征。第一,兴趣受人群、环境、热点事件、行业等影响,一旦这些因素发生变化,用户兴趣就很可能发生迁移;其次,用户行为(尤其是指在互联网上的行为)是多样的、碎片化的,不同的行为所反映的兴趣也大不相同。在用户兴趣分析过程中,主要考虑以下几个方面:(1)标签来源:并不是所有的词都适合作为用户标签,这些词本身应该是可区分的、无歧义的;此外,还需要考虑来源的全面性,除了用户提供的兴趣标签外,用户在使用微博过程中的行为、构建的用户关系等也能反映出用户的兴趣,所以也要考虑到这一点。(2)权重计算:在获取到用户的兴趣标签后,还需要为用户对这些标签分配权重,以区分不同标签对用户的重要性。(3)时效性:随着时间的变化,用户的兴趣会发生变化。有些兴趣会贯穿于用户使用社交媒体的全过程,而有些则受热点、环境因素等的影响。(4)兴趣与能力的区分:用户对某一方面的兴趣只意味着他愿意接受这方面的信息,但不代表他有能力产生相关内容。区分兴趣和能力有助于预测兴趣相关内容的潜在生产者和传播者。3.2社交维度如果将微博中的用户看作节点,将用户之间的关系看作节点之间的边,那么这些节点和边将形成一个社交网络拓扑,或者称为社交图谱。微博里的信息就是在这张地图上传播的。从社交维度建立用户模型,需要从不同角度详细、全面地描述这个社交图谱的特征,反映影响信息传播的各个层面的因素,寻找节点之间的连接思路,以及来描述图本身的结构特征。.其中包括:(1)个体用户对信息传播的影响:不同的用户在信息传播过程中具有不同的重要性,影响力大的用户比影响力小的用户更能促进信息的传播。(2)量化用户关系的距离:衡量直接相关(关注、被关注、共同粉丝……)的用户之间的距离,关系越近,用户之间越容易发生信息传播行为.(3)延伸用户之间的关系:通过用户之间的直接关系(关注、被关注、互粉……),可以关联本身没有直接关系的用户。(4)寻找相似用户:微博本身的非对等关系可以认为是一种认证,用户基于兴趣、线下关系或其他原因响应线上联想。那么关系维度上的相似用户至少可以反映出他们在某些因素上的一致性。(5)关系圈识别:从关系图谱本身的结构出发,有助于从中发现关系密切的群体,有助于信息的精准传递和推广。上述关系建模的任务可以看作是一个逐渐深化的过程,从“个体”-->“关联”-->“相似性”-->“群体”。3.3BehaviorDimension用户行为分析和行为模型的建立有两个任务:对典型个体行为进行时间序列切片,分析与用户增长相关的因素;统计典型群体的行为,建立他们的行为模型。(1)典型个体行为时间序列分析所谓典型个体是指在一定时期内增长显着的微博用户。比如从一个新用户的新注册到成百上千的粉丝,需要有一个积累的过程。有的用户积累快,有的用户积累慢,这些积累快的用户可以作为典型个体;或者一些用户在某个阶段积累。传播力是有限的,但在某一时刻传播力激增,无论是交互还是内容传播的覆盖范围都变化很大,也可以作为典型个体。对于典型个体,需要挖掘与用户增长相关的行为因素。基本方法是对时间进行分段,得到不同时间片内的用户行为统计,以及每个时间片内的用户增长指标(粉丝数、互动率、传播力等),如图2所示。在此基础上,我们使用相关性分析或回归分析,根据用户行为统计数据的变化,分析哪些因素与用户增长相关。图2时间分片上的用户行为统计(2)典型群体行为模式分析对于典型个体,从用户的基本信息、人口统计信息、兴趣维度等方面,可以将相似的典型用户划分为同一群体,称为典型群体。将典型群体中的用户按照成长程度进行划分,按照不同的成长阶段统计用户行为,即建立典型群体的行为模型。例如,对于“北京,20-30岁,女性,电商领域,普通账号”这样的典型群体,按照粉丝数量将其分为初创期、成长期、快速提升期、成熟期,沟通能力,互动率。...等阶段,对不同成长阶段的行为组合进行统计,结果构成群体的行为模式。4小结构构建用户模型是社交媒体的基础工作,涉及数据、统计、挖掘等各个方面的技术和手段。根据微博的特点和业务需求,简要描述了用户模型构建的目标和任务。全文不涉及具体方法和原理,后面会有相应的技术文章介绍。需要指出的是,与传统网络媒体不同,微博作为社交媒体的最大优势在于引入了非对等的用户关系。这种关系不仅让沟通更有效率,也让考虑关系因素成为用户建模的一个因素(无论是属性、兴趣、社会或行为维度)都是非常重要的手段。想了解更多相关内容,请关注——微博:wbrecom公众号:微博推荐平台
