用Python可视化社交网络，看看你的网络有多大影响力

时间：2023-03-26 01:23:56 Python

我们平时会用很多社交媒体，比如微信、微博、抖音等，在这些平台上，我们会关注一些KOL，在同时，我们身边的亲朋好友也会关注我们，成为我们自己的粉丝。慢慢的，随着时间的推移，关注度和粉丝量的积累，这一层关系网就会不断的增长，大量的信息也不断的通过这个关系网传播出去。因此，分析这些社交网络对我们的决策也至关重要。今天我们使用一些Python第三方库来可视化社交网络数据源，本案例中使用的数据是来自LinkedIn的社交关系数据。由于笔者之前在美国留学，正在国外寻找实习和工作，所以通过LinkedIn投递了简历和联系了同事。久而久之，他逐渐形成了自己的社交网络，下载了这部分社交数据，然后使用pandas模块读取，由于涉及隐私信息，数据不便提供。如果你有LinkedIn账户，你可以通过设置中的“获取数据副本”导出这样的CSV关系数据。或者你可以根据这个表头自己生成一个假数据：数据读取和清理先导入需要的模块importpandasaspdimportjanitorimportdatetimefromIPython.core.displayimportdisplay,HTMLfrompyvisimportnetworkasnetimportnetworkxasnxneedsto读取数据集df_ori=pd.read_csv("Connections.csv",skiprows=3)df_ori.head()接下来我们清洗数据，具体思路是去掉空值，以及中的“Connectedon”列数据集包含一个日期，但是数据类型是字符串，所以我们还需要将其改为日期格式。df=(df_ori.clean_names()#去掉字符串中的空格，把大写改成小写.drop(columns=['first_name','last_name','email_address'])#去掉这三列.dropna(subset=['company','position'])#去除company和position列中的空值.to_datetime('connected_on',format='%d%b%Y'))outputcompanycompanyxxalpositionconnected_on0AcXXXX2021-08-151XXXXXXXXXXXX副合作伙伴2021-08-142xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxtxxxxxxxxxtxxxxxxtxxxxtxxxxxtxxxxxxxxtxxxxxxxxxtripanter区分所有df['company'].value_counts().head(10).plot(kind="barh").invert_yaxis()你在哪些公司工作的输出？看一下我的网络，大部分是职业df['position'].value_counts().head(10).plot(kind="barh").invert_yaxis()的输出接下来我们画一个可视化图的社交网络。但在此之前，我们需要解释几个术语。每个社交网络包括：节点：社交网络中的每个参与者边：代表每个参与者之间的关系以及关系的紧密程度。先从简单的开始画社交网络主要用到了networkx模块和pyvis模块，g=nx.Graph()g.add_node(0,label="root")#初始化自己为centralnodeg.add_node(1,label="公司1",size=10,title="info1")g.add_node(2,label="公司2",size=40,title="info2")g.add_node(3,label="公司3",size=60,title="info3")我们先创建了4个节点，分别命名。参数size表示节点的大小，然后我们将这些节点连接起来g.add_edge(0,1)g.add_edge(0,2)g.add_edge(0,3)最终出现如图下面我们首先从网络和他们的公司形象化网络。首先，我们对他们所属的公司进行统计排序df_company=df['company'].value_counts().reset_index()df_company.columns=['company','count']df_company=df_company.sort_values(by="count",ascending=False)df_company.head(10)输出公司count0Amazonxx1Googlexx2Facebookxx3StevensIns技术XX4XX4MicrosoftXX5JPMorganChase＆Co。XX6AmazonWebServices（AWS）XX9AppleX10GoldmanSachsX8Oraclexoraclex然后然后然后我们来图表图表图表图表图表＃＃g=nx.graph（nx.graph（nx.graph）（）myself')#将自己置于网络中心#遍历数据集中的每一行for_,rowindf_company_reduced.iterrows():#将公司名称和统计结果赋值给一个新的变量company=row['company']count=row['count']title=f"{company}}"positions=set([xforxindf[company==df['company']]['position']])positions=''.join('

{}

'.format(x)forxinpositions)position_list=f"
{positions}
"hover_info=title+position_listg.add_node(company,size=count*2,title=hover_info,color='#3449eb')g.add_edge('root',company,color='grey')#生成网络图nt=net.Network(height='700px',width='700px',bgcolor="black",font_color='white')nt.from_nx(g)nt.hrepulsion()nt.show('company_graph.html')display(HTML('company_graph.html'))输出同样，让我们??可视化网络中各个位置的分布先做统计排序df_position=df['position'].value_counts().reset_index()df_position.columns=['position','count']df_position=df_position.sort_values(by="count",ascending=False)df_position.head（10）输出位置计数0软件工程师XX1数据科学家XX2高级软件工程师XX3数据分析师XX4高级数据科学家XX5软件开发工程师XX6软件开发工程师IIXX7创始人XX8数据工程师XX8数据工程师XX9BusinessAnalystXXXXx=nx.Graph()g.add_node('myself')#将自己置于网络中心for_,rowindf_position_reduced.iterrows():#将帖子名称和统计结果赋值给新变量position=row['position']count=row['count']title=f"{position}–{count}"positions=set([xforxindf[位置==df['position']]['position']])positions=''.join('
{}
'.format(x)forxinpositions)position_list=f"
{positions}
"hover_info=title+position_listg.add_node(position,size=count*2,title=hover_info,color='#3449eb')g.add_edge('root',position,color='grey')#生成网络图nt=net.Network(height='700px',width='700px',bgcolor="black",font_color='white')nt.from_nx(g)nt.hrepulsion()nt.show('position_graph.html')输出以上是社交网络关系的可视化分析。这里的数据结论对你没有任何参考价值，但你可以在类似的分析场景中使用该方法。最近花了几天时间整理了一个Python入门理论+实践进阶教程。这可能是您见过的最好的学习材料之一。独家打造，完全免费，需要的同学可以关注gzh【Python编程学习圈】，发送“学习资料”获取~

上一篇：PythonQuickAdvance2——可以提高开发效率的快捷键

下一篇：数据处理【瑞士军刀pandas攻略】：3.数据汇总与映射

用Python可视化社交网络，看看你的网络有多大影响力相关文章

2014年全球可穿戴设备市场应用报告分析

重新思考可穿戴设备和数据利用！为什么这么难坚持

苹果 Siri 或能识别多个用户，在声纹识别之路上更进一步

使用可穿戴设备支付！你能杀掉二维码吗？

AirPods 电池已过保修期，更换费用为 49 美元

《2015上半年中国智能穿戴行业数据分析报告》用户行为分析

韩国研发纳米级3D打印技术将应用于可穿戴设备

虚拟现实头盔Virglass Phantom使用指南

腾讯集团副总裁程武！用科技和文化支撑公益梦想

LG OLED电视C7国外测试！用了半年多屏幕出现明显烧屏

热烈讨论！你能用什么来拯救你？可穿戴设备

如何使用Apple Watch远程控制Apple TV 4

用AI连接你的生活！ TOPPERS将在GMIC大会上展示多

苹果新品发布，搜狗地图成为CarPlay第三方导航应用首选

德国Bragi公司与IBM合作开发用于工作场景的智能耳机Da

Miele干衣机使用回顾，黑科技可以拯救你晚期懒癌综合症

明基智能商用 E610 小剧场 - 如果机器可以互相扇风

难怪智能手表的电池寿命很差，因为它们都使用手机处理器

警察用智能眼镜“AXON Flex”！现实版的机械战警？

智能手表的终极形态！看起来像手表，用起来更像手表

最新推荐

1石墨烯可以将普通纸张变成用于柔性显示器和可穿戴设备的新材料

2浪潮金库大数据可视化分析平台为企业资金管理打造“千里眼”

3诺基亚用时尚诠释智能手表的未来

4除螨虫有用吗？那么它只是一个吸尘器吗？

5Apple Watch 外置电池发布让使用时间翻倍

6网易AI负责人李晓燕！七年磨一剑，探索AR四大应用场景

7波音工人开始用谷歌眼镜组装飞机

8林林的爆料！可穿戴设备的实用性还不够

9迪顶科技newifi雾计算入选“四川省优秀区块链产品及应用案

10比尔盖茨！没想到你可以用智能手表来管理你的牛群

猜你喜欢

1重庆第二师范学院推进“智能手环应用”项目

2入选大数据硬独角兽Top20，鲸算科技用科技赋能传统行业

3华为Watch2上手评测！这个容易用吗？

4出门问问Ticwatch 2手表试用深度评测+图赏全面了解其

5Apple Watch 拥有 8GB 内置存储空间，其中 2

6云栖大会直视用友全面展现企业服务活力

7小米手环如何打动用户？

8首批iPhone新用户网友评价褒贬不一！华为P20稳定！

9高效的公司利用CRM系统避免客户流失

10可穿戴设备或将成为液晶面板主流应用

11TicPods 免费！ iPhone和Android用户的最

12我已经用眼睛确认你就是我要找的人

13使用 HTC Vive 时必须了解的几个问题，近视眼还能玩吗

14阿里巴巴联手万豪，推动人脸识别技术在酒店场景的应用

15亚马逊将推出即插即用智能音箱增强型低音炮Amazon Ech

16小米手环开箱图！简单又实用（多图）

17电磁炉这样使用的话，还能再用五年！

18一加海外官方社区发起活动让用户为自己的新电视命名

19西门子组建投资部门，五年内投资11亿美元用于人工智能等领域

20美国科学家研发出一种新型纳米材料，可用于可穿戴电子领域