当前位置: 首页 > 后端技术 > Python

数据很美:11个视觉案例分享

时间:2023-03-26 11:11:19 Python

Reddit是美国的综合性论坛网站,网友戏称它为“美国贴吧”。我最近发现了一个多么珍贵的网站。上面有很多话题节点,很多话题下都有丰富的内容。比如learnprogramming节点下,有很多人分享学习编程的资源和经验讨论。之前发表过《Crossin:我是如何在自学编程9个月后找到工作的》和《Crossin:如何保持学习编程的动力》两篇文章,都是从这个节点翻译过来的。虽然国情不同,但是学习编程这件事是一样的。除了这个节点,我最近沉迷另一个dataisbeautiful节点,里面有很多数据可视化的作品。不过由于网站是英文的,访问有些不稳定,可能不是每个人都方便。所以今天我选择了几个最近看到的比较好的可视化案例来分享,并附上了具体的链接,方便大家进一步了解。这些案例大多兼具直观性和设计性,值得欣赏。同时也可以启发想做数据可视化的同学,借鉴别人的展示方式。此外,我为每个案例找到了相关的生产工具。如果对其中一种效果感兴趣,可以借助工具自己模仿练习。120年系列电影票房收入https://www.zhihu.com/video/111887900470216704020年系列电影票房收入对比20年系列电影票房收入这是动态展示,可以点击视频观看。漫威宇宙的发展势头可见一斑。数据:http://the-numbers.com,CPI计算器工具:python:matplotlib项目:https://github.com/itaidagan/FranchiseRevenueComparison原文:https://www.reddit.com/r/dataisbeautiful/comments/bgf3ye/oc_franchise_earnings_comparison_over_20_years/2权力的游戏第8季第3集每帧的平均颜色《权力的游戏》权力的游戏第8季第3集每帧的平均颜色《权力的游戏》看不清楚。于是有人做了这样一个统计,告诉你这一集到底有多“黑”。工具:ffmpeg,python:PIL项目:https://github.com/lint/avg-color-bar原文:https://www.reddit.com/r/dataisbeautiful/comments/bjw7ct/the_average_color_of_each_frame_of_game_of/3我的薪水如何每月11,000用于美国华盛顿州西雅图我的11,000月薪如何在西雅图度过。这种图称为桑基图(Sankeydiagram),常用于表示流程或流量分布。这张图最近在Reddit上很流行,用来可视化世界各地人们的工资消费情况。工具:SankeyMATIC原文:https://www.reddit.com/r/dataisbeautiful/comments/bpk5d7/how_my_salary_of_11k_per_month_is_used_in_seattle/4最有价值的团队最“有价值”的团队是指资产最高的团队。Top5是这五支球队近几年的排名,其中NFL的达拉斯牛仔队连续三年排名第一。数据:福布斯球队价值排名工具:Tableau原文:https://www.reddit.com/r/dataisbeautiful/comments/btkihh/the_most_valuable_teams_oc/5RafaelNadal的法网统治力雷达图并不常用。这显示了纳达尔费德勒和德约科维奇在澳网、美网、法网和温网的相互记录。资料:Wikipedia工具:D3.js原文:https://www.reddit.com/r/dataisbeautiful/comments/bthez5/rafael_nadals_french_open_dominance_he_won_11_out/630年的音乐产业,可视化不同媒体形式在录音中的兴衰行业。从画面中,我们可以看到CD的辉煌与衰落。另一个有趣的事情是,黑胶唱片近年来有复兴的趋势。数据:美国唱片业协会工具:RAWGraphs、Excel原文:https://www.reddit.com/r/dataisbeautiful/comments/ble5y7/30_years_of_the_music_industry_visualised_oc/74年我和我异地恋女友的短信整个大学短信数据异地恋女友分析一个异地恋的小哥哥,因为不同意女友总是发短信太少,居然搭建了一个短信分析系统,详细分析了他们互相发短信的次数和时间。四年来的短信、表情和用词习惯等,并开放接口供大家使用。(前提是有女朋友跟你交流!)工具:React(chart.js)、Node/Express、Python项目:https://leftonread.me原文:https://www.reddit。com/r/dataisbeautiful/comments/biou3e/4_years_of_texts_between_me_and_my_long_distance/8Gaussiandistribution高斯分布高斯分布就是我们常说的“正态分布”。不过这里的高斯分布是作者对高斯人像中像素颜色分布的动态可视化,类似于PS等软件中的颜色直方图。工具:http://anvaka.github.io/pixchart项目:https://github.com/anvaka/gauss-distribution原文:https://www.reddit.com/r/dataisbeautiful/comments/7ol3gy/gaussian_distribution_oc/9TheCityisAlive:ThePopulationofManhattan,Hour-by-HourThecityisalive:thepopulationoftheManhattan,NewYorktime-sharingmap这是一个三维可视化,整合了人口、时间、和位置。曼哈顿每周7天的客流量变化。数据:美国人口普查网站+地铁站交通数据工具:Python+QGIS,网页版MapboxGLJS+D3.js项目:https://github.com/citrusvanilla/manhattanpopulationexplorer原文:https://www.reddit.com/r/dataisbeautiful/comments/8hys9k/the_city_is_alive_the_population_of_manhattan/10死亡原因-现实与谷歌与媒体差异进行了关联和比较。在现实中,大多数死因是心脏病和癌症,而根据谷歌的数据,癌症是最高的,媒体报道最多的是他杀和恐怖袭击。数据:CDC、Google、TheGuardian和NewYorkTimes工具:Python3.6、numpy、pandas、matplotlib、imageio项目:https://github.com/aaronpenne/data_visualization/tree/master/cause_of_death原文:https//www.reddit.com/r/dataisbeautiful/comments/8cwcbu/cause_of_death_reality_vs_google_vs_media_oc/11Reddit用户名末尾的数字热图相同的数字结尾使用最多。一眼就可以直观看出:123、666、999、198~2017等数字都比较高。奇怪的是69和420也高得惊人。搜索了一下,发现这跟Reddit自己的俚语有关系(具体不方便说)。数据:Kaggle:reddit-usernames工具:python:matplotlib+seaborn项目:https://github.com/colinmorris/reddit-username-suffixes原文:https://www.reddit.com/r/dataisbeautiful/comments/7sewjx/heatmap_of_numbers_found_at_the_end_of_reddit/以上只是本节点数据可视化案例的冰山一角,感兴趣的同学也可以自行挖掘。如果你喜欢这些内容,下次我会花时间搜索更多有趣的内容。更多关于编程和数据的有趣实用内容,欢迎搜索关注:Crossin的编程课堂