当前位置: 首页 > 后端技术 > Python

哎呀,上网记录被Python扒了!

时间:2023-03-26 14:25:10 Python

作者|苏克1900来源|资深农民工长期使用浏览器,积累了大量的浏览历史记录,这些都是非常隐私的数据,甚至可能会有一些不可描述的网站或搜索记录在里面,不想让别人知道。但是,我们自己可能比较感兴趣,天天上网,想知道自己是在钓鱼,还是在长期认真工作。其次,知道你每天打开多少网页,哪些网站最受欢迎,哪些关键词经常被搜索,也很有趣。给大家介绍一个用Python写的神器,可以一键分析你的上网行为。我用过之后,发现了很多不可思议的结论。比如访问量最多的网站其实是微信公众号,超过7000次。看来自媒体占了很多上网时间。我看到网站每天打开的次数平均有几百次。8月8日发生的事情,被打开了1600多次!然后统计停留时间最长的网页。我实际上在http://md.aclickall.com/上停留了660小时。然后统计了搜索次数最多的十个关键词,python居然是第一!前十基本都和数据编程有关。没想到我这么爱学习。最后统计了各大搜索引擎的使用率。谷歌的使用率达到97.3%,而百度不到3%。大概是因为不能科学上网的时候偶尔用一下百度吧。怎么会有趣呢?下面说说这个工具的使用方法,让你也能分分钟了解自己的上网行为,非常简单。这个Python工具实际上是分析浏览器的历史数据库文件,然后将其可视化。这里的浏览器只支持Chrome和基于Chrome的浏览器,如Centbrower、360ExtremeBrowser等,其他浏览器如ie、Firefox不支持。如果有登陆账号,桌面和电脑一起分析,更全面。第一步是打开网站:BrowserHistoryAnalysis然后上传你的浏览器历史文件,这个历史文件如何获取?新建一个标签页,输入chrome://version/回车打开你的浏览器详情:将“个人数据路径”复制到资源管理器中打开,然后找到历史文件复制到桌面。然后上传刚才网站上的文件(我的文件大小是15MB),过一会就可以得到上门的可视化分析结果了。您可能担心上传浏览器历史记录是否安全,但请放心,该程序是开源的。下面简单说一下如何使用python一步步实现这个程序的功能。这是一个很棒的python项目,涉及前后端知识。整个程序包含多个文件:代码├─app_callback.py回调函数,实现后台功能├─app_configuration.pyweb服务器配置├─app_layout.pyweb前端页面配置├─app_plot.pyweb图表绘制├─app.pyweb服务器启动├─assetsweb所需的一些静态资源文件│├─cssweb前端元素布局文件││├─custum-styles_phyloapp.css││└─stylesheet.css│├─imageweb前端logoicon││├─GitHub-Mark-Light.png│└─静态web前端帮助页面│...分析历史文件数据history是一个sqllite数据库文件,连接数据库查询调用里面的信息数据库并存储它。配置Web服务器和前端页面以可视化绘图功能。可视化图形使用交互式plotly库。总结上网记录是非常重要的隐私数据,通常你可能无法直接从中查到什么,但是用Python简单分析一下就可以查到很多东西,所以平时要注意隐私保护。加粗字体