当前位置: 首页 > 科技观察

你必须知道的10个Python第三库

时间:2023-03-12 23:55:24 科技观察

1.BeautifulSoupBeautifulSoup是一个Python库,可以从HTML和XML中提取文件。我们在使用爬虫抓取数据后,往往需要对数据进行分析。使用它可以让你愉快的提取里面爬取的数据。2.Arrow用过datetime标准库的同学都知道,这个库每次都需要导入各种时间模块格式,非常不友好。Arrow直接接受各种时间(datetime、date、timestamp)类型,转换成Arrow类型,然后进行各种格式化操作,非常方便。非常人性化,是居家旅行必备良药。3、Requests标题图片为requests的标识。这个库用的多,学Python的人应该都知道。requests是日常使用频率最高的网络库,无论是正式使用还是测试使用,完全满足日常网络需求,非常人性化,简单易用。requests目前在github上有36+星。除了功能强大,源码也写的非常好。五星推荐4.对于少量服务器,Fabric可以每天自动发布配置,只需要配置一个fabfile.py自动化脚本就可以和服务器进行交互,非常简单方便。如果需要更多的配置运维,可以使用ansible。稍后我将单独与您讨论。5.statsd是开发同学,服务器API性能,耗时监控是一个很重要的数据,我们需要收集起来实时分析。statsd是一个网络守护进程。通过Python客户端,我们可以向服务端发送统计和监控API数据,如ES、influxdb、promethues,并使用Grafana进行数据展示。6.Gevent是一个基于协程的Python网络库。通过gevent,协程的使用变得非常简单。遇到阻塞时无需切换显示,程序会自动排程。它被广泛使用。在部署flask时,celery经常会加入gevent来提升服务性能。7.Supervisor上一篇文章提到supervisor可以极大的方便我们的进程管理,启动,重启,停止,查看日志等等。8.Voluptuouslibrary估计很多同学都不知道。主要用于日常写API时的数据校验。当前端API传递的参数过多时,这个库可以通过装饰器提前校验数据逻辑,大大降低了你代码逻辑校验数据的耦合度,强烈推荐后端同学使用。9、Raven这个简单的名字大家可能不是那么敏感,但是sentry大家一定都知道。该库是哨兵服务的SDK包。对于日常的邮件告警,我们可以通过安装这个包,配合哨兵后台服务,收集各种邮件告警的错误信息。另外,通过设置日志级别,我们可以很方便的通过logger触发告警。这个包适用于多种语言,而不仅仅是Python语言下。10、uWSGIuWSGI是一个web服务器,实现了WSGI协议、uwsgi、http等协议。我们在Python日常部署一文中提到,它主要是使用Nginx+uWSGI来拉取我们的应用服务(比如Django)来提高服务吞吐量。