当前位置: 首页 > 后端技术 > Python

爬虫数据库存储的关系和非关系

时间:2023-03-26 12:12:13 Python

是爬虫比较基础的常识性东西,但是为了记录自己的学习之路,所以简略写下这篇文章。什么是数据库?数据库是存储数据的仓库。存储空间大,可以存储大量数据。用户可以对文件中的数据进行添加、查询、更新、删除等操作。分为关系型数据库和非关系型数据库,如MySQL、MongoDB、HBase等,常用的库有pymysql、pymssql、redis-py、pymongo、py2neo、thrift。什么是关系数据库?关系型数据库是基于关系模型的数据库,关系模型存储在二维表中,所以它的存储方式是由行和列组成的表。每列是一个字段,每一行是一条记录。表可以看成是某些实体的集合,实体之间是有关系的,需要通过表之间的关系来体现。关系数据可以很好地存储一些关系模型的数据,比如一个老师的数据对应多个学生(“多对多”),一本书对应多个作者(“一对多”),以及一书对应一个出版日期(“一对一”)关系型数据库的优点:1.复杂查询SQL语句可以很方便地在一张表和多张表之间进行非常复杂的数据查询。什么是非关系数据库?非关系数据库主要是基于“非关系模型”的数据库(因为关系类型太多,所以一般用“非关系”来表示其他类型的数据库。关系数据库的优点:1.复杂的查询可以是方便地用SQL语句执行在一张表和多张表之间做非常复杂的数据查询2.事务的支持使得数据访问需求可以实现高安全性能总结:关系型数据库和非关系型数据库不是对立的而是互补的Relational,that就是,平时使用关系型数据库,在适合使用NoSQL的时候使用NoSQL数据库,这样NoSQL数据库就可以弥补关系型数据库的不足。