SQL优化

时间：2023-03-29 15:57:24 PHP

网上关于SQL优化的教程很多，但是比较乱。最近有时间整理一下，写出来分享给大家。如有错误和不足，敬请指正和补充。我花了很多时间查找资料，修改，排版这篇文章。希望大家看完之后，如果觉得不错，推荐给更多的人，让更多的人看到，指正，补充。1.优化查询，尽量避免全表扫描，首先考虑对where和orderby涉及的列建立索引。2.尽量避免在where子句中判断字段为空值，否则引擎会放弃使用索引，进行全表扫描，如：selectidfromtwherenumisnull最好不要离开NULL为数据库，尽可能使用NOTNULL来填充数据库。备注、说明、评论等可以设置为NULL，其他的最好不要使用NULL。不要以为NULL不需要空间，例如：char(100)类型，在创建字段时，空间是固定的，无论是否插入值（也包括NULL），都会占用空间100个字符，如果是varchar这样的变长字段，null不占空间。可以给num设置默认值0，保证表中num列没有空值，然后这样查询：selectidfromtwherenum=03。尽量避免使用!=或<>运算符在where子句中，否则引擎会放弃索引的使用而进行全表扫描。4.尽量避免在where子句中使用or连接条件。如果一个字段有索引，另一个没有，会导致引擎放弃使用索引，进行全表扫描，如：selectidfromtwherenum=10orName='admin'可以查询像这样：selectidfromtwherenum=10unionallselectidfromtwhereName='admin'5.in和notin也要慎用，否则会导致全表扫描，如：selectidfromtwherenumin(1,2,3)对于连续值，如果可以使用between就不要用in：selectidfromtwherenumbetween1and3很多时候用exists代替in是个不错的选择：selectnumfromawherenumin(selectnumfromb)替换为以下语句：selectnumfromawhereexists(select1frombwherenum=a.num)6.下面的查询也会得到一个全表scan:selectidfromtwherenamelike'%abc%'如果想提高效率，可以考虑全文搜索。7、如果where子句中使用了参数，也会造成全表扫描。因为SQL只在运行时解析局部变量，所以优化器不能将访问计划的选择推迟到运行时；它必须在编译时选择。但是，如果访问计划是在编译时建立的，变量的值仍然是未知的，因此不能用作索引选择的输入。例如，下面的语句将执行全表扫描：selectidfromtwherenum=@num可以更改为强制查询使用索引：selectidfromtwith(index(indexname))wherenum=@数尽量避免在wheresub语句中对字段进行表达式操作，会导致引擎放弃使用索引而进行全表扫描。例如：selectidfromtwherenum/2=100应改为：selectidfromtwherenum=100*29。应该尽量避免在where子句中对字段进行函数式操作，这样会导致引擎放弃使用索引而进行全表扫描。例如：selectidfromtwheresubstring(name,1,3)='abc'---id以abc开头的nameselectidfromtwheredatediff(day,createdate,'2005-11-30')=0-–'2005-11-30'--生成的id应该改为：selectidfromtwherenamelike'abc%'selectidfromtwherecreatedate>='2005-11-30'andcreatedate<'2005-12-1'10。请勿在where子句中对“=”左侧进行函数、算术运算或其他表达式操作，否则系统可能无法正确使用索引。11、使用索引字段作为条件时，如果索引是复合索引，那么必须以索引中的第一个字段作为条件，保证系统使用索引，否则索引不会被使用，应该be使字段顺序尽可能与索引顺序一致。12、不要写一些无意义的查询。如果需要生成空表结构：selectcol1,col2into#tfromtwhere1=0这种代码不会返回任何结果集，但是会消耗系统资源，应该改成这样：createtable#t(…)13.update语句，如果只改变1或2个字段，不要更新所有字段，否则频繁调用会造成明显的性能消耗，同时带来大量日志。14.多张数据量大的表的JOIN（这里以几百条为大），必须先分页再JOIN，否则逻辑读会很高，性能很差。15.从表中选择计数(*)；这种不带任何条件的计数会造成全表扫描，没有业务意义，必须剔除。16、索引越多越好，索引可以提高对应select的效率，但是也会降低insert和update的效率，因为insert或者update的时候可能会重建索引，所以需要如何建立索引仔细考虑。视情况可以是。一张表中的索引最好不要超过6个。如果过多，则应考虑是否有必要在一些不常用的列上建立索引。17、尽量避免更新聚簇索引数据列，因为聚簇索引数据列的顺序就是表记录的物理存储顺序。一旦该列的值发生变化，整个表记录的顺序就会随之调整，这会消耗相当大的资源。如果应用系统需要频繁更新聚簇索引数据列，那么就需要考虑是否将索引构建为聚簇索引。18.尝试使用数字字段。如果只包含数字信息的字段尽量不要设计成字符类型，这样会降低查询和连接的性能，还会增加存储开销。这是因为引擎在处理查询和连接时，会把字符串中的每个字符一个一个地进行比较，但是对于数字类型，只需要一个比较就可以了。19、尽量使用varchar/nvarchar而不是char/nchar，因为一来变长字段的存储空间小，可以节省存储空间，二来对于查询来说，在比较小的字段内查找效率显然更高。20、不要在任何地方使用selectfromt，将“”替换为特定的字段列表，不要返回任何未使用的字段。21.尽量使用表变量代替临时表。如果您的表变量包含大量数据，请注意索引非常有限（仅主键索引）。避免频繁创建和删除临时表，减少系统表资源的消耗。临时表并不是不可用，适当地使用它们可以使某些例程更高效，例如，当需要重复引用大表或常用表中的数据集时。但是，对于一次性事件，最好使用导出表。23、新建临时表时，如果一次性插入大量数据，可以用selectinto代替createtable，避免创建大量日志，提高速度；如果数据量不大，为了缓解系统表的资源，应该先建表，再插入。24、如果使用临时表，必须在存储过程结束时显式删除所有临时表，先truncatetable，再droptable，避免系统表长期锁定。25、尽量避免使用游标，因为游标的效率很低。如果游标操作的数据超过10000行，那么就要考虑重写了。26.在使用基于游标的方法或临时表方法之前，应该先找到基于集合的方法来解决问题，而基于集合的方法通常更有效。27.和临时表一样，游标也不是不可用。在小型数据集上使用FAST_FORWARD游标通常优于其他逐行处理方法，尤其是在必须引用多个表才能获取所需数据的情况下。在结果集中包含Total的例程通常比使用游标更快。如果开发时间允许，可以同时尝试基于游标的方法和基于集合的方法，看看哪种方法效果更好。28.在所有存储过程和触发器的开头设置SETNOCOUNTON，在结束时设置SETNOCOUNTOFF。存储过程和触发器的每条语句执行完后，不需要向客户端发送DONE_IN_PROC消息。29、尽量避免大事务操作，提高系统并发度。30、尽量避免向客户端返回大量数据。如果数据量太大，就要考虑对应的需求是否合理。实际案例分析：拆分大型DELETE或INSERT语句，批量提交SQL语句　　如果您需要在在线网站上执行大型DELETE或INSERT查询，您需要非常小心，避免您的操作让您整个站点停止响应。因为这两个操作都会锁表，一旦表被锁住，其他操作就无法进入。　　Apache会有很多子进程或线程。因此，它的工作效率相当高，我们的服务器不希望有太多的子进程、线程和数据库连接，占用大量的服务器资源，尤其是内存。　　如果你锁表一段时间，比如30秒，那么对于一个流量大的站点来说，这30秒累计的访问进程数/线程数、数据库连接数、打开文件数，可能不仅让你的WEB服务崩溃，还可能导致你的整个服务器立即挂掉。　　所以，如果你有一个大进程，你必须拆分它，使用LIMIToracle(rownum),sqlserver(top)条件是一个很好的方法。下面是mysql的例子：复制代码while(1){　　//一次只做1000条记录　　mysql_query("deletefromlogswherelog_date<='2012-11-01'limit1000");　　if(mysql_affected_rows()==0){　　　　//删除完成，退出！　　　　休息；　　}

上一篇：一次定时任务配置错误引发的思考

下一篇：我让chatGPT用PHP写了一个MVC框架，不仅会写，还会跑！

SQL优化相关文章