当前位置: 首页 > 科技观察

MySQL:30种常用的SQL查询语句优化方法

时间:2023-03-20 22:22:19 科技观察

SQL语言,是结构化查询语言(StructuredQueryLanguage)的缩写。SQL语言是一种数据库查询和编程语言,用于访问数据和查询、更新和管理关系数据库系统;它也是数据库脚本文件的扩展名。下面为大家带来30种常见的MySQLSQL查询优化方法:1、尽量避免在where子句中使用!=或<>运算符,否则引擎会放弃使用索引而扫描全表。2.优化查询,尽量避免全表扫描。首先,您应该考虑在where和orderby涉及的列上建立索引。3、尽量避免在where子句中判断字段的空值,否则引擎会放弃使用索引,进行全表扫描。例如:selectidfromtwherenumisnull可以给num设置默认值0,保证表中num列没有空值,然后这样查询:selectidfromtwherenum=04,尽量避免在where子句中使用or连接条件,否则引擎会放弃使用索引,转而进行全表扫描,如:selectidfromtwherenum=10ornum=20,可以这样查询:selectidfromtwherenum=10unionallselectidfromtwherenum=205,下面的查询也会引起全表扫描:(百分号不能在前面)selectidfromtwherenamelike'%c%'然后去索引selectidfromtwherenamelike'c%'如果想提高效率,可以考虑全文搜索。6、in和notin也要慎用,否则会导致全表扫描,如:selectidfromtwherenumin(1,2,3)对于连续值,能用between就不要用in:selectidfromtwherenumbetween1and37,如果在where子句中使用参数,也会造成全表扫描。因为SQL只在运行时解析局部变量,所以优化器不能将访问计划的选择推迟到运行时;它必须在编译时选择。但是,如果访问计划是在编译时建立的,变量的值仍然是未知的,因此不能用作索引选择的输入。比如下面的语句会进行全表扫描:selectidfromtwherenum=@num可以改成强制查询使用索引:selectidfromtwith(index(indexname))wherenum=@num8,尽量避免对字段进行表达式操作在where子句中,这将导致引擎放弃使用索引并执行全表扫描。例如:selectidfromtwherenum/2=100应改为:selectidfromtwherenum=100*29,应尽量避免对where子句中的字段进行函数操作,这样会导致引擎放弃使用索引而进行全表扫描。如:selectidfromtwheresubstring(name,1,3)='abc'--名字以abc开头的idselectidfromtwheredatediff(day,createdate,'2005-11-30')=0-'2005-11-30'生成的id应该改为:selectidfromtwherenamelike'abc%'selectidfromtwherecreatedate>='2005-11-30'andcreatedate<'2005-12-1'10,不要在"="左边进行函数、算术运算或其他表达式操作"在where子句中,否则系统很可能无法正确使用索引。11、使用索引字段作为条件时,如果索引是复合索引,那么必须以索引中的第一个字段作为条件,保证系统使用索引,否则索引不会被使用,应该be使字段顺序尽可能与索引顺序一致。12.不要写一些无意义的查询。如果需要生成空表结构:selectcol1,col2into#tfromtwhere1=0,这样的代码不会返回任何结果集,但会消耗系统资源。您应该将其更改为:createtable#t(...)13.在许多情况下,使用exists代替in是一个不错的选择:selectnumfromawherenumin(selectnumfromb)替换为以下语句:selectnumfromawhereexists(select1frombwherenum=a.num)14.并不是所有的索引都对查询有效,SQL是基于表的当索引列有大量重复数据时,SQL查询可能不会使用索引。比如一张表有sex字段,male和female几乎各占一半,那么即使建立了sex的索引也不会被使用。查询效率不行。15.索引越多越好,索引可以提高相应select的效率,但是也会降低insert和update的效率,因为insert或者update的时候可能会重建索引,所以需要如何建立索引仔细考虑。视情况可以是。一张表的索引最好不要超过6个。如果过多,就要考虑是否需要在一些不常用的列上建立索引。16、尽量避免更新聚簇索引数据列,因为聚簇索引数据列的顺序就是表记录的物理存储顺序。一旦该列的值发生变化,整个表记录的顺序就会随之调整,这会消耗相当大的资源。如果应用系统需要频繁更新聚簇索引数据列,那么就需要考虑是否将索引构建为聚簇索引。17.尽量使用数字字段。如果只包含数字信息的字段尽量不要设计成字符类型,这样会降低查询和连接的性能,还会增加存储开销。这是因为引擎在处理查询和连接时,会把字符串中的每个字符一个一个地进行比较,但是对于数字类型,只需要一个比较就可以了。18、尽量使用varchar/nvarchar而不是char/nchar,因为一来变长字段的存储空间小,可以节省存储空间,二来对于查询来说,在比较小的范围内查找效率领域显然更高。19、不要在任何地方使用select*fromt,将“*”替换为具体的字段列表,不返回任何未使用的字段。20.尽量使用表变量代替临时表。如果您的表变量包含大量数据,请注意索引非常有限(仅主键索引)。21、避免频繁创建和删除临时表,减少系统表资源的消耗。22.临时表不是不可用。正确使用它们可以使某些例程更加高效,例如,当需要重复引用大表或普通表中的数据集时。但是,对于一次性事件,最好使用导出表。23、创建临时表时,如果一次插入的数据量较大,可以使用selectinto代替createtable,避免创建大量日志,提高速度;如果数据量不大,为了缓解系统表的资源,应该先建表,再插入。24、如果使用临时表,必须在存储过程结束时显式删除所有临时表,先truncatetable,再droptable,避免系统表长期锁定。25、尽量避免使用游标,因为游标的效率很低。如果游标操作的数据超过10000行,那么就要考虑重写了。26.在使用基于游标的方法或临时表方法之前,应该先找到基于集合的方法来解决问题,而基于集合的方法通常更有效。27.和临时表一样,游标也不是不可用。在小型数据集上使用FAST_FORWARD游标通常优于其他逐行处理方法,尤其是在必须引用多个表才能获取所需数据的情况下。在结果集中包含Total的例程通常比使用游标更快。如果开发时间允许,可以同时尝试基于游标的方法和基于集合的方法,看看哪种方法效果更好。28.在所有存储过程和触发器的开头设置SETNOCOUNTON,在结束时设置SETNOCOUNTOFF。存储过程和触发器的每条语句执行完后,不需要向客户端发送DONEINPROC消息。29、尽量避免向客户端返回大量数据。如果数据量太大,就要考虑对应的需求是否合理。30、尽量避免大事务操作,提高系统并发度。