当前位置: 首页 > 科技观察

N条Java代码优化建议!

时间:2023-03-12 19:42:44 科技观察

本文是作者:五月仓颉结合自己的工作和平时的学习经历,重新探讨为什么要做代码优化。修改前,作者声明如下:就像鲸鱼吃虾米一样,也许吃一两只虾米对鲸鱼来说效果不是很好,但是吃多了虾米,鲸鱼自然就会吃饱。代码优化也是一样,也许一两次优化对提高代码的运行效率意义不大,但是只要能处处注意代码优化,对提高代码的运行效率是非常有用的一般来说。这种观点,在目前看来,是代码优化的一个理由,但并不完全正确。在机械技术发达的今天,服务器往往有8核、16核、64位的CPU。代码执行效率很高。StringBuilder取代了StringBuffer,ArrayList取代了Vector。所有的点我都注意到了,代码运行没有明显的变化。在我看来,代码优化最重要的作用应该是:避免未知错误。线上运行代码的过程中,经常会出现很多意想不到的错误,因为线上环境和开发环境差别很大,故障定位往往是一个很小的原因。但是,为了解决这个错误,我们需要先验证自己,然后打包要替换的class文件,暂停业务重启。对于一个成熟的项目来说,最后一项的影响其实是非常大的,也就是说这段时间的用户是无法访问应用的。所以,在写代码的时候,从源头上注意各种细节,权衡取舍,选择最好的,从长远来看,会很大程度上避免未知错误,大大减少工作量。一、代码优化的目标是:1、减小代码体积2、提高代码运行效率确实有效。那么这篇文章会长期保持更新。只要有值得分享的代码优化细节,本文都会不定期更新。二、代码优化细节:1、尽量指定类和方法的final修饰符。无法派生具有final修饰符的类。在Java核心API中,有很多应用final的例子,比如java.lang.String,整个类都是final的。为类指定final修饰符可以防止类被继承,为方法指定final修饰符可以防止方法被重写。如果一个类被指定为final,则该类的所有方法都是final。Java编译器会寻找机会内联所有final方法。内联对于提高Java运行的效率有着重要的作用。有关详细信息,请参阅Java运行时优化。这可以将性能平均提高50%。2、尽量复用对象,尤其是String对象的使用。当发生字符串连接时,应改用StringBuilder/StringBuffer。由于Java虚拟机不仅需要时间来生成对象,以后还可能需要花时间对这些对象进行垃圾回收和处理,因此,生成过多的对象会对程序的性能造成很大的影响。3.尽量使用局部变量。调用方法时传递的参数和调用过程中创建的临时变量存储在栈中,速度更快。其他的变量,比如静态变量和实例变量,都是在堆中创建的,速度更快。慢的。另外,栈中创建的变量会随着方法结束而消失,不需要额外的垃圾回收。4、及时关闭流在Java编程过程中,进行数据库连接和I/O流操作时要小心。使用后及时关闭,释放资源。因为对这些大对象的操作会造成很大的系统开销,稍有不慎就会导致严重的后果。5.尽量减少变量的重复计算,弄清一个概念。调用一个方法,即使方法中只有一条语句,也是有消耗的,包括创建栈帧,保护调用方法时的场景,恢复调用方法时的场景。所以比如下面的操作:建议换成:这样在list.size()很大的时候,会减少很多消耗。:7.谨慎使用异常异常对性能不利。抛出异常首先创建一个新对象。Throwable接口的构造函数调用名为fillInStackTrace()的本地同步方法。fillInStackTrace()方法检查堆栈并收集调用跟踪信息。每当抛出异常时,Java虚拟机都必须调整调用堆栈,因为在处理过程中会创建一个新对象。异常应该只用于错误处理,不应用于控制程序流程。8、循环中不要用try...catch...,应该放在最外层。根据网友提出的意见,我认为这是值得商榷的。实现的集合和工具类指定初始长度,如ArrayList、LinkedLlist、StringBuilder、StringBuffer、HashMap、HashSet等,以StringBuilder为例:可以通过类的构造函数来设置(这里不仅指上面的StringBuilder)初始化能力,可以显着提高性能。比如StringBuilder,length表示当前StringBuilder可以容纳的字符数。因为当StringBuilder达到其最大容量时,它会将自身的容量增加到当前容量的2倍加2,每当StringBuilder达到其最大容量时,它就必须创建一个新的字符数组,然后将旧字符数??组的内容复制到新的字符数组——这是一个非常耗费性能的操作。试想一下,如果在不指定长度的情况下,可以估计出字符数组大约会存储5000个字符,最接近2的5000次方为4096,不管每次展开都加2,那么:在4096的基础上,申请8194个大小为12290的字符数组,相当于一次申请一个12290的字符数组。如果一开始就可以指定一个5000的字符数组,将节省一倍以上的空间;将原来的4096个字符复制到新的字符数组中;这样一来,不仅浪费了内存空间,而且降低了代码运行的效率。因此,为数组实现的底层集合和工具类设置一个合理的初始化容量是没有错的,会带来立竿见影的效果。不过要注意,像HashMap这种数组+链表实现的集合,不要把初始大小设置成你估计的大小,因为一张表只连接一个对象的可能性几乎为零。建议设置初始大小为2的N次方,如果可以估计有2000个元素,可以设置为newHashMap(128)或newHashMap(256)。10、复制大量数据时,使用System.arraycopy()命令。11.乘法和除法使用移位运算。例如:使用移位操作可以大大提高性能,因为在计算机的底层,位操作是最方便和最快速的,所以建议修改为:虽然移位操作很快,但可能会使代码不易理解,最好加上相应的注释。12.不要一直在循环中创建对象引用。例如:这个方法会导致count个对象引用存在于内存中。如果计数太大,会消耗内存。建议改为:这种情况下,内存中只有一个对象。对象引用,每次执行newObject()时,Object对象引用指向不同的Object,但在内存中只有一份,大大节省了内存空间。13、基于效率和类型检查的考虑,尽量使用数组。当您无法确定数组的大小时,请使用ArrayList14。尝试使用HashMap、ArrayList和StringBuilder。除非线程安全有要求,否则不建议使用Hashtable、Vector和StringBuffer。最后三个15.不要把数组声明为publicstaticfinal,因为没有意义。这只是把引用定义为staticfinal,数组的内容还是可以随意改变的。将数组声明为公共的。这是一个安全漏洞,这意味着这个数组可以被外部类更改。16.在适当的场合尽量使用单例。使用单例可以减轻加载负担,缩短加载时间,提高加载效率,但并不是所有地方都适用单例。总之,单例主要适用于以下三个方面:(1)控制资源的使用,通过线程同步控制资源的并发访问;(2)控制实例的生成以节省资源(3)控制数据的共享,允许多个不相关的进程或线程在不建立直接关系的情况下进行通信;17、尽量避免随意使用静态变量。要知道,当一个对象被一个定义为static的变量引用时,那么gc通常是不会回收这个对象占用的堆内存的。例如:此时静态变量b的生命周期与类A的生命周期相同,如果类A没有被卸载,那么指向B对象的引用将一直保留在内存中,直到程序终止。18、及时清除不需要的会话为了清除不再活跃的会话,很多应用服务器都有一个默认的会话超时时间,通常是30分钟。当应用服务器需要保存更多的session时,如果内存不足,操作系统会将一些数据转移到磁盘中,应用服务器也可能会根据MRU(mostrecentlyused)算法将一些不活跃的session转储到磁盘中.它甚至可能抛出内存不足的异常。如果要将会话转储到磁盘,则必须首先对其进行序列化,而序列化对象在大型集群中的开销可能很大。因此,当不再需要session时,应及时调用HttpSession的invalidate()方法清除session。19、实现了RandomAccess接口的集合,比如ArrayList,应该使用最常见的for循环而不是foreach循环来遍历。这是JDK向用户推荐的。JDKAPI对RandomAccess接口的解释是:实现RandomAccess接口用于表示支持快速随机访问。该接口的主要目的是允许通用算法改变它们的行为,以便它们在应用于随机或连续访问列表时能够提供良好的性能。表现。实践经验表明,如果随机访问一个实现了RandomAccess接口的类实例,使用普通for循环的效率会比使用foreach循环高;反之,如果是顺序访问,使用Iterator效率会更高。可以用类似下面的代码来判断:foreach循环的底层实现原理是迭代器Iterator,参见Java语法糖1:变长参数和foreach循环原理。所以后半句“相反,如果是顺序访问,使用Iterator会更有效率”的意思是那些顺序访问的类实例,使用foreach循环遍历。20.使用同步代码块代替同步方法。这一点在多线程模块中的同步锁方法块一文中已经解释得很清楚了。除非你能确定整个方法需要同步,否则尽量使用同步代码块。避免同步不需要同步的代码,影响代码执行效率。21、将常量声明为staticfinal,并以大写命名,这样编译时可以将这些内容放入常量池,避免在运行时计算生成的常量的值。另外,用大写字母命名常量也可以很容易区分常量和变量。22、不要创建一些不用的对象,不要导入一些不用的类,这是没有意义的,如果代码中出现“局部变量的值”我没有使用,“导入的java.util从未使用过”》,那么请删除这些无用的内容23.程序运行时避免使用反射详见反射,反射是Java为用户提供的一个非常强大的功能,强大的功能往往意味着低效。不建议在程序运行过程中特别频繁地使用反射机制,尤其是Method的invoke方法。如果确实需要,建议的做法是在需要反射加载的类启动时使用反射实例。创建一个对象并放入内存——用户只关心在与对端交互时获得最快的响应速度,并不关心对端的项目需要多长时间才能启动。24.使用数据库连接池和线程池。两个池都用于重用对象。前者可以避免频繁打开和关闭连接,后者可以避免频繁创建和销毁线程。25、使用缓冲输入输出流用缓冲输入输出流进行IO操作,即BufferedReader、BufferedWriter、BufferedInputStream、BufferedOutputStream,可以大大提高IO效率LinkedList,如果了解ArrayList和LinkedList的原理,就知道了。27.不要让public方法有太多的形参。公共方法是提供给外界的方法。如果给这些方法过多的形参,主要有两个缺点:(1)违背了面向对象的编程思想,Java强调一切都是对象,形参过多,与面向对象的编程思想不契合;(2)参数过多,必然导致方法调用出错的概率增大;至于这个“Toomany”指的是多少,可能是3个或者4个。比如我们用JDBC写了一个insertStudentInfo方法。有10个学生信息字段要插入到Student表中。这10个参数可以作为insert方法的28个形参、字符串变量和字符串常量封装在一个实体类中。把字符串常量写在equals前面是比较常见的技巧。如果有如下代码:建议改成:这样做主要是为了避免空指针异常。29、请知道在java中,if(i==1)和if(1==i)没有区别,但是从阅读习惯上来说,建议使用前者。人们通常会问,“if(i==1)”和“if(1==i)”有没有区别,都是以C/C++开头的。C/C++中,“if(i==1)”判断条件成立,根据0和非零,0表示假,非零表示真,如果有这么一段代码:C/C++判断“i==1”不成立,所以用0表示,为假。但是如果:万一程序员不小心,把“if(i==1)”写成了“if(i=1)”,那就有问题了。if内部给i赋值1,if判断里面的内容不为0,返回值为true,但显然i为2,比较的值为1,应该返回false。这种情况在C/C++的开发中很可能会出现,会导致一些无法理解的错误。因此,为了避免开发者在if语句中进行错误的赋值操作,建议将if语句写成:这样,即使开发者不小心写了“1=i”,C/C++编译器也能检查出来立即输出,因为我们可以将i赋值给1给一个变量,但是我们不能将1赋给i给一个常量。但是在Java中,C/C++的“if(i=1)”语法是不可能的,因为一旦写了这个语法,Java就会编译报错“Typemismatch:cannotconvertfrominttoboolean”。不过,虽然Java的“if(i==1)”和“if(1==i)”在语义上没有区别,但从阅读习惯上来说,还是推荐使用前者。30.不要在数组上使用toString()方法。看看在数组上使用toString()打印出来的是什么:本意是打印出数组的内容,但是可能会因为数组引用为空而导致空指针异常。但是,虽然数组toString()没有意义,但是集合toString()可以打印出集合的内容,因为集合的父类AbstractCollections重写了Object的toString()方法。31.不要向下转换超出范围的原始数据类型。这永远不会得到想要的结果:我们可能期望其中一些,但结果是:解释。long在Java中是8字节64位,所以12345678901234在计算机中的表示应该是:0000000000000000000010110011101001110011110011100010111111110010取出一个int类型的数据是4个字节,32位上面二进制数据串的前32位从低位开始:01110011110011100010111111110010这串二进制表示十进制是1942892530,所以就是我们上面控制台输出的。从这个例子中,我们顺便可以得出两个结论:(1)integer默认的数据类型是int,longl=12345678901234L,这个数已经超出了int的范围,所以最后有个L,表示这是一个长型数字。对了,浮点型的默认类型是double,所以在定义float的时候,应该写成""floatf=3.5f"(2)然后写成"intii=l+i;"会报一个error,因为long+int是一个long,不能赋值给int32,public集合类中不用的数据要及时清除,如果一个集合类是public的(即不是方法中的属性),那么这个集合中的元素就不会自动释放,因为一直有引用指向它们.因此,如果公共集合中的某些数据没有被使用并且没有被移除,就会导致公共集合不断增长,使系统成为内存泄漏的隐患33、将一个基本数据类型转换为字符串,基本数据类型.toString()是最快的方法,String.valueOf(data)其次,data+""将基本数据类型转换为最慢的方法一般有3种方法,我有一个Integer类型的数据i,我可以用i.toString(),String.valueOf(i),i+""三种方式,三种方式效率如何,看一个测试:运行结果为:所以我以后会遇到将一个基本数据类型转换成String的时候,首先使用toString()方法。至于为什么,很简单:(1)String.valueOf()方法在底层调用了Integer.toString()方法,但是调用前会做null判断;(2)Integer.toString()方法没说,直接调用;(3)i+""底层是StringBuilder实现的,先用append方法拼接,再用toString()获取字符串的方法;比较三者,很明显2最快,1次之,3最慢。34.使用最高效的方式遍历Map遍历Map的方式有很多种。一般来说,我们需要的是遍历Map中的Key和Value,所以推荐最高效的方式是:如果只是想遍历这个Map的key值,那么使用"SetkeySet=hm.keySet();"。35、建议单独操作资源close(),也就是说,比如我有这么一段代码:建议修改为:虽然有点麻烦,但是可以避免资源泄露。我们认为如果没有修改过的代码,如果XXX.close()抛出异常,那么就会进入catch块,YYY.close()不会执行,YYY资源也不会被回收。占用,如果此类代码过多,可能会造成资源句柄泄漏。改成下面的写法后,保证XXX和YYY无论如何都会关闭。36.对于ThreadLocal,在使用前或使用后必须将其移除。现在的项目几乎都使用了线程池技术,非常好。线程数可以动态配置,线程可以复用。但是,如果您在项目中使用ThreadLocal,请务必在使用前或使用后将其移除。这是因为上面说的线程池技术是一种线程复用,也就是说在代码运行的时候,一个线程用完了,不会销毁而是等待下一次使用。我们看一下线程类,它持有ThreadLocal.ThreadLocalMap的引用:如果线程没有被销毁,说明上一个线程设置的ThreadLocal.ThreadLocalMap中的数据还存在,所以下一个线程重用this的时候线程,很可能得到的是上一个线程设置的数据不是你想要的。这个问题很晦涩。一旦出现这种原因导致的错误,没有相关经验或者没有扎实的基础是很难发现这个问题的。所以大家在写代码的时候一定要注意这一点,这样会减少很多后续的工作量。37.记得用常量定义来代替恶魔号。恶魔号的存在会大大降低代码的可读性。可以根据情况判断字符串常量是否由常量定义。38.long或Long的初始赋值时,使用大写的L而不是小写的l,因为字母l容易与数字1混淆,这一点很详细,值得注意39,所有重写的方法必须保留@Overrideannotation三个原因:(1)很明显这个方法是从父类Inherited创建的;(2)getObject()和get0bject()方法,前者的第四个字母是“O”,后者的第四个孩子是“0”,加上@Override注解可以立即判断是否重写Success;(3)修改抽象类中的方法签名,实现类会立即报编译错误;40、推荐使用JDK7中新引入的Objects工具类来比较对象和equals,直接a.equals(b),有空指针异常的风险41、字符串拼接中不要使用“+”循环体,而是直接使用StringBuilder不断追加。先说说字符串拼接不用“+”的原因。如果我有一个方法:把这段代码编译后,用javap-c反编译.class文件,截取关键部分:意思是每次虚拟机遇到“+”运算符拼接字符串,一个将生成新的StringBuilder。然后调用append方法,最后调用toString()方法将字符串转换赋值给oriStr对象,也就是循环多少次,就会new多少个StringBuilder(),很浪费内存.42、不要捕获Java类库中定义的RuntimeException继承的运行时异常类。异常处理效率低。大多数RuntimeException的运行时异常类,程序员是可以完全避免的。例如:(1)可以传递ArithmeticException(2)通过判断对象是否为空来避免NullPointerException;(3)通过判断数组/字符串的长度可以避免IndexOutOfBoundsException;(4)使用instanceof关键字可以避免ClassCastException;(5)ConcurrentModificationException可以通过使用迭代器来避免;43.避免Random实例被多个线程使用。虽然共享这个实例是线程安全的,但是会因为竞争同一个种子而导致性能下降。JDK7之后可以使用ThreadLocalRandom来获取随机数解释为什么竞争同一个种子会导致性能下降。比如看Random类的nextInt()方法的实现:调用了next(intbits)方法,是一个受保护的方法:而这里的seed是一个全局变量:当多个线程获取随机数在同时,它们会竞争同一个种子,导致效率下降。44.静态类、单例类和工厂类将它们的构造函数设置为私有的。这是因为静态类、单例类、工厂类不需要从外部new,将它们的构造函数设置为private。之后保证这些类不会生成实例对象。后记优秀的代码来自于一点一滴的优化,关注每一个细节,不仅可以提高程序运行的效率,还可以避免很多未知的问题。原文链接:http://www.cnblogs.com/xrq730/p/4865416.html