1.概念垃圾收集机制是一种动态的存储分配方案。它会自动释放程序不再需要的已分配内存块。垃圾回收机制让程序员不必太在意程序内存分配,从而可以将更多的精力投入到业务逻辑中。在目前流行的语言中,垃圾回收机制是新一代语言的共同特点,如Python、PHP、C#、Ruby等,都使用了垃圾回收机制。二、PHP垃圾回收机制1、在PHP5.3之前,使用的垃圾回收机制很简单就是“引用计数”。即:①为每个内存对象分配一个计数器。当内存对象被变量引用时,计数器+1;②当变量引用被移除时(执行unset()后),计数器为-1;③当计数器=0时,表示该内存对象未被使用,内存对象被销毁,垃圾回收完成。而PHP会在一个生命周期结束后释放这个进程/线程所占用的内容。这种方式决定了PHP前期不需要过多考虑内存泄漏问题。但是当两个或多个对象相互引用形成环时,内存对象的计数器不会减为0;这时候这组内存对象就没有用了,而且不能回收,导致内存泄漏。从php5.3开始,使用了新的垃圾回收机制。基于引用计数,实现了一个复杂的算法来检测内存对象中引用环的存在,以避免内存泄漏。2、随着PHP的发展,PHP开发人员的增多及其业务范围的扩大,在PHP5.3中引入了更加完善的垃圾回收机制。新的垃圾回收机制解决了引用内存无法处理循环泄漏的问题。正如官方文档所说:每个php变量都存在于一个名为“zval”的变量容器中。一个zval变量容器,除了包含变量的类型和值外,还包含两个字节的附加信息。第一个是“is_ref”,它是一个bool值,用来标识这个变量是否属于一个引用集(referenceset)。通过这个字节,php引擎可以区分普通变量和引用变量。由于php允许用户通过使用&来自定义引用,所以在zval变量容器中也有一个内部引用计数机制来优化内存使用。第二个多出来的字节是“refcount”,用来表示指向这个zval变量容器的变量(也叫symbols或symbols)的个数。所有符号都存在于一个符号表中,每个符号表都有一个作用域。简单理解如下图:根据官方文档,可以使用Xdebug查看引用计数:上面的程序会输出:a:(refcount=3,is_ref=0)='newstring'a:(refcount=1,is_ref=0)='newstring'注意:从PHP7的NTS版本开始,不再统计上面例程的引用,即$c=$b=$a之后a的引用计数也是1、具体分类如下:在PHP7中,zvals可以引用计数也可以不引用。zval结构中有一个标志决定了这一点。①对于null、bool、int、double类型的变量,refcount永远不会计数;②对于对象和资源类型,refcount计数与php5一致;③对于字符串,未被引用的变量称为“实际字符串”。那些被引用的字符串被去重(即只有一个插入的字符串具有特定内容)并保证在整个请求期间都存在,因此无需使用对它们进行引用计数;如果使用opcache,这些字符串将存在于共享内存中,这种情况下,你不能使用引用计数(因为我们的引用计数机制是非原子的);④对于数组,未被引用的变量称为“不可变数组””。数组本身的计数与php5是一致的,但是数组中每个键值对的计数遵循前面三个规则(即如果是字符串则不计数);如果使用opcache,代码中的常量数组文本将被转换为不可变数组。同样,它们位于共享内存中,因此无法使用引用计数。我们的demo示例如下:;$b=&$a;xdebug_debug_zval('a');echo'测试数组引用计数';$c=array('a','b');xdebug_debug_zval('c');$d=$c;xdebug_debug_zval('c');$c[2]='c';xdebug_debug_zval('c');echo'testinttypecount';$e=1;xdebug_debug_zval('e');看到输出如下:3.回收周期默认情况下,PHP的垃圾回收机制是开启的,php.ini中有一个设置可以修改:zend.enable_gc。开启垃圾回收机制后,算法会判断,每当根缓冲区满了,就会进行循环查找。rootbuffer有一个固定的大小,默认是10000,可以通过修改PHP源文件Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES,然后重新编译PHP来修改这个值。当禁用垃圾回收时,循环搜索算法永远不会被执行,然而,根将始终存在于根缓冲区中,无论是否在配置中启用垃圾回收。除了修改配置zend.enable_gc外,还可以分别调用gc_enable()和gc_disable()函数来开启和关闭php运行时的垃圾回收机制。调用这些函数与修改配置项开启或关闭垃圾回收机制效果相同。即使根缓冲区可能尚未满,也强制定期回收。您可以为此调用gc_collect_cycles()函数。此函数将返回使用此算法回收的循环数。允许打开和关闭垃圾收集并允许自主初始化的原因是因为应用程序的某些部分可能对时间敏感。在这种情况下,您可能不想使用垃圾回收。当然,关闭部分应用程序的垃圾收集可能会带来内存泄漏的风险,因为某些可能的根可能不适合有限的根缓冲区。因此,在调用gc_disable()释放内存之前调用gc_collect_cycles()可能是明智的。因为这会清除所有已经存储在根缓冲区中的可能根,然后当关闭垃圾收集时,可以留下一个空缓冲区,为可能的根留出更多空间。4.性能影响1.内存占用的节省首先,实现垃圾回收机制的全部原因是在满足前提条件的情况下,通过清理循环引用的变量来节省内存占用。在PHP执行中,一旦根缓冲区已满或调用gc_collect_cycles()函数时,就会执行垃圾收集。2.增加执行时间垃圾回收影响性能的第二个方面是释放泄漏内存所花费的时间。通常PHP中的垃圾回收机制只有在循环回收算法实际运行时才会有时间消耗的增加。但在普通(较小的)脚本中,根本不会对性能产生影响。3.在运行回收机制的正常脚本的情况下,内存节省将允许更多此类脚本同时在您的服务器上运行。因为使用的总内存还没有达到上限。这种好处在长时间运行的脚本中尤其明显,例如长时间的测试套件或守护程序脚本。同时,对于通常运行时间比Web脚本更长的脚本应用程序,新的垃圾回收机制应该会大大改变内存泄漏难以解决的看法。很多PHPer在进阶的时候总会遇到一些问题和瓶颈。他们写了太多的业务代码,没有方向感。他们不知道从哪里开始改进。我整理了一些资料,包括但不限于:、高扩展、高性能、高并发、服务器性能调优、TP6、laravel、YII2、Redis、Swoole、Swoft、Kafka、Mysql优化、shell脚本、Docker、微服务、Nginx等进阶进阶知识点需要干货的可以免费分享给大家。如果您需要它们,请点击这里
