深入理解 PHP7 中全新的 zval 容器和引用计数机制

深入理解 PHP7 中全新的 zval 容器和引用计数机制

最近在查阅 PHP7 垃圾回收的资料的时候,网上的一些代码示例在本地环境下运行时出现了不同的结果,使我一度非常迷惑。 仔细一想不难发现问题所在:这些文章大多是 PHP5.x 时代的,而 PHP7 发布后,采用了新的 zval 结构,相关的资料也比较贫瘠,所以我结合一些资料做了一个总结, 主要侧重于解释新 zval 容器中的引用计数机制 ,如有谬误,还望不吝指教。

PHP7 中新的 zval 结构

明人不说暗话,先看代码!


  1. struct _zval_struct{  
  2. union {  
  3. zend_long     lval;       /* long value */  
  4. double      dval;       /* double value */  
  5. zend_refcounted *counted;  
  6. zend_string   *str;  
  7. zend_array    *arr;  
  8. zend_object   *obj;  
  9. zend_resource  *res;  
  10. zend_reference*ref;  
  11. zend_ast_ref   *ast;  
  12. zval       *zv;  
  13. void       *ptr;  
  14. zend_class_entry *ce;  
  15. zend_function  *func;  
  16. struct {  
  17. uint32_t w1;  
  18. uint32_t w2;  
  19. } ww;  
  20. } value;  
  21. union {  
  22. struct {  
  23. ZEND_ENDIAN_LOHI_4(  
  24. zend_uchar  type,     /* active type */  
  25. zend_uchar  type_flags,  
  26. zend_uchar  const_flags,  
  27. zend_uchar  reserved)   /* call info for EX(This) */  
  28. } v;  
  29. uint32_t type_info;  
  30. } u1;  
  31. union {  
  32. uint32_t   var_flags;  
  33. uint32_t   next;         /* hash collision chain */  
  34. uint32_t   cache_slot;      /* literal cache slot */  
  35. uint32_t   lineno;        /* line number (for ast nodes) */  
  36. uint32_t   num_args;       /* arguments number for EX(This) */  
  37. uint32_t   fe_pos;        /* foreach position */  
  38. uint32_t   fe_iter_idx;     /* foreach iterator index */  
  39. } u2;  
  40. };  

对于该结构的详细描述可以参考文末鸟哥的文章,写的非常详细,我就不关公面前耍大刀了,这里我只提出几个比较关键的点:

  1. PHP7 中的变量分为 变量名 和 变量值 两部分,分别对应 zval_struct和在其中声明的 value
  2. zval_struct.value中的 zend_long 、 double 都是 简单数据类型 ,能够直接储存具体的值,而其他复杂数据类型储存一个指向其他数据结构的 指针
  3. PHP7 中,引用计数器储存在 value 中而不是 zval_struct
  4. NULL 、 布尔型 都属于 没有值 的数据类型(其中布尔型通过 IS_FALSE 和 IS_TRUE 两个常量来标记),自然也就没有引用计数
  5. 引用 (REFERENCE)变为了一种数据结构而不再只是一个标记位了,它的结构如下:

  1. struct _zend_reference{  
  2. zend_refcounted_h gc;  
  3. zval       val;  
  4. }  

6.

zend_reference作为 zval_struct中包含的一种 value 类型,也拥有自己的 val 值,这个值是指向一个 zval_struct.value的。他们都拥有自己的 引用计数器 。

 

引用计数器用来记录当前有多少 zval 指向同一个 zend_value 。

针对第六点,请看如下代码:


  1. $a = 'foo';  
  2. $b = &$a;  
  3. $c = $a;  

此时的数据结构是这样的:

$a 与 $b 各拥有一个 zval_struct容器,并且其中的 value 都指向同一个

zend_reference结构, zend_reference内嵌一个 val 结构, 指向同一个 zend_string , 字符串的内容 就储存在其中。

 

而 $c 也拥有一个 zval_struct,而它的 value 在初始化的时候可以直接指向上面提到的 zend_string ,这样在拷贝时就不会产生复制。

下面我们就聊一聊在这种全新的 zval 结构中,会出现的种种现象,和这些现象背后的原因。

问题

一. 为什么某些变量的引用计数器的初始值为 0

现象


  1. $var_int = 233;  
  2. $var_float = 233.3;  
  3. $var_str = '233';  
  4. xdebug_debug_zval('var_int');  
  5. xdebug_debug_zval('var_float');  
  6. xdebug_debug_zval('var_str');  
  7. /** 输出 ** 
  8. var_int: 
  9. (refcount=0, is_ref=0)int 233 
  10. var_float: 
  11. (refcount=0, is_ref=0)float 233.3 
  12. var_str: 
  13. (refcount=0, is_ref=0)string '233' (length=3) 
  14. **********/  

原因

在 PHP7 中,为一个变量赋值的时候,包含了两部分操作:

  1. 为符号量(即变量名)申请一个 zval_struct结构
  2. 将变量的值储存到 zval_struct.value中 对于 zval 在 value 字段中能保存下的值,就不会在对他们进行引用计数, 而是在拷贝的时候直接赋值 ,这部分类型有:
  • IS_LONG
  • IS_DOUBLE

即我们在 PHP 中的 整形 与 浮点型 。

那么 var_str 的 refcount 为什么也是 0 呢?

这就牵扯到 PHP 中字符串的两种类型:

1.interned string 内部字符串(函数名、类名、变量名、静态字符串):

 

$str = '233';    // 静态字符串

 

2.普通字符串:

 

$str = '233' . time();

 

对于 内部字符串 而言,字符串的内容是唯一不变的,相当于 C 语言中定义在静态变量区的字符串, 他们的生存周期存在于整个请求期间,request 完成后会统一销毁释放 ,自然也就无需通过引用计数进行内存管理。

二. 为什么在对整形、浮点型和静态字符串型变量进行引用赋值时,计数器的值会直接变为2

现象


  1. $var_int_1 = 233;  
  2. $var_int_2 = &var_int;  
  3. xdebug_debug_zval('var_int_1');  
  4. /** 输出 ** 
  5. var_int: 
  6. (refcount=2, is_ref=1)int 233 
  7. **********/  

原因

回忆一下我们开头讲的 zval_struct中 value 的数据结构,当为一个变量赋 整形 、 浮点型 或 静态字符串 类型的值时,value 的数据类型为 zend_long 、 double 或 zend_string ,这时值是可以直接储存在 value 中的。而按值拷贝时,会开辟一个新的 zval_struct以同样的方式将值储存到相同数据类型的 value 中,所以 refcount 的值一直都会为 0。

但是当使用 & 操作符进行引用拷贝时,情况就不一样了:

  1. PHP 为 & 操作符操作的变量申请一个 zend_reference结构
  2. 将 zend_reference.value 指向原来的 zval_struct.value
  3. zval_struct.value的数据类型会被修改为 zend_refrence
  4. 将 zval_struct.value指向刚刚申请并初始化后的 zend_reference
  5. 为新变量申请 zval_struct结构,将他的 value 指向刚刚创建的 zend_reference

此时: var_int_2 都拥有一个 zval_struct结构体,并且他们的 zval_struct.value都指向了同一个 zend_reference结构,所以该结构的引用计数器的值为 2。

题外话:zend_reference又指向了一个整形或浮点型的 value,如果指向的 value 类型是 zend_string,那么该 value 引用计数器的值为 1。而 xdebug 出来的 refcount 显示的是 zend_reference的计数器值(即 2)

三. 为什么初始数组的引用计数器的值为 2

现象


  1. $var_empty_arr = [1, 2, '3'];  
  2. xdebug_debug_zval('var_empty_arr');  
  3. /** 输出 ** 
  4. var_arr: 
  5. (refcount=3, is_ref=0) 
  6. array (size=3) 
  7. 0 => (refcount=0, is_ref=0)int 1 
  8. 1 => (refcount=0, is_ref=0)int 2 
  9. 2 => (refcount=1, is_ref=0)string '3' (length=1) 
  10. **********/  

原因

这牵扯到 PHP7 中的另一个概念,叫做 immutable array (不可变数组)。 关于 immutable array 的详细介绍我放到下篇文章中讲,这里我们只需要知道,这样定义的数组,叫做 不可变数组 。

For arrays the not-refcounted variant is called an "immutable array". If you use opcache, then constant array literals in your code will be converted into immutable arrays. Once again, these live in shared memory and as such must not use refcounting. Immutable arrays have a dummy refcount of 2, as it allows us to optimize certain separation paths.

不可变数组和我们上面讲到的 内部字符串 一样,都是 不使用引用计数 的,但是不同点是,内部字符串的计数值恒为 0,而不可变数组会使用一个 伪计数值 2。

 

参考文章:

  • 深入解析PHP的引用计数机制
  • PHP 应用容器化以及部署方法
  • PHP解耦的三重境界(浅谈服务容器)

转载于:https://www.cnblogs.com/sohuhome/p/9800977.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/450996.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式系统的架构思路

见:http://www.cnblogs.com/chulung/p/5653135.html 一、前言 在计算机领域,当单机性能达到瓶颈时,有两种方式可以解决性能问题,一是堆硬件,进一步提升配置,二是分布式,水平扩展。当然&#xff…

狂赌智能手机 中国互联网巨头深陷零利润困局

编者按:智能手机正在中国普及,互联网企业趋之若鹜。然而,在苹果、三星共享智能手机市场99%利润的大背景下,中国互联网企业要从所剩无几的利润空间里分一杯羹,注定备受煎熬,前路迷茫。 互联网巨头纷纷进入智…

占用较多堆外内存的区域

(1)Director Memory 主要在nio中会使用,在内存不足时会抛出OOM或者OOM:Direct buffer memory。 (2)线程堆栈 为每个线程分配的栈空间,用于保存局部变量,执行程序代码。内存不足时可能抛出StackO…

Oracle SELECT INTO 和 INSERT INTO SELECT 两种表复制语句详解

在Oracle中select into from不可以使用,用create table select代替该功能!!!在Sql Server中可以正常使用。1.INSERT INTO SELECT语句语句形式为:Insert into Table2(field1,field2,...) select value1,value2,... from…

帆软地址栏传参,实例

自动查询: http://help.finereport.com/finereport9.0/doc-view-409.html参数的种类与区别: http://help.finereport.com/doc-view-156基本参数传递(视频): http://bbs.fanruan.com/lesson-14.html超级链接-传递多个值…

RMI 说明

见:https://baike.baidu.com/item/RMI/1786244?fraladdin RMI远程方法调用 相关概述 RMI是Java的一组拥护开发分布式应用程序的API。RMI使用Java语言接口定义了远程对象,它集合了Java序列化和Java远程方法协议(Java Remote Method Protocol)。简单地说&…

李善友:为什么外企人不敢创业

摘要:20年前,人们最骄傲的是进外企,创业意味着找不到工作。而现在相反,你要说自己在外企工作,会被人笑话,令人激动的事儿是去创业。 李善友:中欧创业中心主任创业学兼任教授、酷6网创始人 孙陶然…

JVM对象占用内存计算

大家都知道,jvm中对象实例存储在堆中,对象的引用存储在栈中,而对象的元数据(类型数据)存储在方法区。在我们进行内存优化的过程中经常需要了解每个对象占用的内存大小。接下来我将介绍对象占用内存大小的计算方式。 Java的对象模型 java是面…

绘图基础语法与常用参数

1 # -*- coding: utf-8 -*-2 3 ###############################################################################4 ####################### 正文代码 #######################5 #################################################################…

MyEclipse 皮肤、主题、背景色

第一步:打开myeclipse--->help--->install from site--->Add将路径粘贴在这里。等待安装颜色主题。https://raw.github.com/guari/eclipse-ui-theme/master/com.github.eclipseuitheme.themes.updatesite 第二步:http://eclipsecolorthemes.org…

RPC 远程过程调用协议

RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。 RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携…

周鸿祎:创业前的积累很重要

摘要:虽然公司上市,也投资了很多公司,日前,在中国人民大学的演讲中,周鸿祎却称自己“从来不是一个成功人士,曾经是一个最大的失败者”。 360特供机还没露面,已经被周鸿祎通过微博炒得火热&#…

BZOJ 4710 [Jsoi2011]分特产 解题报告

4710 [Jsoi2011]分特产 题意 给定\(n\)个集合,每个集合有相同的\(a_i\)个元素,不同的集合的元素不同。将所有的元素分给\(m\)个不同位置,要求每个位置至少有一个元素,求分配方案数。 先考虑两个简单的问题 给定\(m\)个相同元素和\…

java接口调试思想

对于接口调试的理解:最近多次参与接口调试工作,一般情况都是获取对方接口文档,文档中有加密验证方式,根据加密验证方式开发,调用对应的接口。可以不可以简化这个流程那,至少减少一方的工作量。1、减少调用方…

SOA (面向服务的架构)

见:https://baike.baidu.com/item/SOA/2140650?fraladdin UDDI 解说参见:UDDI是什么 SOAP解说参见: SOAP:简单对象访问协议 面向服务的架构(SOA)是一个组件模型,它将应用程序的不同功能单元(称…

mysql中count(*)和count(1)和count(column)区别

在日常的mysql使用中,我们经常会看到SELECT COUNT(*)、SELECT COUNT(1)等查询语句,他们到底有什么区别呢?今天我就来总结下。 我们先从函数的含义说起: count() 统计满足查询条件的结果集的总行数(包含null),其中count…

第一天笔记

编程语言分类: 1. 机器语言:用二进制指令编程,本质是直接操作硬件。 优点:执行效率高 缺点:开发效率低,学习难度高 2.汇编语言:用英文标签代替二进制指令,本质也是直接操作硬件。…

索尼MOTO等压榨国内代工厂:员工宿舍像监狱

摘要:据调查报告披露,伟易达血汗工厂的压榨情况比起富士康、苹果等有过之而无不及,包括强迫工人超负荷工作、暴露于有害化学物质、住宿环境差、虐待员工、超低的工资等。如前面保罗克鲁格曼发表了《表扬廉价劳动》一文,N.D.克里斯…

[cerc2012][Gym100624B]20181013

转载于:https://www.cnblogs.com/KonjakJuruo/p/9809637.html

Nginx服务器证书部署-亚洲诚信

Nginx服务器证书部署发布时间:2018-01-17 16:15:25依赖建议l SSL卸载驱动。建议:openssl版本1.1.0f。l nginx版本Stable version:最新稳定版,生产环境上建议使用的版本。获取证书MPKI方式:1. 登录https://mpki.tru…