2.4 分解方法_中国收入分配演变40年-QQ阅读仙侠女生网

上QQ阅读APP看书，第一时间看更新

2.4　分解方法

2.4.1　按收入来源分解

1.按收入来源和收入构成

Lerman和Yitzhaki（1985）提供的方法认为，对于以基尼系数来衡量的收入差距水平可以把整体差距分解到不同收入来源上去，根据前面基尼系数的计算公式，可以把基尼系数分解为，其中θj为单项收入来源占总收入的份额，而Cj为单项收入的基尼系数。根据这一分解公式，我们可以把家庭总体收入分配差距，分解到不同收入来源的不平等上。如Stark等（1986）就首次利用这种方法，把家庭人均总收入分解到工资性收入、财产性收入、经营性收入、转移性收入中，并特别把外出务工成员的汇款作为家庭收入来源，由此考察了汇款在收入差距中的重要贡献。同样Gustafsson和Wan（2018）利用1988—2013年的数据，分解了城镇职工所有劳动报酬中，属于与政策相关的“五险一金”政策对职工劳动收入差距的影响程度。而表2.5则提供了2013年城镇职工劳动报酬差距的来源分解，发现基础工资差距是总劳动报酬差距的主要原因，而这主要是由于基础工资在整体劳动报酬中的份额占比偏高所带来的。

表2.5　2013年城镇职工所有劳动报酬差距来源分解

2.方差分解

估计解释性因素对收入所采用的计量方法，大多为回归分析、相关分析等，从中可以发现决定收入的显著变量，但不能估计这些变量对收入差距贡献的比重，而因变量方差分解法则可以用来估计自变量对因变量方差的贡献，从而分解各个因素对收入差距的贡献占比（Ohtake and Saito，1998），具体的估算方程为：var（y1+y2）=var（y1）+var（y2）+2cov（y1，y2）。其中，曲兆鹏、赵忠（2008）采用CHIP1988年、1995年和2002年三年的微观数据，利用方差分解和回归分解方法，具体分析了老龄化对不平等变化的影响，从而将我国农村总的收入不平等分解为出生组间不平等、出生组内不平等和老龄化效应。表2.6的结果发现，出生组内不平等是总体不平等变化的主要原因，因为与组内效应相比，两个时期的组间效应都很小。这说明我国农村不平等在1988—2002年的变化，主要表现为在同一出生组内部老年人和年轻人之间差距的拉大（曲兆鹏、赵忠，2008）。

表2.6　使用方差分解来分析收入不平等

资料来源：曲兆鹏、赵忠（2008）。

2.4.2　按人群组分解

1.泰尔指数或MLD指数分解

除了把收入不平等归因于不同的收入来源渠道，还可以把整体收入差距分解为不同的人群，如城乡之间、地区之间、行业之间、男女之间和不同的文化程度之间，从而把整体收入差距分解为两方面，即组内差距和组间差距。以比较常见的泰尔指数为例，它可以表述为：

其中T为收入差距程度的测度泰尔指数，yi与分别代表第i个体的收入和所有个体的平均收入。泰尔指数作为收入不平等程度的测度指标具备良好的可分解性质，即将样本分为多个群组时，泰尔指数可以分别衡量组内差距与组间差距对总差距的贡献。假设包含n个个体的样本被分为K个群组，每组分别为gk（k=1，2，……，K），第k组gk中的个体数目为nk，则有，yi与yk分别表示某个体i的收入份额与某群组k的收入总份额，记Tb与Tw分别为群组间差距和群组内差距，则可以将泰尔指数分解如下：

从式（2.2）可以知道，泰尔指数的分解结果非常干净，仅保留为组内Tw和组间差距Tb这两项。同样，对于MLD指数来说，它也可以分解为：

其中n为在样本中个体的数量，Ng为g组的人口数，且有为g组的人均收入，yi为第i个样本的收入，参数α代表给予收入分配不同组之间收入的差距的权重。利用泰尔指数或MLD进行人群分解的文献比较常见，如李实等（2008）就对城乡和地区间的差距进行了分解，表2.7的结果发现城乡之间不平等能够解释整体收入差距的50%左右，而且在1988年至2002年间持续提高。

表2.7　按城乡分解的收入不平等结果（按平均对数偏差；单位：%）

资料来源：李实、史泰丽、古斯塔夫森（2008）。

2.Oaxaca-Blinder分解方法

国际上对于组间工资差距的分析主要采用的方法有Oaxaca（1973）分解和Brown等（1980）分解两种。其中，Oaxaca分解旨在将组间差距分解为可以解释的和不可解释的两部分。根据该方法，首先需要分性别估计工资决定机制，把决定机制中系数差异带来的工资差距称为不可解释的，并一般认为是歧视作用的结果。Brown分解则先把组间差距分为部门之间分布差异所带来的和部门内部带来的差异，并将其分别分解为可以解释的和不可解释的差异。Oaxaca方法的原理可以表述如下：男性劳动力的平均工资记为，女性劳动力的平均工资记为，那么性别之间的工资差距为，其中，X是工资方程中所有解释变量的向量，β是这些解释变量的估计系数组成的向量，下标m和f分别表示男性组和女性组。此时，性别工资差异可以被分解成两个部分：，其中是两个性别组之间的个人或就业特征差异带来的工资差异，通常被称为可以“解释的成分”或“非歧视成分”，或是两个性别组工资方程或收入方程的系数差异带来的工资差异，通常被称为“不可解释的成分”或“歧视成分”（李实、宋锦、刘小川，2014）。在实际使用Oaxaca方法估算时，通常使用最小二乘法（OLS）来估计工资函数方程，并得到每个可解释和不可解释部分的大小。表2.8中，李实、宋锦、刘小川等（2014）就分解了不同时期个体或市场禀赋特征即可解释因素，在解释总体工资差距变化中的作用，发现禀赋因素可以解释2002—2013年工资差距变化的17.9%，其中主要来自教育的扩张和劳动力市场中的所有制结构变迁等。

表2.8　使用Oaxaca方法分解工资差距（%）

注：（1）因变量为工资对数，并调整至2013年，也加权至全国；（2）上表仅为工资差距的禀赋特征解释程度。

资料来源：李实、宋锦、刘小川等（2014）。

2.4.3　按解释要素分解

1.基于回归分解

传统意义上，对收入差距的分解是按照人群组或收入分项来源进行的，这里通常存在两个问题。第一，研究者只能根据离散变量（如性别、地区、行业）来分解收入差距，而很难对连续变量进行分解。第二，如果自变量和因变量存在相关关系，则不可能对收入差距进行分解。基于回归模型的分解技术则解决了这个问题（Shorrocks，1999；Morduch and Sicular，2002；Wan，2004）。该方法的基本思想是首先获得回归方程中一个自变量的平均值，然后把该自变量的平均值和其他自变量的实际数据一起放进回归方程中进行回归，从而估计出收入变量并计算相应的收入差距指标。因为采用这样的方法所计算出的收入差距指标并不包含该变量对收入差距的影响，因此计算出的收入差距指标与根据实际数据计算的收入差距指标的差值就是该变量对整体收入差距的贡献。[17]

万海远和李实（2014）通过基于回归方程的沙普利（Shapley）值分解方法（见表2.9），估计了社会关系网因素对农村收入差距的贡献率，发现关系网络能够解释整体收入不平等程度的11%，贡献程度列第4位，排在资产、家庭特征与村庄固定效应之后。基于同样的方法，也有研究估计了各个因素对城镇职工工资差距的贡献程度，发现个体工作经验和受教育程度能够解释整体工资差距的65%左右（Gustafsson and Wan，2018）。

表2.9　基于回归的工资差距分解

注：（1）因变量为工资对数，并调整至2013年，也加权至全国；（2）表中采用基于回归的分解方法；（3）由于1988年婚姻指标和2007年政治面貌指标缺失，因此贡献率为0。

资料来源：万海远、李实（2013）。

2.基于残差分解

残差收入指的是工资回归方程的残差，它是劳动者收入中无法由可观测的劳动者个体特征（如受教育程度、工作经验等）解释的部分。虽然目前对收入不平等的研究非常丰富，但大部分文献都忽略了残差收入中所蕴含的大量信息，在一定程度上将回归残差看作一个“黑匣子”，而没有进一步加以剖析。与收入不平等相对应，“残差收入不平等”指的是残差收入在不同劳动者间分布的均匀程度。残差收入不平等有时也被称为“组内收入不平等”，它衡量了具有相同可观测个体特征的劳动者的收入不平等状况（徐舒、朱南苗，2011）。

李实等（2017）为了分析残差不平等，首先用工资对教育、性别、工作经验以及各个变量的交互项和地区虚拟变量进行OLS回归，得到残差值。表2.10展示了工资残差不平等的总体情况，由不同群体内部工资差距加权而得。从结果可以发现，在去除不同群体之间的工资差距后，工资不平等程度仍然严重，并且在1995—2013年间不断加剧。残差工资差异约占工资总差异的三分之二（用方差来衡量）（李实、吴珊珊、邢春冰，2017）。同样，Gustafsson和Wan（2018）采用残差分解的方法，计算了组内不平等对总体收入不平等贡献的变化情况，从图2.2可以发现收入水平越高的群体，则组内不平等的贡献率就越大。

表2.10　1995—2013年对数工资的均值、各分位点、方差以及残差

注：表中把住户对数工资从低到高进行排序并进行一百组等分，其中P10是指较低的第10分位组对应的对数工资水平，以此类推得到P50、P90等。其中，P90—50就是指第90分位的对数工资与第50分位的对数工资之比，以此类推得到其他比例值。

图2.2　工资残差的增长与分配

资料来源：Gustafsson和Wan（2018）。

注：（1）因变量为工资对数，并调整至2013年，也加权至全国；（2）以对数工资为因变量进行回归，并预测了不能被解释变量所解释的部分，且将其定义为残差。