本文讨论了基尼系数在评估收入和财富不平等中的局限性,尤其是在加密货币等非地理社区的应用。作者提出基尼系数将资源缺乏带来的痛苦和权力集中问题混为一谈,认为应该分开测量这两类问题,并介绍了几种替代的度量指标,如对数效用函数和赫芬达尔-赫希曼指数。作者强调,仅依赖基尼系数可能会夸大其在特定社区中所意味着的风险。
特别感谢 Barnabe Monnot 和 Tina Zhen 的反馈与审阅
基尼系数(也称为基尼指数)迄今为止是最受欢迎和广为人知的不平等测量指标,通常用于测量某个国家、地区或其他社区的收入或财富不平等。它之所以流行,是因为它易于理解,且其数学定义在图表上很容易视觉化。
然而,正如任何试图将不平等简化为一个数字的方案所料,基尼系数也存在其局限性。这种情况在它最初用于测量国家的收入和财富不平等的背景下是存在的,但当基尼系数被移植到其他背景(尤其是:加密货币)时,这种情况变得更加明显。在这篇文章中,我将讨论基尼系数的一些局限,并提出一些替代方案。
基尼系数 是由 Corrado Gini 在1912年提出的一种不平等测量指标。它通常用于测量国家的收入和财富不平等,尽管它也越来越多地被应用于其他背景。
基尼系数有两个等价的定义:
曲线之上的面积定义:绘制一个函数的图形,其中 f(p) 等于最低收入人群所获得的总收入的份额(例如 f(0.1) 是最低收入的 10% 所获得的总收入份额)。基尼系数是该曲线与 y=x 线之间的面积,作为整个三角形的一部分:
平均差异定义:基尼系数是所有可能的个体对之间收入的平均差异的一半,除以平均收入。
例如,在上面例子中的图表中,四个收入为 [1, 2, 4, 8]
,因此 16 个可能的差异为 [0, 1, 3, 7, 1, 0, 2, 6, 3, 2, 0, 4, 7, 6, 4, 0]
。因此平均差异为 2.875,而平均收入为 3.75,因此 Gini = (\frac{2.875}{2 \times 3.75} \approx 0.3833)。
事实证明,这两种定义在数学上是等价的(证明这一点是留给读者的练习)!
基尼系数是吸引人的,因为它是一个相对简单且易于理解的统计量。它可能看起来并不简单,但相信我,统计学中几乎所有与任意规模的人口有关的内容都是这样的,且通常要糟糕得多。在这里,看看像标准差这样基本的公式:
σ=∑i=1nxi2n−(∑i=1nxin)2
而这是基尼系数:
G=2∗∑i=1ni∗xin∗∑i=1nxi−n+1n
其实它相当温和,我保证!
那么,基尼系数有什么问题呢?好吧,存在很多问题,人们已经写过很多文章讨论基尼系数的各种问题。在这篇文章中,我将专注于一个我认为被讨论得不足的特定问题,但与分析互联网社区(如区块链)中的不平等极为相关。 基尼系数将两种看似非常不同的问题结合为一个不平等指数:由于缺乏资源而造成的痛苦和权力的集中。
为了更清楚地理解这两者之间的区别,来看两个反乌托邦场景:
以下是这两个反乌托邦的洛伦兹曲线(我们看到的那种华丽图表):
显然,这两个反乌托邦都不是理想的居住地。 但是,它们不是很好生活的地方却有着非常不同的方式。反乌托邦 A 给每个居民一个硬币抛掷的机会,如果他们落在左半部分的分布中,他们就会遭遇难以想象的可怕饥荒,而如果他们落在右半部分,则就会享受平等的和谐。如果你是灭霸,你可能会喜欢!如果你不是,那就值得用最强大的力量来避免。而反乌托邦 B,另一方面,像《美丽新世界》一样:每个人都过着相对不错的生活(至少在捕捉到的每个人的资源快照时),但代价是一个极其不民主的权力结构,你最好希望你的领主是好的。如果你是库尔特·雅尔文,你可能会喜欢!如果你不是,那也值得避免。
这两者之间的差异足够大,值得分开分析和测量。而且这种差异并不仅仅是理论上的。这是一个图表,展示了最低 20% 所获得的总收入份额(避免反乌托邦 A 的不错代理)与最高 1% 所获得的总收入份额(接近反乌托邦 B 的不错代理):
这两者明显是相关的(系数 -0.62),但远非完全相关(统计学的高阶牧师们显然认为](https://www.andrews.edu/~calkins/math/edrm611/edrm05.htm) 0.7 是“高度相关”的下限,而我们甚至低于这个值)。图表所能分析的一个有趣的第二维度是——一个国家在最高 1% 赚取 20% 总收入,而最低 20% 赚取 3% 与一个国家在最高 1% 赚取 20% 而最低 20% 赚取 7% 之间有什么不同?遗憾的是,这样的探索最好留给其他更有经验的数据和文化探索者。
具体而言,区块链领域内的财富集中是一个重要问题,值得测量和理解。这对整个区块链领域很重要,因为许多人(以及美国参议院听证会)正在试图弄清楚加密货币在多大程度上确实是反精英主义的,以及在多大程度上只是将旧精英替换为新精英。在比较不同加密货币时,这也是重要的。
鉴于对这些问题的关注程度,毫不奇怪,许多人已经尝试计算加密货币的基尼指数:
甚至更早之前,我们也得应对这篇耸人听闻的文章(2014年):
除了这样的分析中比较常见的粗心办法错误(通常混淆收入与财富的不平等,混淆用户与账户,或两者都是),使用基尼系数进行这类比较还有一个深刻而微妙的问题。这个问题在典型地理社区(例如城市、国家)和典型互联网社区(例如区块链)之间的关键区别中找到:
典型的地理社区居民大多数时间和资源都在该社区内消耗,因此测量的地理社区内的不平等反映了人们可获得的总资源的不平等。 但在互联网社区中,测量的不平等可能来自两个来源:(i)不同参与者可用资源的总不平等,以及(ii)参与社区的兴趣水平的不平等。
一个拥有 15 美元法币的普通人是贫穷的,且错过了过上好生活的机会。一个拥有 15 美元加密货币的普通人则是一个仅仅出于好玩而开设过一个钱包的偶尔玩家。兴趣水平的不平等是一件健康的事情;每个社区都有偶尔玩家和全职的重度爱好者。所以如果一个加密货币具有非常高的基尼系数,但结果表明这种不平等的大部分是由于兴趣水平的不平等所致,那么这个数字指向的现实要比头条所暗示的要少得多。
即便是那些被证明具有高度富豪型属性的加密货币,也不会让世界的任何部分接近反乌托邦 A。但分布不均的加密货币可能确实看起来像反乌托邦 B,如果在协议决策时使用投票治理尤其是。因此,为了检测加密货币社区最关心的问题,我们希望有一个能够更具体捕捉接近反乌托邦 B 的指标。
测量不平等的替代方法包括直接估计由于资源不平等分配而造成的痛苦(即“反乌托邦 A”问题)。首先,从某种效用函数开始,代表拥有某一金额的价值。log(x) 是流行的,因为它捕捉到一种直观的近似:在任何水平下,收入翻倍带来的价值大致相同:从 10,000 美元增加到 20,000 美元的效用与从 5,000 美元增加到 10,000 美元或从 40,000 美元增加到 80,000 美元是一样的)。得分后,就可以通过测量相对于如果每个人都只获得平均收入时损失了多少效用来计算:
log(∑i=1nxin)−∑i=1nlog(xi)n
第一个项(平均值的对数)是每个人如果钱被完美再分配时会有的效用,由此每个人都能得到平均收入。第二个项(对数的平均值)则是今天该经济中的平均效用。这个差异代表了由于不平等而导致的效用损失,如果狭义地看待资源时就是用于个人消费的东西。还有其他方法可以定义这个公式,但它们的贡献应该是近似等价的(例如,安东尼·阿特金森 1969年的论文提出了一种“均匀分配的收入水平等效”指标,在 U(x)=log(x) 情况下,这只是上述一个单调函数,而泰尔 L 指数在数学上与上面的公式完全等价)。
要测量集中度(或“反乌托邦 B”问题),赫芬达尔-赫希曼指数是一个很好的起点,已经用于测量行业内的经济集中度:
∑i=1nxi2(∑i=1nxi)2
或者对于可视化学习者来说:
还有其他替代方案;泰尔 T 指数具有一些相似的属性,但也有一些不同。一个更简单且更粗糙的替代方案是中本聪系数:计算出参与者的最低数量,实现 50% 以上的总数。请注意,这三种集中度指标都非常关注顶部发生的事情(并有意为之):大量偶尔玩家的少量资源对子指标的贡献微乎其微,而两位顶层参与者的合并则可以对该指数产生重大变化。
对于加密货币社区,资源集中是系统面临的最大风险之一,但某人仅拥有 0.00013 枚币并不是他们实际上正在挨饿的证据,因此采取这样的指数显然是合乎逻辑的。但即便对于国家而言,也很有必要讨论和测量权力和缺乏资源带来的痛苦更为分开。
毕竟,某种程度上我们不得不超越这些指标。集中带来的伤害不仅仅是参与者规模的问题;还与参与者之间的关系以及他们的合谋能力息息相关。同样,资源分配也是网络依赖的:如果缺乏正式资源而某人有一个非正式的网络可以依靠,那么生活可能不会那么痛苦。但处理这些问题是一个更困难的挑战,因此在我们仍然没有足够的数据时,我们也需要更简单的工具来处理这些问题。
- 原文链接: vitalik.eth.limo/general...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!