该文章分析了自以太坊合并以来两年间的提议者-构建者数据和MEV-Boost支付数据,旨在识别多区块MEV的模式。研究发现,连续的构建者序列比随机模拟预测的要少,平均MEV-Boost支付随着连续序列的增长而增加。文章还探讨了MEV-Boost支付的自相关性以及基础费用波动性对构建者的影响,为理解多区块MEV的实际应用提供了数据支持。
作者:Pascal Stichler (ephema labs)
非常感谢 Toni, Julian, Danning, Chris 和 Marc 的反馈,特别感谢 Barnabé 一开始推动了这项研究并持续提供反馈。
详细结果可在 Github 上的 Jupyter 笔记本或 Google Colab 中找到。
多区块最大可提取价值 (MMEV) 发生在一方控制多个连续区块时。它最初由 [ 1] 在 2021 年作为 k-MEV 引入,并由 [ 2] 进一步阐述。通常认为,控制序列中的多个 slot 比单独控制它们可以捕获更多的 MEV。这源于 MEV 随时间推移呈超线性增长。讨论最多 的多区块 MEV 策略包括 DEX 上的 TWAP 预言机操纵攻击 和通过价格操纵产生强制清算。
合并后,[ 3] 研究了前四个月的多区块 MEV 数据,并将其总结为“初步且非结论性的结果,表明 [构建者] 采用超线性竞价策略来确保连续的区块空间”。
随着最近的 Attester-Proposer-Separation (APS) 和预确认讨论,多区块 MEV 再次成为一个更紧迫的问题,因为它可能会对一些提议的设计产生限制(为了更深入的概述,我们创建了一个 最近提出的机制设计的图表,并且 Mike Neuder 最近也给出了一个 全面的概述)。
为了更好地理解多区块 MEV 的历史普遍性,我们决定查看从 22 年 9 月合并到 24 年 5 月的所有 slot(总计约 430 万个 slot),并分析验证者和构建者以及 MEV-boost 支付的相应数据(如果适用)。范围是识别不寻常的连续 slot 序列和随附的 MEV 值模式。该数据 由 Toni Wahrstätter 慷慨提供,其中包含每个 slot 中继、构建者公钥、提议者公钥和 MEV-Boost 值以及构建者公钥和验证者公钥映射的信息。在标记验证者时,我们将 Lido 或 Rocket Pool 等 staking pool 提供商视为一个实体。
MEV-Boost 支付用作每个区块 MEV 的代理。我们承认这只是一个不完美的近似值。本质上,MEV-Boost 升序头价拍卖作为公开拍卖,其本质上就像二价 + 1 wei 拍卖一样(感谢 Julian 指出这一点!)。因此,严格来说,我们只能估算出第二高出价者的内在价值。然而,正如 [ 4] 观察到的,超过 88% 的 MEV-Boost 拍卖具有竞争力,并且 [ 5] 得出结论,前三名构建者的平均利润率在 1% 到 5.4% 之间,进一步表明了顶级构建者之间存在竞争激烈的市场。基于此,尽管存在局限性,但我们认为可以使用 MEV-Boost 支付作为每个区块生成的 MEV 的近似值。
为了建立预期多 slot 序列的基线,进行了蒙特卡洛模拟。在此模拟中,根据构建者在该期间观察到的每日市场份额,将构建者随机分配给指定时间段内的每个 slot。记录了长度从 1 到 25(经验数据中观察到的最长序列)的连续 slot 的频率。此过程重复 100 次,并取平均值。我们决定在主要分析中使用每日市场份额,因为在调查的时间段内,市场份额发生了很大变化 [4]。为了进行比较,我们还对每月和总体市场份额进行了分析。
此外,还包括基础费用波动率数据,以交叉检查低波动率和高波动率时期的影响。先前的研究(例如 [ 6] & [ 7])侧重于基于 CEX 价格的代币价格波动率影响。由于我们对低 MEV 和高 MEV 环境感兴趣,因此我们认为基础费用波动率更适合我们的用例,因为它是由空区块或满区块驱动的,而空区块或满区块至少部分是 MEV 机会普遍存在的结果。
[
1000×800 25.1 KB](https://ethresear.ch/uploads/default/original/3X/b/6/b6ab4921507e70c619d5121b5abf611e67e2138f.png "")
图 1:统计预期与观察到的多 slot 序列的比较(请注意,为简洁起见,> 25 的 slot 已在 slot 25 中汇总)
首先,调查了同一构建者提出区块的多 slot 序列的普遍性,以确定它们是否比偶然预期发生的更常见。
将蒙特卡洛模拟的结果作为预期分布的基线(蓝色)与观察到的分布(橙色)进行比较,可以看出,发生的多 slot 序列明显少于预期(图 1)。观察到的最长序列为 25 个 slot,并且 2024 年 3 月 4 日同一验证者 (Lido) 和构建者 (BeaverBuild) 的最长连续序列为 11 个连续 slot(更多详细信息,请参见 notebook 中的描述性统计信息)。如果在时间段内对每月或总市场份额运行相同的模拟,则观察结果会变为具有比预期更长的序列,但是我们将此归因于市场份额变化的统计效应。可以在 notebook 中运行详细分析,或者可以根据要求提供。
在下一步中,为了更精细地理解这一点,将每个市场份额最高的 10 位构建者的值进行比较。因此,对于每个构建者,绘制了多 slot 序列的预期和观察到的发生次数之间的差异,气泡的大小指示图 2 中的增量。预期发生次数基于蒙特卡洛模拟的结果。红色气泡表示正偏差(观察到的 slot 多于预期的),而蓝色表示负偏差。绿色点表示符合期望的值。图 2 显示了绝对数字,在 notebook 中也可以在相对尺度上看到它。
[
1200×800 99.7 KB](https://ethresear.ch/uploads/default/original/3X/e/9/e94454973c4bf844c96e0a1735409a130a0983dd.png "")
图 2:每个构建者的预期(蒙特卡洛模拟)和观察到的多 slot 频率之间的偏差
可以在相对偏差以及绝对偏差中观察到,对于顶级构建者,单个 slot 序列比预期的要多,但 ETH-Builder、f1b 和 Blocknative 除外。对于具有两个或多个 slot 的多 slot 序列,几乎所有前 10 名构建者的序列都少于预期。这表明该趋势不仅限于单个实体,而是更多地源于一般的市场结构。
为了了解多 slot 序列是否有价值,我们研究了 MEV-Boost 支付并将单个 slot 序列与多 slot 序列进行了比较(图 3)。
图 3:每个序列长度的平均 MEV-Boost 支付
可以观察到,根据 [3] 的先前工作,我们观察到对于较长的连续序列,平均 MEV 支付更高(从单个 slot 序列的约 0.05 ETH 到九个连续 slot 的约 0.08 ETH)。请注意,图 3 中的灰色数字提供了每个 slot 长度的样本大小。因此,可以观察到,序列越长,序列中每个 slot 的平均 MEV-boost 支付几乎呈线性增长。在研究的这个阶段,我们只能推测为什么会这样。这可能是由于较长的连续序列具有更高的价值驱动,但也可能是由于其他影响。例如,Julian 正确地指出,这也可能是由于私人订单流中累积 MEV,第二高出价者的内在价值增加,而获胜出价者的内在估值保持不变。或者,正如 Danning 建议的那样,它可能是由某些类型的专有订单流(例如,CEX-DEX 套利)在某些时间段(例如,波动时期)更有价值驱动,从而导致更多的连续序列以及平均更高的 MEV-Boost 支付。为了获得更全面的答案和更深入的理解,需要分析真正的区块价值(构建者利润加上提议者支付)以及潜在的单个 tx 级别。我们将此留给未来的研究。
当绘制每个 building 的平均支付时,该趋势也成立。notebook 中显示了有关此结果。
作为绝对平均支付的补充,我们还研究了较长序列中每个 slot 位置的支付(图 4)。例如,较长序列中第三名的平均支付是多少。
图 4:每个序列位置的平均 MEV-Boost 支付
在每个 slot 支付分析中也可以观察到类似的趋势,但不太普遍。这表明在更长的序列中存在轻微的价值,但是构建者不愿意为更长的连续序列或更长序列之后的第一个 slot 出价更高。
这对我们来说表明,至少到目前为止,尚未系统地应用多 slot 策略。在这种情况下,我们预计构建者需要为后面的 slot 支付更高的价值,以确保捕获先前准备的 MEV 机会。
[
1165×701 77 KB](https://ethresear.ch/uploads/default/original/3X/9/d/9db050ae9f5aa540ea6f3c5b6270dee27e111380.png "")
图 5:MEV-Boost 支付的自相关
我们检查了 MEV boost 支付中的自相关性,以了解历史 MEV 数据是否允许我们预测未来的 MEV,并查看是否存在低 MEV 和高 MEV 期间(图 5)。
总体而言,可以观察到,在前几个 slot 中,相关性急剧下降,直到 2 到 3 个 slot 的偏移量(我们测试了皮尔逊相关系数、斯皮尔曼等级相关系数和肯德尔等级相关系数)。基于此,我们可以得出结论,基于历史数据,最多提前一到三个 slot 可以适度预测 MEV 值。
可以进行更多有趣的观察。正如预期的那样,斯皮尔曼和肯德尔相关系数显着高于皮尔逊相关系数,这突出了数据不是遵循正态分布,而是倾斜且具有较大异常值。此外,有趣的是,对于皮尔逊相关系数,完整数据集和前 50% 分位数数据集的行为类似,而斯皮尔曼和肯德尔系数并非如此。这可能表明可以更可靠地预测较低 50% 分位数的等级排序,进一步强调了高 MEV 值是易变和尖峰的,因此难以预测。
先前的研究(例如 [6] 和 [7])发现某些构建者专门从事低或高代币价格波动环境,而波动是在 CEX 价格变化上衡量的。此外,[5] 观察到不同的构建者有不同的策略,一些专注于高价值区块,而另一些则专注于在低 MEV 区块中获得市场份额。
作为补充,为了确定低或高基础费用波动是否会影响(多区块)MEV,我们分析了基础费用数据的变化以识别高波动时期。基础费用波动是由先前区块中的 gas 使用量低于或高于 EIP-1559 定义的 gas 目标所驱动的。为了识别高波动环境,我们采用了两种方法:(i) 一种更简单的方法,计算每个 slot 的价格变化,将这些变化的最高和最低(负)10% 分类为高波动时期,其余 80% 的 slot 被归类为低波动。因此,高波动区块发生在 MEV 和/或优先提示最小或显着的区块之后。(ii) 其次,在 epoch 基础上计算 Garman-Klass 波动率 [ 8],其中 GK 值的前 20% 中的 slot 被指定为高波动。这种方法允许我们检查以 MEV 和/或优先提示最小或显着特征的更长时期。
初步相关性分析表明,低波动和高波动时期与相应的构建者之间的相关性较低(朴素方法的 Cramér’s V 为 0.0664,Garman-Klass 为 0.0772)。这表明似乎没有基于基础费用波动环境的构建者专业化。因此,可以观察到,与代币价格波动率相反,对于基础价格波动率,似乎尚未开发构建者的专业化(尚未)。需要进一步研究以阐述这一初步发现。
此处介绍的研究旨在作为数据的初步探索性分析,而不是全面的研究。重要的是要注意影响此分析范围和结论的几个限制。首先,它受到所考虑数据集的限制,该数据集是公开可用的 MEV-Boost 支付数据。这遗漏了大约 10% 的非 MEV-Boost 促进的区块,并且不反映潜在的私人链下协议。此外,数据部分不完整,其他部分包含重复信息(有关详细信息,请参见 notebook)。此外,到目前为止,已排除错过的 slot。未来的更详细分析可能会侧重于错过 slot 对后续 MEV 的特定影响。最后,如方法论部分概述的那样,使用 MEV-Boost 支付只是捕获的 MEV 的代理,并且 [4] 中使用的竞争指标仅部分适用于我们的用例。
如第 2 节“发现”中所述,目前只能推测平均 MEV-Boost 支付增加的原因。此外,在实际区块价值(提议者支付加上构建者利润)上运行分析可能会产生进一步的见解并巩固研究结果。
关于频率分析,该方法在某种程度上包含了一个先有鸡还是先有蛋的问题。蒙特卡洛模拟是在市场份额上运行的,而市场份额可能来自多 slot 序列。我们认为每日时间窗口是精度与过滤掉孤立效应的需求之间的适当平衡,尽管这可能会受到严重挑战。
分析自合并以来的区块元数据,我们观察到多 slot 序列的发生频率低于统计预期。此外,我们观察到,对于较长的多 slot 序列,平均支付额随着序列长度的增加而增加。同样,较长序列中每个 slot 位置的支付额也略有上升。这可能表明更长的连续序列通常具有价值。但是,考虑到价值仅略有增加,并且观察到的多 slot 序列比预期的要少,因此到目前为止,我们没有看到已部署有意的多 slot MEV 策略的迹象。同样,在各个构建者级别,我们目前也没有观察到与预期分布的强烈偏差。这也可能源于当前 PBS 机制,其中 MEV-Boost 作为即时 (JIT) 区块拍卖运行,创建多区块 MEV 机会会带来固有的风险。产生这种风险是因为创造这些机会通常需要前期投资,并且假设提议者和构建者之间没有链下勾结,该机会可能会在下一个 slot 中被竞争构建者捕获。这种风险因素是机制变化的 proposed 的关键因素,(例如,一些 APS 设计)使其成为 defining 未来机制时的基本考虑因素。
[1] Babel K, Daian P, Kelkar M, Juels A. Clockwork finance: Automated analysis of economic security in smart contracts. In 2023 IEEE Symposium on Security and Privacy (SP) 2023 May 21 (pp. 2499-2516). IEEE.
[2] Mackinga T, Nadahalli T, Wattenhofer R. Twap oracle attacks: Easier done than said?. In 2022 IEEE International Conference on Blockchain and Cryptocurrency (ICBC) 2022 May 2 (pp. 1-8). IEEE.
[3] Jensen JR, von Wachter V, Ross O. Multi-block MEV. arXiv preprint arXiv:2303.04430. 2023 Mar 8.
[4] Yang S, Nayak K, Zhang F. Decentralization of Ethereum’s Builder Market. arXiv preprint arXiv:2405.01329. 2024 May 2.
[5] Öz B, Sui D, Thiery T, Matthes F. Who Wins Ethereum Block Building Auctions and Why?. arXiv preprint arXiv:2407.13931. 2024 Jul 18.
[6] Gupta T, Pai MM, Resnick M. The centralizing effects of private order flow on proposer-builder separation. arXiv preprint arXiv:2305.19150. 2023 May 30.
[7] Heimbach L, Pahari V, Schertenleib E. Non-atomic arbitrage in decentralized finance. arXiv preprint arXiv:2401.01622. 2024 Jan 3.
[8] Meilijson I. The Garman-Klass volatility estimator revisited. arXiv preprint arXiv:0807.3492. 2008 Jul 22.
- 原文链接: ethresear.ch/t/does-mult...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!