文章介绍了 EthPandaOps 团队开发的 Validator Report 工具,用于调查以太坊验证者的性能问题。通过交互式矩阵报表,用户可以点击下钻从日到小时到槽位,快速定位缺失区块提议和头部投票异常等具体问题。文章以12个主网验证者为例,展示了如何通过点击和悬停找到异常行,并分享了可共享 URL 和 Markdown 下载功能。工具帮助节点运营商将模糊的警报转化为具体的验证者、日期、小时和槽位,便于进一步排查。

大多数验证者问题始于一个警报或一个异常的图表,但要深入挖掘实际发生的事情可能很困难。通常你只有一个验证者索引和一个大致的时间范围,但要仔细查阅数据可能会让人不知所措。这就是 The Lab 中新的验证者报告页面的用武之地,它允许你将“这里看起来有问题”的报告转化为具体的验证者、日期、小时和插槽。
在本指南中,我将十二个公开的主网验证者加载到一个最近的报告窗口中。大部分组看起来健康,但仔细一看,有两行出现了问题。这是节点运营者常见的一种模式:数据在聚合层中丢失。

点击一个天单元格,然后点击一个小时单元格;矩阵逐级下钻,同时下方表格展开。
顶部的摘要卡片让你快速了解验证者的状态。

摘要大部分看起来健康,但提议卡片和 head-vote 子指标打破了常规。截图使用了更严格的阈值;数据保持不变。
在这十二个验证者中,基线很扎实:99.94% 的证明包含率,50 次遗漏的职责,99.74% 的投票正确性,每个验证者都处于活跃状态。薄弱环节是 head 投票,为 99.3%。
提议卡片显示我们遗漏了 1 个区块提议(7/8)。区块提议更容易追踪,所以先从遗漏的提议开始,然后再检查 head-vote 的线索。
验证者 1329583 是遗漏提议的那一行:0 / 1。验证者 2061162 是干净的对比对象,为 2 / 2。

验证者 1329583 显示 0 / 1 提议,而验证者 2061162 显示 2 / 2。
我们首先查看每日表现,在包含延迟指标中并没有直接找到关键证据。切换到 Head,整体表现看起来仍然平淡无奇。我们可以注意到验证者 1299575 在 5 月 13 日 head 准确率略微下降到了 94%。这里的所有单元格都是可点击的,但先悬停以获取快速摘要。

先悬停每日单元格:验证者 1299575,星期三,5 月 13 日,94.0% head 投票。
图表将该特定日期从天切换到小时,我们终于开始看到发生了什么。

一次点击打开小时矩阵;20:00 UTC 的格子 head 投票下降到 44.44%。
然后打开 20:00。该小时 head 投票正确性下降到 44.44%,平均包含延迟为 1.33。下方插槽行显示实际收据:遗漏的 head 投票以及一个花费了 3 个插槽才落地的证明。

静态收据:验证者 1299575 -> 2026-05-13 -> 20:00 -> 插槽行。
我们终于找到了一些出问题的插槽。从这里开始,是时候查看节点日志并弄清楚发生了什么了。对于这些插槽,我发现与 The Lab 上的其他数据(特别是 Slot View)进行关联非常有用。
URL 是可分享的,这意味着你可以将其发送给另一位运营者,他们会看到完全相同的视图(精确到插槽)。我们还内置了下载报告功能,允许你导出当前阈值的 Markdown。
爱你的,
EthPandaOps 团队
- 原文链接: ethpandaops.io/posts/val...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!
作者暂未设置收款二维码