该文章是RISC Zero团队发布的zkVM 1.0的性能基准测试报告,通过与Succinct的SP1 zkVM进行对比,展示了RISC Zero在通用计算、成本和速度方面的优势。测试覆盖了多种硬件设备和云计算实例,以及不同的工作负载,例如sha2哈希、斐波那契数列计算、排序等,证明RISC Zero zkVM在多个方面优于SP1。
性能领先者: zkVM 1.0 提供高效性能,在通用计算方面优于竞争对手。
面向未来: 持续改进确保 RISC Zero 将保持其在 zkVM 性能方面的领先地位。
竞争优势: 全面的基准测试表明,RISC Zero 在各种工作负载的成本和速度方面都具有优势。





几周前,我们暗示了一种可能性,即 ZK 证明系统比 Plonky3 更快,Plonky3 是许多其他项目(包括 Succinct 的 SP1)使用的证明系统。最近,Valida 团队发布了独立的基准测试,揭示了一些有趣的见解。现在,是时候分享我们比较 RISC Zero zkVM 和 SP1 zkVM 的数据了。
在 RISC Zero,我们很高兴地分享 zkVM 1.0 的性能明显优于竞争对手。我们的 zkVM 提供高性能,并为未来的改进做好了准备。以下是 RISC Zero 的 zkVM 与 SP1 zkVM 的高级比较:
概述和理由
我们最近的基准测试展示了 RISC Zero 相对于 SP1 的明显优势,重申了我们作为 zkVM 性能领导者的地位。这种情况确保了公平的比较,并突出了我们性能领先的实际意义。我们试图调查以下问题:
通用 VM 用例:评估哪种证明系统最适合通用 VM 用例。
最快的证明:比较 R0 与 SP1,以确定哪个实现提供最快的证明。
成本效率:分析哪个实现提供最低的证明成本。
方法:
我们使用了各种硬件设置,从消费类设备到云实例,并专注于常见功能:
RISC-V 执行
随机存取存储器
SHA2 加速器(“预编译”)
在 Succinct 之前的基准测试工作中,比较通常包括不同的功能,例如加速与非加速 Keccak,这掩盖了底层证明系统的性能。此外,之前的基准测试将经过微调的 SP1 部署与次优的 RISC Zero 设置进行了比较。在我们的测试中,我们的目标是从两个系统中获得最佳的“开箱即用”性能,使用推荐的编译器标志和首选的 AWS 实例。
为了确保公平性,我们为 RISC Zero 的 zkVM 和 Succinct 的 SP1 启用了所有推荐的性能功能。我们的 zkVM 针对 GPU 证明进行了优化,这是早期比较中未使用的功能。这就像通过让飞机停留在地面上来比较飞机和汽车的速度。
最后,对于这些测试,我们选择不包括来自 Jolt 或 Valida 的数据:
Valida:不实现 RISC-V,使得直接比较成为不可能,但他们的基准测试显示出比 SP1 显着的速度提升。
Jolt:仍处于早期开发阶段,尚未发挥其全部潜力。
这些问题很重要,因为随着时间的推移,VM 将收敛于类似的功能。然后,底层证明系统的性能将决定哪个 VM 在成本和速度方面领先。
通过标准化我们的测试环境,我们确保结果可以直接比较且公平。
我们测试了 R0 zkVM 1.0.0-rc.5 与 SP1 1.0-testnet。
我们对 4 个云实例进行了实验:
AWS g4dn.xlarge;Cuda;po2=20;保留价 0.33 美元/小时。(注意:由于内存压力过大,经常导致实例冻结,需要通过 AWS 管理控制台手动干预,因此我们无法从此实例收集 SP1 的数据。)
AWS g6.xlarge;Cuda;po2=21;保留价 0.52 美元/小时。
AWS g6.16xlarge;Cuda;po2=21;保留价 2.21 美元/小时。
AWS r7i.16xlarge;仅限 CPU;po2=21 和 po2=22;保留价 2.80 美元/小时。(注意:这是 Succinct 在他们的 Testnet 基准测试中使用的实例;我们没有在此实例上测量 R0,因为我们对 R0 在较便宜的实例上的性能感到满意。)
我们还在各种消费者(最终用户)设备上进行了测试:
MacBook Pro (MBP) M3 Max,配备 96GB 内存;Metal;po2=20。
MacBook Pro (MBP) M2 Max,配备 96GB 内存;Metal;po2=20。
Ryzen 5950x,配备 128GB 内存;Cuda;po2=20。
笔记:
po2 指的是段/分片大小,这是 RISC Zero 和 Succinct 的关键参数。
所有构建都是使用 RUSTFLAGS='-C target-cpu=native' 执行的,遵循Succinct 的性能建议。
实例价格是从 Vantage 获得的。
我们进行了几个实验。每个实验都由工作负载的 规模 参数化。这使我们能够比较不同类型工作负载的底层证明系统的scaling属性:
sha2。此 guest 使用迭代算法计算 hash(hash(hash(...)))。这测量了经典密码学用例的证明系统性能。
fib。guest 使用迭代算法计算斐波那契数。这测量了 RISC-V 核心性能。
sort。guest 生成一个随机值数组,对数组进行排序,然后计算值的交替和。这测量了受堆限制的 RISC-V 计算的性能。
big_input。guest 读取一个数字向量并返回总和。这测量了堆和 I/O 性能。
big_input_push。guest 读取几个数字,将它们推入 vec 并返回总和。这测量了堆和 I/O 性能。
big_input_vecless。guest 读取几个数字并返回总和。这测量了 I/O 性能。
最后,我们还想收集一些关于关键区块链用例的数据。为此,我们重新审视了 Succinct 之前对 Tendermint Light Client 的基准测试,将其更新为使用最新的 Tendermint 库,并为 RISC Zero 启用了 GPU 证明。
实验规模范围从 2k-1.67 亿个周期(大约)。对于每个任务,我们测量了创建单个 ZK 证明所需的总时间。对于 RISC Zero 和 Succinct,这是一个两步过程:首先生成分段(resp. 分片)证明,然后将其压缩(resp. 减少)为单个证明。在某些用例中,可能会执行额外的归约步骤;我们在这些测试中没有测量这些额外的步骤。
有关原始数据,请参阅 此处。
总的来说,我们发现,在成本和速度方面,正确配置的 RISC Zero zkVM 优于类似配置的 Succinct SP1 部署。这在以下情况下成立:
在云端
在消费类 Mac 上(M2 Max 和 M3 Max);
在配备消费级 NVIDIA GPU 的消费类 PC 上。
在所有 VM 和硬件组合中,最快的证明来自配备 nVidia 4090 的消费类 PC,该 PC 运行 RISC Zero zkVM。
在云端,运行 RISC Zero 的一个 g6.xlarge 实例比运行 SP1 的一个 r7i.16xlarge 实例(Succinct 用于基准测试的首选节点)更快且更便宜。
在云端,对于任何给定的任务,RISC Zero 的成本至少比 SP1 低 7 倍。对于某些工作负载(例如 SHA2 哈希),RISC Zero 的成本至少低 30 倍。特别是对于小型工作负载,RISC Zero 的成本几乎比 SP1 低 60 倍。
在某些特定用例中,这些用例严重依赖于特定的加密操作,由于 Succinct 使用加速器,因此 Succinct 的 SP1 目前表现出更快的性能。RISC Zero 正在积极致力于集成类似的加速器,以提高这些场景中的性能。虽然 Succinct 使用加速的 Keccak 在特定的基准测试中提供了优势,但与 SP1 相比,RISC Zero 的 zkVM 在各种工作负载中提供了强大的整体性能和成本效益。随着我们继续使用额外的加速器和优化来增强我们的 zkVM,我们期望在实际应用中看到进一步的改进。
如下图所示,我们的 Tendermint light client 测试结果展示了 R0 行业领先的性能。

我们利用了 Succinct 的性能基准测试套件,其中包括 Tendermint light client 测试,并进行了更新以重新运行测试。基准测试套件的方法和完整详细信息以及我们更新的 fork 可以在此处找到。
我们的测试是在 MacBook Pro M3 上进行的。对于分片大小 20,R0 实现了 3.85 分钟的证明持续时间,明显快于 SP1 的 7.54 分钟。对于分片大小 22,R0 在 3.08 分钟内完成,而 SP1 在 4.23 分钟内完成。这表明 R0 具有卓越的效率,分别比 SP1 快 48% 和 27%。这些结果清楚地突出了我们在行业中的领先地位。
我们还从 AWS 收集了数据。与我们的其他实验一样,我们在他们推荐的实例上测试了 SP1:r7i.16xlarge(2.8005 美元/小时,分片大小 22)。证明在 4.27 分钟内完成,大致相当于他们在 M3 上的表现。同时,我们在我们推荐的实例上测试了 RISC Zero:g4dn.xlarge(0.331 美元/小时,分片大小 20)和 g6.xlarge(0.5239 美元/小时,分片大小 21)。在这些实例上,我们观察到的时间分别为 3.43 分钟和 1.30 分钟。

为了确保透明性和可重现性,我们提供了我们的基准测试脚本和数据。要复制结果,你可以查看我们的指南此处。
有关完整的原始数据,请查看电子表格此处。
我们的实验表明,RISC Zero zkVM 不仅在性能和成本效率方面领先,而且还为未来的增强提供了强大的基础。在类似系统之间的许多直接比较中,RISC Zero 在 SP1 上表现出强大的性能和成本效率。这不仅表明了这些 VM 之间的根本差异,而且表明了底层证明系统之间的根本差异。
重要的是要注意,性能可能因特定的工作负载和硬件配置而异。虽然 RISC Zero 显示出强大的整体性能,但在某些情况下,其他解决方案(例如 Succinct 的 SP1)可能会因诸如使用加速器来执行特定任务等因素而表现出色。
所有这些系统都可能会在未来一年内继续改进。RISC Zero 和 Succinct 都在积极致力于下一组性能增强。因此,人们可以预期在未来几个月内发布更多的直接比较。
这种竞争,以及来自 Jolt 和 Valida 的压力,将使消费者受益,并推动整个 ZK 领域的发展。凭借持续的增强和强大的基础,RISC Zero 有望在可预见的未来保持最佳 zkVM 的地位。
要及时了解 RISC Zero 基准测试的最新信息,请查看我们的专用基准测试网站。

- 原文链接: risczero.com/blog/beatin...
- 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!