LUKSO、Monerium 和 IPOR 在 Wake Arena 上的应用

  • Ackee
  • 发布于 2天前
  • 阅读 27

Wake Arena是一个多代理AI审计服务,用于Solidity代码库。它结合了LLM推理、图驱动分析和静态分析检测器库。在基准测试中,Wake Arena在历史审计竞赛中发现了94个高危漏洞中的43个,优于GPT-5、Opus 4.5和Zellic的自动扫描器V12。在生产代码中,Wake Arena发现了192个问题,其中142个是真阳性,50个是假阳性,79个问题促使代码修复。

Wake Arena 是一款用于 Solidity 代码库的多代理 AI 审计服务。它结合了 LLM 推理、图驱动分析(数据依赖性和控制流)以及一个经过实战检验的静态分析检测器库,该库构建于 Ackee 多年的审计经验之上。

在基准测试中,Wake Arena 在历史审计竞赛中发现了 94 个高危漏洞中的 43 个,优于普通 GPT-5 (24/94)普通 Opus 4.5 (21/94)Zellic 的自动化扫描器 V12 (41/94)

基准测试很有用,但生产环境才是真正的考验。让我们仔细看看当团队在生产代码中使用 Wake Arena 时发生了什么,以及他们如何修改代码以响应。

Wake Arena 的作用

Wake Arena 旨在帮助团队获得具有更清晰代码的优质审计。它:

  • 尽早发现有意义的问题, 专注于高信号漏洞,而不是数量。
  • 像审计员一样解释发现, 包括影响、利用路径以及它在代码中发生的位置。
  • 链接证据, 使用代码片段、行号和结构化摘要,以便于分类。

与通用的“LLM 扫描”相比,协议获得的安全性审查更贴近审计员的工作流程,并且可以快速迭代。

在三个协议中,Wake Arena 发现了 192 个问题,这些问题被团队分类为 142 个真阳性50 个假阳性(约 3:1 的 TP/FP 比率)。最重要的是,5 份报告中的 79 个问题 导致了具体的 代码更改5 (LUKSO), 68 (IPOR Fusion), 和 6 (Monerium)。

此外,我们感谢用户的反馈,并将使用它来使 Wake Arena 在规模上更易于管理和透明。

LUKSO:“非常好且有帮助”,可以更快地加强已发布的代码

LUKSO,一个专注于数字身份和消费者应用的 EVM L1,在开发期间担任设计合作伙伴,并在其 Solidity 代码库上使用了 Wake Arena。

扫描结果

  • 在一次扫描中总共发现 10 个问题2 个高危6 个中危1 个低危1 个警告
  • 报告了 2 个假阳性
  • TP/FP 比率(根据客户分类):8 / 2
  • 团队报告说,他们在收到报告后不久将修复 1 个高危、1 个中危和 1 个低危

积极反馈

“PDF 看起来非常好,我对它的整体写作质量印象深刻。”

“‘发现摘要’表是一流的。正是我想要的。”

“PDF 报告的外观和编写方式给我留下了深刻的印象……我肯定会向任何人在进行正式安全审计之前推荐此工具来捕获早期错误。”

– LUKSO 团队反馈

在同一反馈中,团队还提到了他们最依赖的报告部分:严重性和置信度解释、审计概述/总体安全评估/建议以及带行号的代码片段。

观察到的影响

该报告迅速实现了:

  • 分类(什么重要,为什么重要)
  • 验证(它在代码中的位置)
  • 迭代(修复 → 重新运行 → 比较)

产品改进(基于 LUKSO 的反馈)

  • 澄清 PDF 是一份AI 驱动的自动化分析(不是人工审计报告)。
  • 每个发现添加更明确的补救指南(具体的后续步骤、典型修复和验证技巧)。
  • 保持报告在可用性方面“类似于审计”,而不会将其与人工审计交付成果混淆。

IPOR Fusion:快速迭代和清晰的安全权衡

IPOR Lab,一个构建利率和收益产品的 DeFi 团队,在 2025 年 12 月多次运行中在 IPOR Fusion 上使用了 Wake Arena:

扫描结果

  • 4 天内生成 3 份报告,在主动开发期间实现快速强化周期。
  • TP/FP 比率(根据客户分类):126 / 47 (~2.7:1)
  • IPOR Labs 团队系统地将发现分类为:
    • 68 个有效 → 需要代码更改
    • 58 个已确认 → 接受架构中的权衡/缓解
    • 47 个假阳性/无效 → 基于执行约束的详细驳斥
  • 根据客户的说法,报告中某些问题的严重程度高于他们的团队最终分配的严重程度。

积极反馈

IPOR 的回应显示了一种一致的模式:根据明确的信任边界和执行约束(谁可以在什么权限下调用什么),而不是孤立地评估发现。

“我们花了很多时间分析它,不得不说这个工具非常好。”

– IPOR Labs,报告回应

这很重要,因为它反映了高级审计员的工作方式:声明必须绑定到现实的攻击者模型。

观察到的影响

  • 在他们的分类中,IPOR Labs 团队将 68 个发现分类为真阳性(需要代码或文档更改),并将 47 个分类为假阳性/无效
  • 他们标记为有效(需要更改)的示例包括费用计算/ERC-4626 语义不匹配和滑点保护配置问题(如他们的每个发现的回应中所反映的那样)。
  • 他们标记为假阳性的示例取决于执行约束(例如,组件无法公开访问、受限的执行路径以及避免交易之间残留余额的设计)。

Wake Arena 加速了围绕不变性、信任边界和权衡的高质量工程对话——所有这些都在高级审计之前。

Monerium:将发现转化为合并的修复程序并进行测试

Monerium 是一家受监管的法定货币链上发行商,在 src/SwapV1V2.sol 上使用了 Wake Arena,并在公共问题中发布了他们的分类和修复:“Ackee Wake – AI Audit Report for src/SwapV1V2.sol”。完整报告:Wake Arena PDF

扫描结果

  • 6 个项目已修复 (H1–H5, W1)
  • 1 个项目被拒绝为“按设计” (I1),并为 relayer/聚合器提供了基本原理和推荐的替代流程
  • TP/FP 比率(根据客户分类):6 / 1
  • 他们记录了权衡,而不是随意地用手势掩盖它们(例如,少量 gas 增加以消除集成商的模糊“无操作”语义)

积极反馈

“我们承认这是一个有效的发现,并已实施修复。”

“为了保证一致性和集成安全性,我们修改了所有 swap 函数以始终执行 transfer……消除了集成商的任何潜在混淆。”

– Monerium,公共问题回应

公开验证

  • 41 个测试通过
  • SwapV1V2.sol 的100% 覆盖率(行/语句/分支/函数)

结果是可操作的发现,可转化为更清晰的集成商语义、更好的文档和已发布的代码更改,并具有回归保护。

Wake Arena 的下一步是什么?

我们专注于当该工具跨多个协议和团队运行时的工作流程和可见性改进:

  • 管理面板(内部 + 生态系统/协议),使团队更好地控制:

    • 每月扫描使用情况
    • 计划中剩余的扫描次数
    • 每个协议发现的问题数量
  • 问题表和更丰富的状态,包括单个发现、严重性和计数,以及每个协议的状态可见性。状态从两个扩展到五个,以提高准确性和工作流程:已报告有效已确认已修复无效
  • 每个组织/协议的 电子邮件管理 + AI 报告视图
  • 更好的上下文输入,以提高 AI 结果的准确性。

结论

Wake Arena 减少了在可避免的基本问题上花费高级审计师时间之前修复重要问题的时间。

该工具在三个协议中总共识别出 192 个问题。在每个团队进行分类后,这些问题被分类为 142 个真阳性50 个假阳性,从而产生了有利的约 3:1 的真阳性与假阳性比率。更重要的是,这 5 份报告中跨越的 79 个问题 促使进行了 代码修复:LUKSO 修复了 5 个,IPOR Fusion 修复了 68 个,Monerium 修复了 6 个。

我们正在构建管理面板和更丰富的问题工作流程、改进的管理工具以及更好的上下文输入,以使 Wake Arena 更易于大规模操作,并且每次扫描都更有用。

如果你想要一份审计员风格、有证据支持的报告,你的团队可以快速对其进行分类,并在修复后重新运行以继续收紧代码库,请使用 Wake Arena

  • 原文链接: ackee.xyz/blog/wake-aren...
  • 登链社区 AI 助手,为大家转译优秀英文文章,如有翻译不通的地方,还请包涵~
点赞 0
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
Ackee
Ackee
Cybersecurity experts | We audit Ethereum and Solana | Creators of @WakeFramework , Solidity (Wake) & @TridentSolana | Educational partner of Solana Foundation