深入理解EVM - Part 5 - 调用/委托调用的原理与实现

  • Alvan
  • 更新于 2022-06-30 23:27
  • 阅读 4234

从solidity使用,到opcode原理,再到Geth实现,三个层次解读委托调用的原理与实现

原文链接:https://noxx.substack.com/p/evm-deep-dives-the-path-to-shadowy-a5f 译者:Alvan's Blog

今天我们详细解读一下 CALL 和 DELEGATECALL 两个操作,如果没看过第二篇第三篇第四篇的话,建议作为前置知识读一下。

我们将从solidity,EVM 和 Geth 三个层面解读这两个opcode,让你对它们有一个全面的认识。然而在深入理解他们之前,我们先确认一下合约执行上下文的概念:

执行上下文

当EVM运行合约时,会创造一个上下文,它包含以下几个部分:

  • Code
    • 存储在链上的合约的不可变代码。
  • Call Stack
    • 前文讲过的合约的调用栈,EVM运行合约时会初始化一个空的。
  • Memory
    • 合约的内存,EVM运行合约时会初始化一个空的。
  • Storage
    • 存储区在执行过程中持久化,链上存储,根据合约地址和插槽寻址。
  • The Call Data
    • 交易的传入数据
  • The Return Data
    • 合约调用的返回数据

在阅读下面内容时,时刻记着这几个点。我们先从Smart Contract Programmer的DELEGATECALL使用用例开始讲:

Solidity 样例

下图是同一个合约中的两个调用,一个使用了DELEGATECALL,另一个使用了CALL。现在我们看一下他们之间的区别。

img

下边是这次交互的一些信息(如果你在remix里自己执行的话,会是不一样的数据):

我们有两个合约,即 Contract A 和 Contract B 还有一个 EOA:

  • EOA 地址 = 0x5B38Da6a701c568545dCfcB03FcB875f56beddC4
  • Contract A 地址 = 0x7b96aF9Bd211cBf6BA5b0dd53aa61Dc5806b6AcE
  • Contract B 地址 = 0x3328358128832A260C76A4141e19E2A943CD4B6D

现在把 Contract B 的地址和一个uint值 12以及 1000000000000000000 Wei 传入,调用 Contract A 里的两个方法, setVarsDelegateCall 和 setVarsCall。

Delegate Call

  1. 一个 EOA 地址把 Contract B 的地址和一个uint值 12以及 1000000000000000000 Wei 传入,调用Contract A的setVarsDelegateCall,这次是委托调用Contract B执行setVars(uint256),参数是12。
  2. 委托调用运行 Contract B 的 setVars(uint256) 但是更新的是 Contract A 的存储区,它运行时的存储区,msg.sender 和msg.value 也都和父调用一样。
  3. Contract A的存储区写入数据:num=12,sender = EOA Address以及value = 1000000000000000000。尽管Contract A 调用的setVars(uint256)不带value,

执行完这个方法之后我们检查Contract A 和Contract B的num, sender 和 value状态。我们可以看到Contract B没有被初始化,都设置在Contract A里了。

Call

  1. 一个 EOA 地址把 Contract B 的地址和一个uint值 12以及 1000000000000000000 Wei 传入,调用 Contract A 的setVarsCall,这次是调用Contract B执行setVars(uint256),参数是12。
  2. 调用运行 Contract B 的setVars(uint256) ,不改变(本合约的)存储区,msg.sender,和msg.value
  3. Contract B的存储区写入数据:num=12,sender = Contract A Address 以及value = 0。(1000000000000000000 Wei被传进了父调用setVarsCall。)

执行完这个方法之后我们检查Contract A 和Contract B的num, sender 和 value状态。我们可以看到Contract A没有被初始化,都设置在Contract B里了。

“委托调用”就是允许你从别的合约里复制一个方法粘贴到你的合约里,运行起来就行在你的合约里执行的一样,使用本合约的存储区,msg.sender 和 msg.value。 而“调用”是进入到另一个合约去执行方法,相当于发了一笔交易,有其自己的value值和sender(也就是调用call的合约地址)。

Delegate Call & Storage Layout委托调用与内存布局

在上述例子里,你肯呢个注意到Contract B 第5行的注释“NOTE: storage layout must be the same as contract A”

合约里的每一个函数都会经过编译成为一个静态的字节码。当我们理解solidity变量的时候,是看见num,sender和value这三个变量去理解的。但是字节码不知道这些,它只认存储插槽,而声明变量的时候就把插槽定下来了。

Contract B 的 setVars(uint256) 函数里,“num = _num”就是说要把 _num 存进插槽0。当我们看一个DELEGATECALL的时候不要去想num → num,sender → sender的映射,因为在字节码的层面不是这样的,我们需要认识到这是slot 0 → slot 0, slot 1 → slot 1的映射。

img

试想如果我们改变了声明变量的顺序会怎样。那么他们的插槽位置会改变,同时setVars(uint256) 的字节码也跟着变了。如果我们把 Contract B 的6行和8行互换位置,先声明 value 后声明 num 。那就意味着11行的“num = _num”意味着把 _num存进插槽2里,13行的“value = msg.value”意味着把msg.value 存进插槽0。这就用意味着两合约中,我们变量之间的映射和插槽之间的映射不匹配了

img

在这种情况下,当我们运行 DELEGATECALL 时,num变量会被存在插槽2,而这里在 Contract A 中映射到 value 变量。反过来也是一样的,两个变量就会存储进预想之外的地方。这就是DELEGATECALL比较危险的原因之一。我们意外地 value 值把 num 覆盖了,用 num 值把 value 覆盖了。但是黑客可不会意外,他们会有目的地攻击。

试想我们知道一个开放 delegatecall 的合约,我们知道那个合约存储 owner的插槽。现在我们可以做一个相同布局的合约,然后写一个更新owner的方法,这就意味着我们可以通过委托调用这个更新方法来改变该合约的owner。

如果你对这个黑客攻击感兴趣的话可以在这里深入了解一下:

下面看一看opcode层面

Opcodes

我们现在知道DELEGATECALL怎么工作了,那么深入一下,看看DELEGATECALL和CALL的操作码。

对于DELEGATECALL我们有以下输入变量

  • gas: 执行的gas费
  • address: 执行上下文的account
  • argsOffset: 输入数据(calldata)的偏移量
  • argsSize: calldata的大小
  • retOffset: 输出数据(returndata)的偏移量
  • retSize: returndata的大小

CALL比起上边的只多一个value,其它的都一样

  • value: 发送给account的以太币(CALL only)

委托调用不需要value输入,它从父调用继承。我们的执行上下文有和父调用一样的存储区,msg.sender 和 msg.value。

他们都是有一个返回值布尔值"success",为0则为执行失败,反之则为1。

如果调用位置没有合约或者没有代码,Delegatecall会返回true。这会出现bug,因为它没执行,我们是希望返回False的

DELEGATECALL Opcode Inspection With Remix利用Remix检验DELEGATECALL

下边是Remix中调用DELEGATECALL操作码的截图。对应Solidity代码的24-26行。

我们可以看到栈和内存的条目以及它们是怎么传进DELEGATECALL的。

img

我们按照这条路线理解:opcode → stack → memory → calldata

  1. Solidity代码的24行,使用了delegatecall 调用 Contract B 的 setVars(unit256),调用了DELEGATECALL操作码。
  2. DELEGATECALL从栈上拿6个输入:
    1. Gas = 0x45eb
    2. Address = 0x3328358128832A260C76A4141e19E2A943CD4B6D (Address for Contract B)
    3. ArgsOffset = 0xc4
    4. ArgsSize = 0x24
    5. RetOffset = 0xc4
    6. RetSize = 0x00
  3. 注意到 argsOffset 和 argsSize 两个代表了传入 Contract B 的 calldata。这两个变量让我们从内存位置0xc4开始,复制后边的 0x24 (十进制36)作为calldata。
  4. 我们因此拿到了0x6466414b000000000000000000000000000000000000000000000000000000000000000c,6466414b是setVars(uint256) 的函数签名,而000000000000000000000000000000000000000000000000000000000000000c是我们传入的数据 12。
  5. 这对应了Solidity代码的25行,abi.encodeWithSignature("setVars(uint256)", _num)。

因为setVars(uint256)不返回任何值,所以retSize置0。

如果有返回值的话,就是存在retOffset以后的retOffset以内。这应该让你对这个操作码的底层逻辑了解的深一点,也会和Solidity联系起来了。

现在我们看一下Geth里的实现。

Geth实现

我们看一下Geth里写DELEGATECALL的部分。目标是展现DELEGATECALL和CALL在存储的层面的区别,以及是怎么联系上SLOAD的。

下边的图有点唬人,但是我们拆解开来一步一步做,在结束的时候你就会对DELEGATECALL和CALL有深刻的认识。

img

We have the DELEGATECALL & CALL opcodes labeled on the left-hand side and the SLOAD opcode labeled bottom right. Let’s see how they’re connected.

  1. 这图里有两个 [1] 号截图,分别对应DELEGATECALL和CALL操作码的代码,在instructions.go里。我们可以看到从栈里弹出的那几个变量,之后可以看到调用 interpreter.evm.DeleagteCall和 interpreter.evm.Call 这两个函数,传进去了栈里的变量,目标地址和现在的合约上下文
  2. 图里也有两个 [2] 号截图,分别对应 evm.DelegateCall 和 evm.Call 的代码的代码,在 evm.go里边。中间省略了一些校验和其它函数,我们主要关注执行调用NewContract方法新建上下文的代码,其它的可以忽略掉。
  3. 图里有两个 [3] 号截图。里边主要是evm.DelegateCall和evm.Call 调用NewContract。它们非常相似,以下两点除外:
    1. DelegateCall的value参数设为nil,它从之前的上下文继承,所以不写进这个参数里。
    2. NewContract的第二个参数也不一样。evm.DelegateCall 里caller.Address( ) 用的是Contract A的地址。evm.Call 里addrCopy是复制的toAddr,也就是Contract B的地址,这一点区别非常大。他俩都是AccountRef类型,这个很重要,后边会提到。
  4. DelegateCall’s的NewContract会返回一个Contract结构体。它又调用了AsDelegate()方法(在contract.go里)(见图[4]),把msg.sender 和 msg.value设置成了父调用的样子,也就是EOA地址和1000000000000000000 Wei。这在Call的实现里是没有的。
  5. evm.DelegateCall 和 evm.Call 都执行NewContract方法(在contract.go里),NewContract方法的第二个入参是“object ContractRef”,对应着第三点里提到的AccountRef。
  6. “object ContractRef”和一些其他值被用来初始化合约,对应Contract结构体里的“self”
  7. Contract结构体( 在contract.go里)有一个“self”字段,你可以看到也有其他的字段与我们之前提到的执行上下文有关。
  8. 现在我们跳跃一下,去看看Geth里SLOAD(在instructions.go里)的实现,它在调用GetState时用的参数就是scope.Contract.Address( )。这里的“Contract”就是我们在第7条提到的结构体。
  9. Contract结构体的Address( ) 返回的是self.Address。
  10. Self是一个ContractRef类型,ContractRef必然有一个Address( ) 方法。
  11. ContractRef是一个接口,规定如果一个类型要做ContractRef,那必须有一个返回值类型是common.Address的Address( ) 函数。common.Address是一个长度20的字节数组,也就是以太坊地址的长度。
  12. 我们回到第3块看一下evm.DelegateCall和evm.Call 中AccountRef的区别。我们可以看到AccountRef就是一个有Address( ) 函数的地址,那它也符合ContractRef接口的规则。
  13. AccountRef 的 Address( ) 函数是把 AccountRef 转化成common.Address,也就是 evm.DelegateCall 里的 Contract A 地址和 evm.Call 里的Contract B 地址。这意味着第8部分讲的 SLOAD 会在 DELEGATECALL 时使用 Contract A 的存储区,在 CALL 时使用 Contract B 的存储区。

通过学习Geth的实现你应该对DelegateCall的存储区, msg.sender和msg.value的来龙去脉有了深刻了解,对DELEGATECALL也有了一定的认识,很棒!下次再见!

点赞 7
收藏 7
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
Alvan
Alvan
0x8958...672e
区块链开发,喜欢defi,对socialfi很感兴趣,希望能和大家交朋友 邮箱: 19970216zhang@gmail.com vx: zy122402