从零开始学习CKB:理论知识

  • CKBFans
  • 更新于 2021-04-26 15:29
  • 阅读 3808

不管你是为了在 CKB 上开发 DAPP,还是单纯对 CKB 感到好奇想要弄懂基本原理,都可以跟随本教程,完成与 CKB 的第一次亲密接触。

首先恭喜你点开了这个页面!相信我,这预示着你将比其他初学者更早搞懂关于 CKB 的一切。

不管你是为了在 CKB 上开发 DAPP,还是单纯对 CKB 感到好奇想要弄懂基本原理,都可以跟随本教程,完成与 CKB 的第一次亲密接触。

这个教程分为四部分,跟随教程完整走一遍,我们将会亲自动手完成、并搞懂怎样在 CKB 上:

  • 构建并发送一笔最简单的转账交易
  • 构建并发送一笔最简单的多签交易
  • 构建并部署一个最简单的智能合约
  • 构建并部署一个可升级的智能合约

最棒的是,搞懂这一切

  • 不需要你在本地下载任何东西
  • 不需要你运行任何软件
  • 甚至不需要你写一行代码!

一切都将在本页面中,以一种纯手工的、远程的、与云端测试链互动的方式完成。

所以你需要具备的唯一要求是:保持往下阅读的耐心,以及对 CKB 的好奇心:D

那么废话不多说,让我们在 CKB 上开始这一次有趣的冒险之旅吧!


第一步:最小化的理论知识

世上根本没有比特币,只有一个又一个的 UTXO。

世上根本没有 CKB, 只有一个又一个的 Cell。


理解 CKB

理解 CKB 的第一步,是抛开所有复杂的概念,只抓住这条链的本质:一切都是 Cell,以及 Cell 的转换而已。

Cell 是 CKB 的基本单元,就像人体的细胞。一个个的 Cell 构成了整个 CKB 区块链的全局状态。 当我们在区块链上发起一笔交易改变了某个状态, 无论这笔交易多么复杂,状态改变流程多么繁琐, 最终对 CKB 来说,都是这笔交易把某些 Cell 消费掉,从而产生了一些新的 Cell 而已。 这个过程跟比特币的 UTXO 是完全一样的。

被消费掉的 Cell 就是死去的 Dead Cell,未被消费的 Cell 是 live Cell。 一条链不停地经由交易去消费 Cell 和创造 Cell, 就像全身的细胞在更新换代、分裂生长。

<div align=center>

image-20210427224100380

</div>

<font color=#999999>在 CKB 的宇宙中,漂浮着无数的 Cell。 它们存储数据,共同构成了一条链的全局状态</font>

跟 UTXO 不同的是,Cell 可以用来存储任意类型的数据。Cell 有一个字段名为 data,里面可以放入无格式的字符串。 这意味着,你往 data 上写入什么样的内容都可以,格式也是你自己定,只要你自己知道怎么解读这段字符串就行。

比如,我可以往上面存一个哈希,存一段文字,也可以存一个日期, 甚至,你可以放一段二进制代码进去,而这段代码又可以被其他 Cell 引用, 经过虚拟机 CKB-VM 在链上运行。

这其实就是 CKB 上所谓的智能合约,它的原理就是如此简单。

那么我们怎样才能拥有一个 Cell 呢?

因为 Cell 是在链上经过共识得到的,所以 Cell 的存储空间必然是宝贵的,拥有 Cell 必然需要付出成本。

这就引出了 CKB 原生代币的作用了。

你可以把 Cell 想象成是一个一个的小盒子,可以拿来装东西,而这个盒子本身是通过代币创造出来的。 你有多少币,你就可以有多大的盒子。

一个盒子还可以细分成多个盒子,只要总的盒子空间,跟你持有的代币总量相等就行。

image-20210428001607788

<center> by Freepik</center>

根据系统的设定,1个 CKB 等于 1个 byte(字节)的空间。

比如,你有 100 个CKB,那你在链上就有 100 byte 的空间,你就能创造出拥有 100 byte 空间的盒子。 至于你的这 100 byte 总共是一个盒子还是两个盒子,可以随意划分创造。

盒子(Cell)有了空间之后可以拿来放数据,这些数据的大小要小于整个盒子的大小,因为盒子还有一些其他的组成部分,它们也需要占用一定的空间。

按一个汉字占2个字节(GBK编码)来算,如果你有 100 CKB,那么你大概可以往这个 Cell 上存不到 50 个汉字的内容上去。

《红楼梦》总共约为 78 万字,所以你大概需要 156 万个 CKB 原生代币才能把整部书上传到链上。

由此我们可以发现,链上的 Cell 空间真的是非常宝贵的存在。

CKB 通过这种只在链上存储共识的设计,也是为了鼓励大家把真正有价值的、有必要经过共识的数据上传到链上。这些数据相当于整个人类共同拥有的知识库。实际上这也是 CKB 名字的由来(Common knowledge base)。

完整的 Cell 数据结构长这样:

Cell: {
            capacity: HexString
            lock: Script
            type: Script
            data: HexString
        }

四个字段具体含义如下:

  • capacity:表示 Cell 的空间大小,同时也是这个 Cell 代表的原生代币的数量,我们通常会选择用 16 进制来表示
  • lock:是一个脚本,本质相当于是一把锁,下文将详解
  • type: 是一个脚本,和 lock 一样,只是锁的用途不同,下文将详解
  • data: 是一个无格式字符串,可以在这里存放任何类型的数据

更详细的数据结构介绍可以参考这里:Cell data structure

关于 Cell,你需要记住的最重要的一条规则是,上面这四个字段所占用的空间,加起来要小于或等于 capacity 的值。

也就是说,

cell 总占用空间 = capacity 
                      >= 4个字段的长度之和

为了更好的理解这点,让我们来看一个具体的例子。

下面是一个小实验,输入汉字作为 Cell 的 data,可以查看 Cell 实时的空间变化。 点击 Cell,还可以看到 Cell 具体的内容,以及每个字段实际占据的空间大小。

我们设定该 Cell 的 capacity 值为 0x1dcd65000,也就是 80 Bytes 大小。 如果 data 的变化,导致实际占用空间超过了 capacity 的值,那么 Cell 就会被认为是不合法的 Cell。

<img src="https://img.learnblockchain.cn/pics/image-20210427224230518.png" alt="image-20210427224230518" style="zoom:50%;" />

Cell 容量是否足够:

capacity: 0x1dcd65000 = 80 > 实际占用空间:61, ✅

怎么知道你的Cell属于你?

既然需要拥有原生代币才能拥有 Cell,那么我们怎么知道链上的某一个 Cell 是属于你的呢?

还记得上面介绍的 lock 和 type 吗?

如果说 Cell 是一个盒子,那么 lock 和 type 就相当于盒子上挂着的两把锁。

image-20210428001708444

$$ by Pixel perfect $$

其中,lock 是默认配上的锁,type 则是一把可选的锁。

这种锁本质上是一段代码程序和一些参数。当我们试图去消费一个 Cell 的时候,这把锁会自动运行, 输入参数和我们提交的一些证明(比如对交易的签名),来判断锁能否被解开。 如果能解开,就证明我们对 Cell 拥有所有权和控制权。

锁是一种脚本结构(Script),它长这个样子:

Script: {
            code_hash: HexString
            args: HexString
            hash_type: either 'data' or 'type'
        }

在三个字段中,让我们先忽略 hash_type 留给后面再讲:

  • code_hash: 表示一段代码的哈希
  • args: 表示要往这段代码传入的参数

更详细的数据结构介绍可以参考这里:Script data structure

code_hash 与 args 合起来组成了一把完整的“锁”:我们通过 code_hash 字段找到要执行的代码在哪里,然后往这段代码里传入参数 args, 随后这段程序就会被虚拟机 CKB-VM 执行(这个过程可能还会读取一些额外的参数,比如交易附带的证明),如果执行成功,将返回 0,表示这个锁能被顺利解开,如果执行不成功,返回其他数值,则表示这个锁无法解开。

运用这个原理,CKB 判断 一个 Cell 属于谁,就是判断谁能解开这个 Cell 附带的 lock 锁。这跟比特币的原理是一样的。

我们可以通过 code_hash 引入一个非对称加密算法,然后在 args 上放入自己的公钥作为参数。 当需要使用这个 Cell 的时候,比如需要发起一笔交易, 就用私钥对这笔交易做一个签名, 这样加密算法输入公钥和签名,就能判断这笔交易是不是由对应的私钥发起的, 从而也就能判断背后是不是这个 Cell 真正的主人在操作。

反过来说,如果你创造的 Cell 加了一把谁都能打开的锁, 那么这意味着,任何人都可以消费这个 Cell。也就是说,你的钱任何人都能花掉!这是非常危险的。所以,锁对 Cell 来说真的非常重要。

课间休息

好了你已经成功读到了这里,让我们回顾下目前掌握的新知识:

  • CKB 这条链的本质是一个个的 Cell,在不停地被创造出来和死去。
  • Cell 就是一个盒子,一个容器,它可以用来装任何类型的数据。
  • 要拥有 Cell 这个盒子,你需要有代币。代币的数量等于盒子空间的大小。1 CKB = 1个 byte 字节大小。
  • 整个 Cell 占用的总空间,不能超过 capacity 字段的数值大小。
  • 要保护自己的 Cell,你可以在 Cell 这个盒子上加一把锁,只有自己的钥匙能打开。

看起来相当不错,我们已经掌握了不少的原理。相信我,你已经搞懂了大半,接下来我们还需要再了解一点细节。

真正的代码藏在哪里?

我们已经知道,可以使用 Cell 的 lock 和 type 字段给盒子上锁,来帮我们保护这个盒子的所有权和控制权。

锁是一种脚本结构,这个结构长这样:

Script: {
            code_hash: HexString
            args: HexString
            hash_type: either 'data' or 'type'
        }

你应该注意到了,code_hash 里放的并不是真正的代码,而是代码的哈希,相当于这段代码的一个索引。我们通过这个索引,可以找到锁真正使用的代码。 那么这段所谓真正的代码,又是放在哪里的呢?

答案很简单,代码是放在另一个 Cell 里的!

我们知道 Cell 的 data 字段可以放入任意的数据,因此我们可以把真正的代码放在另一个 Cell 的 data 字段, 然后把这个 Cell 作为依赖引入到一笔交易中, 这个依赖的 Cell 就叫作 dep cell。

当我们需要解锁某个 Cell 的时候,只要引入这个 dep cell, CKB 系统就会通过 code_hash 去匹配 dep cell 里的 data 的哈希, 找出这把锁需要的代码。

为什么不直接放入真正的代码,而通过这种索引的方式呢?这种设计有许多好处,其中一个比较明显的好处是, 如果所有人都需要同一种类型的锁,那么锁的代码都是相同的,code_hash 的值也都是相同的, 只要引入相同的 dep cell 就行了,而不需要每个人把相同的代码重新部署一遍,浪费空间。

我们来看一个真实的例子。

CKB 系统内建的一个很重要的智能合约叫 SECP256K1_BLAKE160, 它是每个 Cell 在普通的转账交易中 lock 字段默认使用的一把锁。 这把锁代表的就是用 SECP256K1 这种特定的加密算法,来保护每个 Cell 最基础的所属权。

而 CKB 系统实现这一点的方法,是在创世块的时候创建了一些 Cell, 然后在这些 Cell 的 data 字段放入 SECP256K1 加密算法的具体代码。 转账时,我们把这些 Cell 作为 dep cell 引入到交易中, 然后在 code_hash 填上 dep cell 的 data 字段的哈希,同时在 args 字段放入自己的公钥哈希, 那么这把锁就有能力去判断,一笔转账交易附上的签名,是否真实有效。

但这时候,你可能想到了另一个问题。

锁的代码如果丢了怎么办?

锁的代码是放在另一个 Cell 里面的,如果这个 Cell 被别人销毁了怎么办? 这个 Cell 被消费掉,意味着 dep cell 已经是 dead cell,锁的代码也就随之消失了, 这样使用了这把锁的 Cell 岂不是永远无法再解锁了?

没错。理论上,存放锁代码的 Cell 应该随着这条链的寿命一样永远存在下去。不应该有人能动这个 Cell。所以如果你去查的话, 其实可以看到,CKB 所有内建的锁脚本,所依赖的 dep cell 本身是任何人无法再操作的,因为我们在这些 dep cell 上的 lock 字段(也就是放锁代码的 cell 本身的锁)都设置了 0x0000.. 的数值, 这意味着没有人能再解锁这些 Cell,代码也就将一直存在下去:

SECP256K1's lock: {
            code_hash: 0x0000000000000000000000000000000000000000000000000000000000000000
            args: 0x
            hash_type..
        }

当然,实际上如果这个 dep_cell 被销毁了,我们还是有办法解锁自己的 Cell。 因为你只要把相同的锁代码再重新部署到一个新的 Cell 里, 然后把新的 Cell 作为 dep_cell 引入,就能重新找回锁的代码了。 因为代码相同,意味着代码的哈希相同,也就意味着 code_hash 的值不变。 这是CKB的另一个灵活之处。

我们上面讲的这些锁的例子,都是 Cell 里的 lock 字段的锁。

但一个 cell 除了默认的 lock 锁,还有一把可选的 type 锁。 这两把锁的本质是一样的,只不过因为用途的不同,所以取了不同的名字。

lock 锁通常用来保护盒子的所有权,type 锁则用来保证 Cell 在交易过程中遵循某些数据变换规则。

要搞懂上面这句话的意思,我们需要开始介绍 CKB 中的一笔交易到底是怎么回事了。

交易就是销毁一些 Cell,再创造一些 Cell

CKB 中的一笔交易,掐去不太紧要的细节,本质上就是这样:

tx: input -> output

其中,input 和 output 的本质,仍然是一些 Cell:

input:
            some cell...
        |
        |
        |
        \/
        output:
            some new cell...

input 中的 Cell 必须都是 live cell,通过一笔交易之后,这些 input cell 都被消费掉了,也就都成了dead cell。 而新创造出来的 output cell 则成了新的 live cell。

关于 CKB 交易,你需要记住最重要的一条规则是,所有 output cell,也就是新创造出的盒子,它占用的空间必须小于 input cell。

capacity(input cell) > capacity(output cell)

为什么只能小于呢?因为多出来的那一部分空间大小,也就是 input 和 output 二者之间的差值,就是矿工挣到的手续费。矿工毕竟不能白干活啊。

而在实际的设计中,出于存储优化的考虑,我们并不会真的在 input 中放入完整的 cell,而是只放 cell 的索引, 通过索引找到作为输入的 cell。

这个索引的结构叫 OutPoint。通过 OutPoint,可以找到唯一一个 Cell。

OutPoint: {
            tx_hash: 所属交易的哈希值(属于哪一笔交易)
            index: 所属交易输出的序号(属于第几个输出)
        }

type 锁的作用

在交易中,cell 从输入变成输出,它们在转换中可以遵循某些用户自定义的规则。

比如,我希望某个 cell 在交易中必须每次只能产生一个新的 cell,那么我就可以把这样一条规则变成一把锁,挂在盒子上。 再比如,我希望一个 cell 在交易中,它的 data 字段永远不会出现“胡萝卜”三个字,那么也可以构造这样一种规则的锁, 通常,这把锁会被放到盒子的 type 锁里。

这就是 type 和 lock 这两把锁的不同。一个用来保护盒子的所有权,一个用来保护数据转换规则。lock 锁就像 cell 的看门人,而 type 锁则是 cell 的守护神。

这种用途上的不同,归根到底是因为两把锁在运行机制上的设计有所差异。

两把锁的运作机制:

  • lock 锁:在一笔交易中,所有 input 的 lock 锁都会被执行一遍。
  • type 锁:在一笔交易中,所有 input 和 output 的 type 锁都会被执行一遍。

因为执行机制的不同,所以衍生出来的适合的用途也不同。 当然,你完全可以有自己的想法,本质上这些用途只是官方推荐的一种用法而已。 你完全可以不遵守。

课间休息

恭喜你,现在你已经掌握了这个教程所有必须的最小化的知识!

回顾下我们学习到的所有理论:

  • CKB 这条链的本质是一个个的 Cell,在不停地被创造出来和死去。
  • Cell 就是一个盒子,一个容器,它可以用来装任何类型的数据。
  • 要拥有 Cell 这个盒子,你需要有代币。代币的数量等于盒子空间的大小。1 CKB = 1个 byte 字节大小。
  • 整个 Cell 占用的总空间,不能超过 capacity 字段的数值大小。
  • 要保护自己的 Cell,你可以在 Cell 这个盒子上加一把锁,只有自己的钥匙能打开。
  • 锁的本质是一段可以运行的代码和一些参数。通过输入参数和用户提供的一些签名或者证明,代码运行判断是否能解锁。
  • 返回 0 代表解锁成功,返回其他数值代表解锁失败。
  • Cell 使用 code_hash 找到锁对应的代码,这些代码存放在 dep cell 里的 data 字段。
  • 每个 Cell 可以加两把锁,一把叫 lock(默认),一把叫 type(可选)
  • 在一笔交易中,所有 input 的 lock 锁都会被执行一遍。
  • 在一笔交易中,所有 input 和 output 的 type 锁都会被执行一遍。
  • 运行机制上的不同,让两把锁产生了不同的用途。
  • lock 锁通常被用来保护盒子的所有权。
  • type 锁通常被用来保证盒子的数据转换规则。
  • 一笔交易的本质就是销毁一些 cell,然后创造一些新 cell。

没错,只要掌握上面这些理论知识,你就可以开始上路了。

接下来,我们将亲自动手体验 CKB! 从零开始学习CKB:动手实践

原文链接: https://zero2ckb.ckbapp.dev/learn#before-we-get-started

点赞 1
收藏 0
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论
CKBFans
CKBFans
江湖只有他的大名,没有他的介绍。