简析 Cached Quotients Lookup Arguments

Lookup Arguments 允许证明者(prover)证明一个值属于一个预先定义的集合。

本文来自于  PSE Acceleration Program1的赞助支持。

代码: pylookup2

这个代码是参考 CQ 的 paper 实现的,请看 README.md 了解如何运行。另外,其中还包括了一个 cq.ipynb 文件, 是一个 Python notebook 版本的实现,是一个简化版本的 CQ 实现,和这个教程比较接近。

Lookup 要解决的问题

在零知识证明系统中,通常会利用算数化过程将一个计算问题转化为与之等价的数学表达形式(通常是多项式),这样就可以利用数学性质来对多项式进行变换,计算和验证。这是构建零知识证明的关键步骤,因为它使得复杂的计算过程可以在数学上被精确地表达和验证。

但有些计算不能被很好的算数化,或者算数化后会产生更多的约束(多项式)。比如证明一个值是否在一个范围内( 0<x<50<x<5 ),可能需要 10 个以上的约束。这时候使用 Lookup Arguments 能减少约束的数量,减少生成的证明大小。

Lookup Arguments 允许证明者(prover)证明一个值属于一个预先定义的集合。

拿刚才的例子来说,证明 0<x<50<x<5 只需要一个 lookup 约束: x{1,2,3,4}x \in \{1, 2, 3, 4\} , 即证明 xx 在表 {1,2,3,4}\{1, 2, 3, 4\} 中。

Table
1
2
3
4

上面的例子是一个单列的表格。更进一步,一个表可以表达任意的关系,只要对应的输入输出能在表中找到,我们就可以说 lookup 证明成立。

Input 1Input 2Input3Output
1236
23424
33848
48313
136433

比如表格第一行我们可以定义为一个加法: 1+2+3=61+2+3=6 ,只要给定的查找是 {1,2,3,6}\{1, 2, 3, 6\} ,就满足 lookup 的约束; 第二行可以定义为乘法: 234=242 * 3 * 4 = 24 ,只要给定的查找是 {2,3,4,24}\{2, 3, 4, 24\} ,就满足 lookup 的约束。

CQ 的贡献

从论文中的对比(下图)可以看到,CQ(Cached Quotients Lookup Arguments) 是目前 prover 计算复杂度最低的 lookup argument,仅为 O(nlogn)O(n logn) ,这一点通过一定的预处理来实现。和 Baloo 相比,CQ 有更少的群运算和更小的 proof size。


CQ 和上表中提到的四个 lookup arguments 主要差别是,CQ 利用了对数导数这个技巧,让 prover 的计算可以基于原始的大表,而不需要从大表中提取出一个子表(subtable),从而让 prover 的计算更加高效。

下面我们针对 CQ 的核心原理进行解释,如果你对更多的细节和优化感兴趣,可以参考原始的 paper。

对数导数

lookup argument 就是要证明向量/表 f\vec f  中的元素都在   t\vec t  中,这一点和其它 lookup argument 都是一致的。

假设:

  • f={f1,f2,f3,f4,...,fn}\vec f = \{f_1, f_2, f_3, f_4, ..., f_n\}

  • t={t1,t2,t3,t4,..,tn}\vec t = \{t_1, t_2, t_3, t_4, .., t_n\}

例如:

  • f={1,2,2,3,3,3}\vec f = \{1, 2, 2, 3, 3, 3\}

  • t={1,2,3,4}\vec t = \{1, 2, 3, 4\}

上面的问题可以转化为一个新的问题: 用这些元素构建一个多项式, 他们拥有相同的根:

  • f(x)=(x1)(x2)(x2)(x3)(x3)(x3)f(x) = (x-1)(x-2)(x-2)(x-3)(x-3)(x-3)

  • t(x)=(x1)1(x2)2(x3)3(x4)0t(x) = (x-1)^1(x-2)^2(x-3)^3(x-4)^0

这样的好处是,我们可以利用多项式的数学性质进行后续的计算和证明。

注意 t(x)t(x) 中需要统计 f\vec f 中出现重复元素的次数,作为多项式 t(x)t(x) 对应根的位置的幂次,没有出现的元素的次数为 0。可以看到, f\vec f  中元素在   t\vec t  中出现的次数:

  • 1 在   t\vec t  中出现的次数为 1

  • 2 出现次数为 2

  • 3 出现次数为 3

  • 4 出现次数为 0

这里可以用一个向量 m\vec m 表示:

m={1,2,3,0}\vec m = \{1, 2, 3, 0\}
所以 t(x)t(x) 有这样的构造: t(x)=(x1)1(x2)2(x3)3(x4)0t(x) = (x-1)^1(x-2)^2(x-3)^3(x-4)^0

可以看到,如果 f(x)f(x) 等于 t(x)t(x) ,就可以说   f\vec f  中的元素都在   t\vec t  中,满足 lookup argument 的证明。

构造连乘的多项式还有一个好处,可以不用考虑   f\vec f  和   t\vec t  两个向量中元素的顺序。

不过实际中通常不会直接对比,因为:

  1. f\vec f 通常是秘密的值,不是公开的,不能直接对比

  2. f\vec f  和   t\vec t  的 size 一般都非常大,构建的多项式次数很高,相对难以处理

有没有更好的方式证明 f(x)=t(x)f(x) = t(x) 呢?

有。CQ 使用了Multivariate lookups based on logarithmic derivatives3论文中提到的「对数导数法」,将乘法关系转换为加法关系,让证明变得简洁了很多。

什么叫对数导数法?

在数学中,对数导数法是一种求函数导数的技巧,特别适用于复杂函数的求导,尤其是当函数是多个函数的乘积形式时。这种方法通过应用自然对数( lnln )和链式法则来简化求导过程。

下面我们来计算 f(x)=(x1)(x2)2(x3)3f(x) = (x-1)(x-2)^2(x-3)^3 的对数导数。按照对数导数法的步骤,我们先对 f(x)f(x) 取对数,然后对所得表达式求导。下面是具体的计算步骤:

取对数:

ln(f(x))=ln((x1)(x2)(x2)(x3)(x3)(x3))\begin{array}{c} \ln(f(x)) &= \ln((x-1)(x-2)(x-2)\\ &(x-3)(x-3)(x-3)) \end{array}

展开对数(利用对数的性质,将乘积转换为求和):

ln(f(x))=ln(x1)+ln(x2)+ln(x2)+ln(x3)+ln(x3)+ln(x3)\begin{array}{c} \ln(f(x)) & = \ln(x-1) + \ln(x-2) \\ &+ ln(x-2)+ \ln(x-3)\\ &+ {} ln(x-3) + \ln(x-3) \end{array}

对等式两边求导(应用链式法则和基本导数规则):

ddxln(f(x))=ddx(ln(x1)+ln(x2)+ln(x2)+ln(x3)+ln(x3)+ln(x3))\begin{array}{c} \frac{d}{dx}\ln(f(x)) &= \frac{d}{dx}(\ln(x-1) + \ln(x-2)\\ &+ \ln(x-2)+ \ln(x-3)\\ &+ \ln(x-3) + \ln(x-3)) \end{array}

化简为:

f(x)f(x)=1x1+1x2+1x2+1x3+1x3+1x3\begin{array}{c} \frac{f'(x)}{f(x)} &= \frac{1}{x-1} + \frac{1}{x-2}+ \frac{1}{x-2} \\ &+ \frac{1}{x-3} + \frac{1}{x-3} + \frac{1}{x-3} \end{array}

即:

f(x)f(x)=jf1xfj\frac{f'(x)}{f(x)} = \sum_{j \in |\vec f|} \frac{1}{x-f_j}

同样对 t(x)t(x) 求对数导数得到:

t(x)t(x)=1x1+2x2+3x3\frac{t'(x)}{t(x)} = \frac{1}{x-1} + \frac{2}{x-2}+ \frac{3}{x-3}

即:

t(x)t(x)=itmixtj\frac{t'(x)}{t(x)} = \sum_{i \in |\vec t|} \frac{m_i}{x-t_j}

所以需要证明:

f(x)f(x)=t(x)t(x)\frac{f'(x)}{f(x)} = \frac{t'(x)}{t(x)}

即:

jf1xfj=itmixti\sum_{j \in |\vec f|} \frac{1}{x-f_j} = \sum_{i \in |\vec t|} \frac{m_i}{x-t_i}

简化一下写法,定义 ai=mi/(xti)a_i = m_i / (x - t_i) 和   bj=1/(xfj)b_j = 1 / (x - f_j)

即需要证明:

iai=jbj\sum_i a_i = \sum_j b_j

可以看到这个过程将多个函数的乘积转换为求和的形式。最终将 lookup 证明转换为证明对数导数( f(x)f(x)\frac{f'(x)}{f(x)}t(x)t(x)\frac{t'(x)}{t(x)} ) 相等。

对数导数 lookup 协议

通过上面的对数导数可以构建一个简单的 lookup argument:

  • prover 给 verifier 发送 f,t,m\vec f, \vec t, \vec m

  • verifier 给 prover 发送随机数 β\beta

  • prover 给 verifier 发送多个值:   ai=mi/(βti)a_i = m_i / (\beta - t_i) 和   bj=1/(βfj)b_j = 1 / (\beta - f_j) ,其中 iijj 的取值范围为 t\vec tf\vec f 中元素的个数,即 itjfi \in |\vec t|,j \in |\vec f|

  • verifier 做三种检查

    • aia_i 值检查: ai(βti)=mia_i * (\beta - t_i) = m_i
    • bib_i 值检查: bi(βfi)=1b_i * (\beta - f_i) = 1
    • sum 检查: iai=jbj\sum_i a_i = \sum_j b_j

对于 aia_ibib_i 的检查,上面的 lookup 协议有一个问题,就是 proof size 比较大,因为需要将所有的 aia_ibib_i 值都发给 verifier。要解决这个问题,我们可以利用 Schwartz-Zippel 定理,将所有 aia_ibib_i 的值编码到多项式中,然后 verifier 只需要发送一个随机值进行验证就可以保证 prover 提供的所有 aia_ibib_i 的值是正确的。

对于 sum 检查,我们可以直接使用 univariate sumcheck。

下面我们分别看看如何构造对应的证明。

多项式构造和 pairing: 证明 aia_ibib_i

为了验证:

  • aia_i 的正确性: ai(βti)=mia_i * (\beta - t_i) = m_i

  • bib_i 的正确性: bi(βfi)=1b_i * (\beta - f_i) = 1

我们通过将 aia_ibib_i 分别构造成一个多项式,然后利用多项式的性质来进行验证。

所以需要:

  • 从   aia_i 构建出多项式 A(x)A(x) ,并验证构造的正确性

  • 从   bib_i 构建出多项式 B(x)B(x) ,并验证构造的正确性

构造多项式我们通常使用拉格朗日插值法。这就需要构造一系列 {xi,yi}\{x_i, y_i\} 值对,将这些值对插值成多项式,通常 {xi}\{x_i\} 的值来自于一个乘法子群,群的大小为 {yi}\{y_i\} 的大小,这里分别为 t|\vec t|f|\vec f|

如何构造 A(x)A(x) ?

  1. verifier 发送随机数 β\beta ,令 x=βx = \beta

  2. 选择大小为 t|\vec t| 的乘法子群   Ht={ωi}H_t = \{\omega_i\}iti \in |\vec t|

  3. A(ωi)=ai=mi/(tiβ)A(\omega_i) = a_i = m_i / (t_i - \beta){xi,yi}\{x_i, y_i\} 值对为   {ωi,ai}\{\omega_i, a_i\}

  4. 使用拉格朗日插值法得到多项式 A(x)A(x)

如何检查 A(x)A(x) 被正确构造?

  1. 分别对 m\vec mt\vec t 在乘法子群上进行插值得到多项式 M(x)T(x)M(x),T(x)

  2. 在乘法子群   HtH_t 上,多项式满足 A(x)=M(x)/(T(x)β)A(x) = M(x)/(T(x) - \beta)

  3. 变换为 A(x)(T(x)β)M(x)=0A(x)(T(x) - \beta) - M(x) = 0

  4. 由多项式余式定理得到 A(x)(T(x)β)M(x)=QA(x)ZA(x)A(x)(T(x) - \beta) - M(x) = Q_A(x) * Z_A(x) 。这个等式对 xx 为群上的任意值都成立。其中 QA(x)Q_A(x) 为商多项式, ZA(x)=i(xωi)Z_A(x) = \prod_i(x - \omega_i) 为消失多项式

  5. prover 发送
    a. A(x)A(x) 的承诺 [A(x)]1[A(x)]_1
    b. QA(x)Q_A(x) 的承诺 [QA(x)]1[Q_A(x)]_1
    c. M(x)M(x) 的承诺 [M(x)]1[M(x)]_1

  6. verifier 自行计算 T(x)T(x) 的承诺 [T(x)]2[T(x)]_2 和   ZA(x)Z_A(x) 的承诺 [ZA(x)]2[Z_A(x)]_2 ,然后通过椭圆曲线的 pairing 进行 KZG  验证: e([T(x)]2,[A(x)]1)=e([1]2,[A(x)]1β+[M(x)]1)e([ZA(x)]2,[QA(x)]1)e([T(x)]_2, [A(x)]_1) = e([1]_2, [A(x)]_1 * \beta + [M(x)]_1) * e([Z_A(x)]_2, [Q_A(x)]_1)

注意: 和 paper 有些区别的地方是,为了方便解释,文章中有些地方使用了 - 号而不是 ++ 号,这是因为在群上做减法运算会转化成加法运算,比如对于 modulus=5modulus = 5 的群, β=2%5=3\beta=-2\%5 = 3 ,所以   (x2)%5=x+3(x - 2)\%5 = x + 3 ,我们随时可以将减法转化为加法表示,因此在符号表示上,在有些场景下不做区分。

同样的方法构造 B(x)B(x) :

  1. verifier 发送随机数 β\beta ,令 x=βx = \beta

  2. 选择大小为 f|\vec f| 的乘法子群 Hf={ωj}H_f = \{\omega_j\}jfj \in |\vec f|

  3. B(ωj)=bj=1/(fjβ)B(\omega_j) = b_j = 1 / (f_j - \beta){xj,yj}\{x_j, y_j\} 值对为 {ωj,bj}\{\omega_j, b_j\}

  4. 使用拉格朗日插值法得到多项式 B(x)B(x)

检查 B(x)B(x) 被正确构造:

  1. f\vec f 在乘法子群上进行插值得到多项式 F(x)F(x)

  2. 在乘法子群 HfH_f 上,多项式满足 B(x)=1/(F(x)β)B(x) = 1/(F(x) - \beta)

  3. 变换为 B(x)(F(x)β)1=0B(x)(F(x) - \beta) - 1 = 0

  4. 由多项式余式定理得到 B(x)(F(x)β)1=QB(x)ZB(x)B(x)(F(x) - \beta) - 1 = Q_B(x) * Z_B(x) 。这个等式对 xx 为群上的任意值都成立. 其中 QB(x)Q_B(x) 为商多项式, ZB(x)=j(xωj)Z_B(x) = \prod_j(x - \omega_j) 为消失多项式

  5. prover 发送
    a. B(x)B(x) 的承诺 [B(x)]1[B(x)]_1
    b. QB(x)Q_B(x) 的承诺 [QB(x)]1[Q_B(x)]_1
    c. F(x)F(x) 的承诺 [F(x)]1[F(x)]_1

  6. verifier 自行计算 ZB(x)Z_B(x) 的承诺 [ZB(x)]2[Z_B(x)]_2 ,然后通过椭圆曲线的 pairing 进行验证: e([F(x)]2,[B(x)]1)=e([1]2,[B(x)]1β+[1]1)e([ZB(x)]2,[QB(x)]1)e([F(x)]_2, [B(x)]_1) = e([1]_2, [B(x)]_1 * \beta + [1]_1) * e([Z_B(x)]_2, [Q_B(x)]_1)

注意: paper 中的验证对计算过程进行了一定的优化,我们这里为了叙述方便,没有使用和 paper 中一样的验证方式,不过核心原理是一样的, 都是通过 pairing 进行 KZG 验证。

Sumcheck

接下来我们要验证 sum 成立: iai=jbj\sum_i a_i = \sum_j b_j

前面证明了左右两边每一项都是正确的,那下面需要证明左右两边的加和是正确的,也就是需要彼此相等. 证明的方法是 sumcheck。可以利用这样一个引理来证明:

aHf(a)=tf(0)\sum_{a \in H} f(a) = t \cdot f(0)

其中:

  • HH 为乘法子群: H={1,ω,ω2,...,ωt2,ωt1}H=\{1, \omega, \omega^2, ..., \omega^{t-2}, \omega^{t-1} \}ttHH 中元素的个数, t=Ht=|H|ω\omega 是单位根

  • f(x)f(x) 为一个多项式,

f(x)=f0+f1x+f2x2+...+ft2xt2+ft1xt1\begin{array}{c}f(x) &= f_0 + f_1x + f_2x^2 + ...\\ &+ f_{t-2}x^{t-2} + f_{t-1}x^{t-1} \end{array}

让我们来分解一下计算过程,将 aaHH 中的值带入 f(x)f(x) 可得:

aHf(a)=f(1)+f(ω)+f(ω2)+...++f(ωt1)=f0+f1+f2+...+ft2+ft1+f0+f1ω+f2ω2+...+ft2ωt2+ft1ωt1+f0+f1(ω2)+f2(ω2)2+...+ft2(ω2)t2+ft1(ω2)t1...+f0+f1(ωt2)+f2(ωt2)2+...+ft2(ωt2)t2+ft1(ωt2)t1+f0+f1(ωt1)+f2(ωt1)2+...+ft2(ωt1)t2+ft1(ωt1)t1=tf0+f1it(ω)i+f2it(ω2)i+...+ft2it(ωt2)i+ft1it(ωt1)i\begin{align*} & \sum_{a \in H} f(a) = f(1) + f(\omega) + f(\omega^2) + ... + + f(\omega^t-1) \\ & \\ & \\ & = f_0 + f_1 + f_2 + ... + f_{t-2} + f_{t-1} \\ & + f_0 + f_1\omega + f_2\omega^2 + ... + f_{t-2}\omega^{t-2} + f_{t-1}\omega^{t-1} \\ & + f_0 + f_1(\omega^2) + f_2(\omega^2)^2 + ... + f_{t-2}(\omega^2)^{t-2} + f_{t-1}(\omega^2)^{t-1} \\ & . \\ & . \\ & . \\ & + f_0 + f_1(\omega^{t-2}) + f_2(\omega^{t-2})^2 + ... + f_{t-2}(\omega^{t-2})^{t-2} + f_{t-1}(\omega^{t-2})^{t-1} \\ & + f_0 + f_1(\omega^{t-1}) + f_2(\omega^{t-1})^2 + ... + f_{t-2}(\omega^{t-1})^{t-2} + f_{t-1}(\omega^{t-1})^{t-1} \\ & \\ & \\ & = t \cdot f_0 + f_1\sum_{i \in t}(\omega)^i + f_2\sum_{i \in t}(\omega^2)^i + ... + f_{t-2}\sum_{i \in t}(\omega^{t-2})^i + f_{t-1}\sum_{i \in t}(\omega^{t-1})^i \\ \end{align*}

上面公式中,除了第一项,后面的 t1t-1 项每个 sumsum 都为 0。这是因为,每个 ωi\omega^i 都是有限域上乘法子群中的元素,而乘法子群中每个元素都可以作为乘法子群的生成元,也就说明后面的 t1t-1 项的每个 sumsum 都是乘法子群中所有元素的 sumsum

有限域上的乘法子群与复数域上的单位圆结构类似。在单位圆上:

  • 所有元素都由单位元生成并均匀分布在单位圆上

  • 每个元素基于原点都有另外一个对称的点, 这两点复平面上的矢量和抵消,加和等于 0

因此所有单位圆的元素 sumsum 等于 0。

因为要使用 FFT(Fast Fourier Transform)做多项式的插值,所以要求乘法子群的元素个数是 2 的幂次个。在乘法子群中,每个元素也有对称的点,对于拥有 tt 个元素的乘法子群 HH : Hi+Hi+t/2=0H_i + H_{i+t/2} = 0 ,这两个对称的点相加等于 0,所以乘法子群所有元素的 sumsum 也等于 0。这就是为什么后面的 t1t-1 项每个 sumsum 都为 0:

it(ω)i=0it(ω2)i=0...it(ωt2)i=0it(ωt1)i=0\begin{align*} & \sum_{i \in t}(\omega)^i = 0\\ & \sum_{i \in t}(\omega^2)^i = 0 \\ & . \\ & . \\ & . \\ & \sum_{i \in t}(\omega^{t-2})^i = 0 \\ & \sum_{i \in t}(\omega^{t-1})^i = 0 \\ \end{align*}

所以:

aHf(a)=tf0+f1it(ω)i+f2it(ω2)i+...+ft2it(ωt2)i+ft1it(ωt1)i=tf0+f10+f20+...+ft20+ft10=tf0\begin{align*} & \sum_{a \in H} f(a) \\ & = t \cdot f_0 + f_1\sum_{i \in t}(\omega)^i + f_2\sum_{i \in t}(\omega^2)^i + ... + f_{t-2}\sum_{i \in t}(\omega^{t-2})^i + f_{t-1}\sum_{i \in t}(\omega^{t-1})^i \\ & = t \cdot f_0 + f_1 \cdot 0 + f_2 \cdot 0 + ... + f_{t-2} \cdot 0 + f_{t-1} \cdot 0 \\ & = t \cdot f_0 \end{align*}

所以:

xHtA(x)=tA(0)\sum_{x \in H_t} A(x) = |\vec t| \cdot A(0)
xHfB(x)=fB(0)\sum_{x \in H_f} B(x) = |\vec f| \cdot B(0)

我们只需要验证下面的关系是否成立:

tA(0)=?fB(0)|\vec t| \cdot A(0) \stackrel{?}{=} |\vec f| \cdot B(0)

最终,我们通过这三个证明就完成了 CQ 要证明的 lookup。

致谢

  • Guo Yu

  • Yu-Ming Hsu

  • Jing-Jie Wang

  • Paul Yu

  • Even Lu

参考

撰文:@harryx1x1

编辑:@ziyinlox

Footnotes

  1. PSE Acceleration Program: https://github.com/privacy-scaling-explorations/acceleration-program

  2. pylookup: https://github.com/luckyyang/pylookup/tree/cq_fk/src/cq

  3. Multivariate lookups based on logarithmic derivatives: https://eprint.iacr.org/2022/1530.pdf

点赞 1
收藏 1
分享
本文参与登链社区写作激励计划 ,好文好收益,欢迎正在阅读的你也加入。

0 条评论

请先 登录 后评论