Skip to content

Latest commit

 

History

History
291 lines (194 loc) · 12.9 KB

README_CN.md

File metadata and controls

291 lines (194 loc) · 12.9 KB

LOGO

github license

Build-and-Test Performance Test


概述

Rosetta 是一个基于TensorFlow开发的隐私计算框架,它将陆续集成密码学、联邦学习和可信执行环境等主流的隐私计算技术。Rosetta 旨在为人工智能快速提供隐私保护技术解决方案,不需要用户掌握任何密码学、联邦学习和硬件安全执行环境领域的专业知识。Rosetta 在用户接口层复用了 TensorFlow 的对外 API 从而使得用户可以以最低的改造成本将隐私保护功能集成到现有的 TensorFlow 程序中。在简单场景下,只需添加如下一行代码就可以完成这样的转换:

import latticex.rosetta

当前版本集成了3方参与的安全多方计算(MPC)协议。当前使用的默认底层协议是 SecureNN 和自研的 Helix 协议。这些协议可以在诚实者占多数的半诚实安全模型假设下保障数据安全。

Rosetta 还集成了一个高效的零知识证明协议 [Mystique] (https://eprint.iacr.org/2021/730),用于复杂机器学习模型预测阶段的相关安全证明,例如 ResNet。关于其使用请参考 示例说明.

安装

目前,Rosetta 可以运行在 Ubuntu 18.04 操作系统下,并且基于 TensorFlow 1.14 CPU 版本开发。安装方式如下:

首先,请确认本地系统的基础环境已经符合要求

然后,使用如下命令行安装原生 TensorFlow 库:

# install tensorflow
pip3 install tensorflow==1.14.0

接着,使用一键安装脚本编译与安装 Rosetta 包,命令如下:

# clone rosetta git repository
git clone --recurse https://github.com/LatticeX-Foundation/Rosetta.git

或者(github更新了 personal access token使用方法,SSH仍可使用。最新情报请参照github)
git clone [email protected]:LatticeX-Foundation/Rosetta.git
git submodule update --init --recursive

cd Rosetta
# compile, install. You may check more compilation options by checking `./rosetta.sh --help`
./rosetta.sh compile --enable-protocol-mpc-securenn; ./rosetta.sh install

安装完成后,基于下面介绍的例子可以验证是否安装成功。

在实际使用中,运行脚本之前还需要进行多方之间网络拓扑关系等信息的配置,以使得分布式执行时多方之间可以正常的通讯。更多安装、配置和部署的详情请参考部署指南

使用示例

我们将用多方联合执行矩阵乘法的示例来演示Rosetta的基本使用。

矩阵乘法是AI中常见的操作。基于Rosetta,我们可以实现:在每方用户持有各自私有数据,且不想泄露自己明文数据的场景下,进行联合计算并让有限方得到矩阵乘积的可能。

假设P0, P1 和 P2 三方用户各自持有私有的数据矩阵,他们想在不泄露自己明文数据的前提下共同计算出这三个矩阵的乘积。每方直接运行下面的代码即可完成这个任务:

#!/usr/bin/env python3

# Import rosetta package
import latticex.rosetta as rtt
import tensorflow as tf

# You can activate a backend protocol, here we use SecureNN
rtt.activate("SecureNN")

# Get private data from every party
matrix_a = tf.Variable(rtt.private_console_input(0, shape=(3, 2)))
matrix_b = tf.Variable(rtt.private_console_input(1, shape=(2, 1)))
matrix_c = tf.Variable(rtt.private_console_input(2, shape=(1, 4)))

# Just use the native tf.matmul operation.
cipher_result = tf.matmul(tf.matmul(matrix_a, matrix_b), matrix_c)

# Start execution
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # Take a glance at the ciphertext
    cipher_result = sess.run(cipher_result)
    print('local ciphertext result:', cipher_result)
    # Set only party a and c can get plain result
    a_and_c_can_get_plain = 0b101 
    # Get the result of Rosetta matmul
    print('plaintext matmul result:', sess.run(rtt.SecureReveal(cipher_result, a_and_c_can_get_plain)))

如上,简单的改动几行代码就可以完全复用 TensorFlow 中的 API 接口了。当然,运行这个隐私计算程序需要三方的协同,在配置好网络拓扑等信息后,三方需要各自执行下面的命令行来启动执行。如果在本地模拟三方的场景,可以用三个bash来实现:

第一个bash模拟P0方:

python rosetta_demo.py --party_id=0

第二个bash模拟P1方:

python rosetta_demo.py --party_id=1

第三个bash模拟P2方:

python rosetta_demo.py --party_id=2

运行时各方会被提示输入自己的隐私数据(注意,这里是为了便于演示采用了这种输入方式,在实际中请采用 Rosetta 中的数据预处理接口),比如 P0 可以在如下提示后输入自己的私有数据:

2021-10-22 09:46:08.571|info|Rosetta: Protocol [SecureNN] backend initialization succeeded! task: , node id: P0

please input the private data (float or integer, 6 items, separated by space): 2 3 1 7 6 2

P1 输入自己的私有数据:

2021-10-22 09:46:08.571|info|Rosetta: Protocol [SecureNN] backend initialization succeeded! task: , node id: P1

please input the private data (float or integer, 2 items, separated by space): 1 2

P2 输入自己的私有数据:

2021-10-22 09:46:08.571|info|Rosetta: Protocol [SecureNN] backend initialization succeeded! task: , node id: P2

please input the private data (float or integer, 4 items, separated by space): 2 1 4 3

在程序的最后,如我们在程序中特意指定的那样,只有 P0 和 P2 会得到最后的明文结果:

plaintext matmul result: [[b'16.000000' b'8.000000' b'32.000000' b'24.000000']

[b'30.000000' b'15.000000' b'60.000000' b'45.000000']

[b'20.000000' b'10.000000' b'40.000000' b'30.000000']]

2021-10-22 09:49:58.888|info|Rosetta: Protocol [SecureNN] backend has been released.

P1 方不会拿到有意义的明文结果:

plaintext matmul result: [[b'0.000000' b'0.000000' b'0.000000' b'0.000000']

[b'0.000000' b'0.000000' b'0.000000' b'0.000000']

[b'0.000000' b'0.000000' b'0.000000' b'0.000000']]

2021-10-22 09:49:58.887|info|Rosetta: Protocol [SecureNN] backend has been released.

就是这样,可以看出 Rosetta 是很方便易用的。


那么,如何在 Rosetta 中快速地使用 ZKP呢?与上面的 MPC 类似,下面是一个简单的示例

#!/usr/bin/env python3

# Import rosetta package
import latticex.rosetta as rtt
import tensorflow as tf

# You can activate a backend protocol, here we use Mystique
rtt.activate("Mystique")

# P0 is the Prover, providing all the witnesses(private), and
# P1 is the Verifier
matrix_a = tf.Variable(rtt.private_console_input(0, shape=(3, 2)))
matrix_b = tf.Variable(rtt.private_console_input(0, shape=(2, 3)))

# Just use the native tf.matmul operation.
cipher_result = tf.matmul(matrix_a, matrix_b)

# Start execution
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # Take a glance at the ciphertext
    cipher_result_v = sess.run(cipher_result)
    print('local ciphertext result:', cipher_result_v)
    # Get the result of Rosetta matmul
    print('plaintext result:', sess.run(rtt.SecureReveal(cipher_result)))

rtt.deactivate()

这里 P0 是证明者,提供所有的 witness (私有的),其输入如下:

2021-10-22 18:12:46.629|info|Rosetta: Protocol [Mystique] backend initialization succeeded! task: , node id: P0

2021-10-22 18:12:46.629|info|create and activate ok. task: for protocol: Mystique

please input the private data (float or integer, 6 items, separated by space): 0 1 2 3 4 5

please input the private data (float or integer, 6 items, separated by space): 5 4 3 2 1 0

这里 P1 是验证者,在程序的最后,验证成功,并输出明文结果如下:

2021-10-22 18:13:12.860|info|succeed in verifying zk!!

plaintext result: [[b'2.000000' b'1.000000' b'0.000000']

[b'16.000000' b'11.000000' b'6.000000']

[b'30.000000' b'21.000000' b'12.000000']]

2021-10-22 18:13:13.009|info|Rosetta: Protocol [Mystique] backend has been released.


想要体验更多的例子,请参考示例目录

提示: 当前 Rosetta 版本已经可以支持128-bit的大整数数据类型,这意味着底层的密码协议可以有更高的精度选择空间,你可以通过在环境变量中设置export ROSETTA_MPC_128=ON, 并在编译时加上 --enable-128bit 选项来开启这一服务。

快速上手

为了让大家快速上手 Rosetta,实现自己的程序,我们在教程文档中详细的介绍了 Rosetta 的使用。在这个教程中,我们会介绍有关 Rosetta 的一些基本概念,然后通过一系列简单易懂的例子协助大家在真实数据集上构建一个完整可运行的隐私保护的机器学习模型。

Rosetta 整体架构

Rosetta 是通过深度扩展、改造 TensorFlow 的前后端各个组件,并融合底层密码学协议来实现的。通过划分不同的层次和模块,实现 TensorFlow 相关的 AI 框架相关部分和隐私保护技术相关部分的解耦,从而便于来自 AI 领域和来自隐私计算技术领域的专家开发者可以专注于各自擅长和感兴趣的部分,快速的进一步扩展 Rosetta。

在运行 Rosetta 程序时,在数据流图的构建阶段,原生的 TensorFlow 数据流图中的算子(无论是前向子图还是后向梯度子图中的算子)会被自动的替换为 Rosetta 中对应的具有隐私保护功能的 SecureOp 算子。

在实际执行各个算子时,SecureOp 算子中会进一步根据用户所配置的后端协议调用具体协议中的基础运算算子来实现多方协同的隐私计算。

为了帮助大家进一步了解 Rosetta 的整体设计和工程化实践,我们会持续发表一系列有深度的技术文章,比如在InfoQ上的专栏介绍,欢迎大家持续关注。

参与Rosetta建设

Rosetta 是一个由Lattice基金会维护的、基于 LPGLv3 许可证的开源项目。

我们欢迎来自个人和组织的各种贡献,包括代码开发、文档撰写、合作交流等各个方面,也欢迎 star、推广我们的 Github 项目。具体内容请参考社区参与指南社区行为规范。如果在使用或开发中有任何的问题,你也可以直接的在 这里 给我们提 issues。

文档列表

引用方式

如果需要引用我们的项目,可以使用如下的格式:

    @misc{Rosetta,
      author = {Yuanfeng Chen, Gaofeng Huang, Junjie Shi, Xiang Xie, and Yilin Yan},
      title = {{Rosetta: A Privacy-Preserving Framework Based on TensorFlow}},
      howpublished = {\url{https://github.com/LatticeX-Foundation/Rosetta}},
      year={2020}
    }

参考文献

可以查看 wiki 页面 了解我们参考的学术论文和相关软件.

联系方式

你可以通过邮箱联系我们。也非常欢迎加入我们在 Slack上的 Rosetta 社区以获取最新资讯、和其他开发者一起交流讨论。

许可证

Rosetta 代码库基于 GNU Lesser General Public License v3.0 许可证开放使用。