以 Lens protocol 为例看清去中心化社交应用数据架构,探讨 Dapp 的去中心化数据层
2023-03-01 10:43
穆冉区块链
2023-03-01 10:43
订阅此专栏
收藏此文章

为什么这么关注社交?是因为在 web2 能得到大规模采用,就是因为社交网络,更离不开人与人之间的关系,无论是会员关系、粉丝关系、订阅关系、还是好友关系,正是因为这种关系的交织,让 web2 的网络走入到了每个人的生活。Web2 社交应用的局限性,大家有目共睹,简单提炼下就是:

1、账户所有权被中心化控制

2、社交关系被中心化垄断

3、数据所有权被中心化垄断,交易买卖

4、社交 app 算法滥用,广告肆意泛滥

Web3 为解决上述问题提供了条件,新的 dapp 应用协议,谁能解决 web2 社交的当前问题,并创造一个新的模式,谁就会是下一代互联网的王者。

所以 Web3 的社交如此重要,但目前为止依然没有一个能让你熟悉 web3 社交走入人们的生活,但我们可以展望,Web3 的社交应该是什么样的。关于去中心化社交, 我认为有四个重要元素:

1、用户完全自我控制权的「身份账号」

2、用户完全所有权的「社交关系」

3、开放易获得的,具有所有权的「内容及内容关系」

4、灵活的「应用终端」

一、身份账号

身份是核心,它标识了我是谁,以及我在社交网络中产生的内容,应该属于谁。

在 web2 时代,账号的发展经历了三个阶段:

1、单体应用,独立账号;

2、单一生态体系,统一账号;

3、跨生态,通用账号签名;

  • 阶段一:单体应用,独立账号

在 web2,每个应用都有自己的账号体系,最简单的比如登录论坛注册一个账号和密码 

  • 阶段二、单一生态体系,统一账号

当阶段一的独立网站如果做大做强了,发展出了一个生态体系,这个生态下有很多应用,你都可以用一个账号登录,最典型的就是微信账号、淘宝账号,使用微信账号可以登录腾讯生态下的任何应用,使用淘宝账号可以登录任意的阿里巴巴下的应用。

  • 阶段三、跨生态,通用账号签名

这个阶段并不能称之为阶段二的升级版,而是共存。这个登录模式就是手机号或邮箱登录, 确认验证码作为签名证明自己是这个账号的持有人。这样,用户完全不用再关心记录多个账号。我自己使用最多的是基于 Google 邮箱的签名登录。

在 web2 中, 看起统一账号也不是不行嘛,甚至大不了所有应用都用身份证号登录?

但是,问题有两方面:

1、账号发行者完全有能力封锁你的账号,拒绝给你提供签名验证。举个例子,使用手机号登录,网站都会需要给你发验证码确认,电信公司完全可以拒绝给你发。

2、应用都不允许你再登录或不允许你再发帖,比如微博一键封杀账号

所以问题的关键还不是账号唯一性问题,而是账号控制权问题和应用使用权的问题。

在 web3 中,第一个问题很好解决,最通用的账号就是公链 address , 用户完全控制权,没有人能阻止你签名验证。除此之外,它还有很多附加好处:唯一性、公开可验证、匿名性等等。

第二个问题,是数据的访问权问题,与账号控制权无关,我们下面讲。

可以确定一个点是,社交身份,肯定是公链地址或与之强相关,身份 Id 的所有权和控制权只能是自己,唯一是自己, 这样的身份,只有最去中心化的公链能保证

二、社交关系

社交关系是指人与人之间的 follow 关系,订阅关系,好友关系,毋庸置疑,这是除了身份 id 之外,社交账号的核心资产。它的价值,不亚于我存在银行账号里的资金,区块链账号里的代币余额。

在 web2 时代,很多应用都会做用户关系。比如 bilibili,如果我喜欢谁的视频,就订阅他;在淘宝,喜欢那个店铺会关注这个店铺;在 Newsletter 里,我喜欢谁的文章,也会订阅他 Newsletter 号;在微信、在 qq 甚至在淘宝,都会搭建好友列表。

社交关系跟身份 id 解绑定,并不是强制关系,我作为一个用户,最想要的就是:

社交关系被 id 完全拥有,当别人 follow 你后,第三方无权干涉,社交关系还能跨应用。所以社交关系的保存,也是强去中心化诉求。

三、内容及内容关系

所谓内容,就是人们在社交网络中发出去的内容,如推文、博客、评论、点赞等。而数据内容之间的关系,即 A 对 B 文章的评论、点赞、转载等操作,可以简单理解为内容和内容之间的关系。

对于数据内容,发散起来问题很多,比如成本、隐私、安全等等,但是在我看来社交内容数据最核心的有三点:

1、数据的真实性,真实性体现在我发的内容就是我的,而不是别人冒充我发的,人们对我写文章的点赞是真实可靠的,而不是虚假杜撰,也可以理解为数据所有权

2、数据的可获取性,体现在,我的数据不依赖任何中心化平台,通过多个入口都能查询获取得到

在保证这两个核心诉求之后,再考虑其它的问题,如加密隐私、存储成本、访问性能、数据关系等。

显然,这两个问题是任何一个 web2 的平台都无法做到的,只有可能在去中心化的网络体系下才能做到(请注意,这里我并没有说区块链)。

我作为一个内容产出者,最理想的情况是,希望我写的文字能永久保存,评论及点赞数是真实有效的,内容产生及输出不依赖于任何一个平台审核者。显然,数据完全放到区块链上,是最好的,因为直接存储到区块链上,最满足上面的所有诉求。但是,数据最明显的特征是,量非常大, 理论上,一个人一个账号就能产出无限多内容 。

所以 成本、成本、成本 是关键。

在 web2 中,除了社交关系以外,这些数据是各大公司的重要资产,训练 AI 模型,做大数据分析,挖掘商业价值等等,都离不开这些数据,所以这些公司愿意支持费用,”免费“帮你存储这些数据,同时也对你的数据有了绝对的控制权。

所以,当我们想摆脱大公司对我们数据的垄断和控制时,要可能要自己承担这类数据的存储成本,这个成本远低于存储到公链上,又能保证对数据的两点基本诉求。

可想而知,在 web3 的社交架构图里,是要有一个数据层的,去存储数据,管理数据和数据的关系的,基本功能点需要保证我前面提到的数据真实性和可获取性,方式也很明确:

1、通过用户私钥对数据签名,只有签名的数据才认可为用户的真实有效数据

2、由去中心化的节点“全量”保存数据,保证全网总能获取到全量的用户数据。

四、应用

应用是最不重要的,也是最重要的。

说它最不重要,因为它是数据的最末端,在 web3 社交体系下,应用不应该控制任何用户数据,它能做的只有两件事:帮用户上传数据到网络中 和 从网络中下载数据供用户阅读。

既然我的以上数据不被任何应用掌控,那么,我就可以随时切换应用终端,所以应用是最外围的,不核心的。

但是,应用的体验又是那么重要,如果没有一个好的应用体验,是不可能 on-board 大规模用户的,所以, 应用层,显然会有更高的数据自定义程度,应用可以很自由的用各种方式去组织数据。

应用可能作恶如篡改用户数据、故意显示错误数据、滥用推荐算法或接入广告,给用户推送大量不想看到的数据,在用户能很容易迁移应用的前提,这类问题的解决已经不再那么困难了。但是,在我看来,给到应用开发者一定的数据处理自由度是被允许的,毕竟应用开发者也需要探索自己的商业价值。

探讨社交协议的层次架构

综上, 我们来绘制一个基本的框架,我想,未来任何一个社交应用,都可以尝试往这四层逻辑里套了。

四层分别关注点不一样:

1、一层是身份 id 完全控制权, 保存在最去中心化的区块链中如 ETH;

2、二层是关系绝对拥有权, 保存在相对去中心化的区块链中;

3、三层数据内容的真实有效(所有权)和可获得性,保存在 p2p 的去中心化网络中

4、四层是应用的开发灵活性和用户可迅速迁移性。

分析下 Lens

当抽象了这样一个框架后, 很轻易的就知道,当前各种社交应用或社交协议所处的定位,比如 Lens 、Farcaster 、Debox、Inpeak、 Steemit、Link3 等等终端应用 ,包括 Ai 在这个里面定位。

有些 web3 社交应用,做了完整的四层结构,并且层次分明比如 Farcaster, Cyberconnect 等,而 Lens 也关注了这四层,但是都杂糅到了一起。讲 Lens技术架构的文章很多,我之前有写过一篇,应该是比较深入的分析了下:[深度分析 Web3 社交项目 Lens protocol 后, 我有些想法 ],但是那篇文章是纯技术分析,并没能站在今天这个角度去分析 。

1、身份

对 Lens 来说,他有自己的 Identity, 那就是 Len protocol NFT, 这就做到链上身份的唯一性,和用户所有权。

2、社交关系

Lens 是以链上合约协议的方式管理用户的社交关系, 以 NFT 的方式上链, 一个用户铸造了的 follower nft, 那他就是我的粉丝,除非它销毁 nft,所以也做到了社交关系的所有权。

3、内容及内容关系

还是一样,Lens 将所有的内容都存到的 Matic 链上,有些是直接的文本,有些是 arweave 或 ipfs 的链接 url ,这里 lens 也做了很多妥协,内容的所有权,不一定每条数据用户都签名了。

4、应用

由于 Lens 将所有的用户数据都放到了一条 EVM 链上,虽然,这些链上数据都是可获得的,但没有哪个 app 能直接使用这些数据, 所以 lens 自己就搞了一些中心化服务器,规整、索引这些数据,然后以 api 的方式暴露出来,让开发者基于 api 去开发应用。

之前说过,应用层是非常灵活的,如果你觉得这个 api 太中心化了,你开发的应用完全可以自己从链上拉数据去做一个应用 server。

可以看到,Lens protocol 设计体系中,目前把身份、社交关系、内容都揉到了一条链上。

Lens 的优点和缺点都非常明显。优点:架构设计简单,协议通用,很容易理解。

缺点:

1、所有数据都在一个 EVM 链上, 上链成本高,将我设想的这四层架构前三层都放到了一个存储空间

2、EVM 链数据很难直接被访问,导致应用严重依赖 server

3、EVM 链并不擅长管理数据之间的关系,导致严重依赖应用去大量清洗处理数据

4、server 和 server 之间,并不能保证数据的一致,如果两个应用的 server 不一样,很容易出现应用显示的数据不一致的问题

5、server 获取数据的成本太高,最终导致只有少量 app server 可用,带来严重中心化服务节点问题

通过前面的分析过程,可以看出,社交协议的各个层级,对存储的去中心化程度是不一样,与之对应的最直接的影响就是需要付出的存储成本的显著差异。

目前 Lens 大量的数据存储到 Matic 网络,需要的成本非常高,这个也可以看我之前写的文章分析,Lens 很长时间没开放大规模的用户注册,是否也有数据上链成本的考虑。

未来 Lens 为了解决中心化服务节点问题,大概率会建议一个去中心化的 p2p 的数据层去管理用户产生的数据。另外为了降低数据上链成本,也会逐渐将用户数据逐渐从 Arweave+Matic 的存储架构转为存储到单独的 p2p 存储网络。目前单独建立自己的数据层的社交应用我知道的只有 Farcaster 和 Cyberconnect,简单画一下 Farcaster 的数据架构,就看能看出它跟 Lens 的明显区别了,对比下来,你觉得哪个更合理呢?

探讨什么是好的数据层

在这个架构中,如果我的理解正确,那么开发一个 web3 app 协议,身份系统已经很全了,那就是各个公链,以及基于这些公链的 NFT,DID 项目。

而数据层呢?

对解决数据归属权和可获得性这两单,单独 ETH 就能搞定,最多加个 Arweave,目前的 ETH/Layer2 + Arweave/Filecoin 两个系统,就能解决大部分 Dapp 的去中心化诉求,所以这是 Lens 能 run 起来的底层依赖,有这两个就够了。

然而,如果只是符合了前面我提到的两点,那肯定称不上一个好的数据层, 只能是最基础的存储网络,除此之外还需要关注:

1、与应用层交互的性能

2、动态数据的及时更新

3、数据的快速检索

Arweave 和 Filecoin 都缺少这些,少有项目直接用 Arweave 做数据层,包括 Lens 也需要将数据存储到 Arweave 后,再将 Arweave 的链接存到了 Matic,我理解 Lens 的数据层是 Matic 而不是 Arweave。因此,出现了专门去中心化数据层的项目,如 Ceramic,ComposeDB,OrbitDB,Farcaster data layer 等,他们都有共同的特点:

1、去中心化 p2p

2、结构化数据

3、动态数据,可实时更新

4、基于密码学的数据权限控制

5、p2p 节点能直接服务于应用 app

基于这些数据中间层去开发应用,看起来能得到一个更合理的架构:

账户体系在公链,数据单独管理:最底层去中心化的静态文件网络 + 中层的去中心化动态数据 + 上层应用自定义数据

一个完整的 dapp 应用架构(不仅仅是社交)应该是这样的:

1、身份体系,包括资产 token 在公链

2、数据层有一个独立的网络

3、可以有独立的静态文件网络

DB3 Network

db3network 是我们正在做的项目,专注于解决 dapp 应用的数据层问题。

前面提到过  Ceramic,OrbitDB,Farcaster 等都在解决数据层问题,想知道 DB3 network 跟他们的区别吗?欢迎关注我们

开源代码库:https://github.com/dbpunk-labs/db3

网站:https://db3.network

欢迎关注我个人的 Twitter:https://twitter.com/muran_eth


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

穆冉区块链
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开