元宇宙时代爆发时,对现在的存储和传输会有什么样的挑战?
原文标题:《A&T 前瞻:为什么 Web 3 驱动的分布式存储是元宇宙时代的基础设施?》
撰文: Rosie,A&T Capital 投资人
在上一篇《Web3 驱动的分布式计算网络如何成为元宇宙重要基建?》里,我们通过收集市场数据和设立假设,论证了为什么 Web3 驱动的分布式计算是元宇宙时代的基建。在本篇文章里,我们将一起探索在元宇宙时代爆发时,对现在的存储和传输会有什么样的挑战,以及 Web3 驱动的存储和传输为什么能支撑元宇宙时代的数据量,成为元宇宙时代的基础设施。
数据存储,按照存储时长分为两类:
不管是什么数据类型(音频、图像、视频等),存在存储介质里的都是一串 0 和 1 的数字。在上一篇文章里提到,元宇宙里的沉浸感是由每一帧高清且渲染好的图片通过一个类人眼的显示屏幕展示出来的。在元宇宙里,两个最多的数据类型是音频流和视频流。
不管是视频流还是音频流,可以分为两大类型:
这些被实时处理后传输回来的音频和视频数据可以与本地数据进行叠加,给用户创造最贴近「以假乱真」的沉浸感。
如上图所示,在服务全球用户的时候,同一份数据会被复制到不同的地域的云服务器上,方便就近用户调取文档。虽然云服务看似已经有了巨头公司(e.g. AWS、Azure),但这些云厂商在不同地区的渗透率其实差别很大。例如,AWS 在中国的业务渗透率就没有阿里云、腾讯云高。因此,应用在开发时会有以下几个痛点(假设架构已经是基于云服务,如果不是,则会有更多的痛点):
这一 现象给应用开发者带来的难题是,为了更好的服务在不同地区的用户,他们需要将自己的自己的应用需要 存储的数据放在当地的云服务厂商的数据中心里,也就是说,他们需要使用多云的存储架构来支持服务全球用户调取数据的需求。
但是,使用多云开发策略是一件复杂且运维起来十分耗时耗人力的事。 每家云厂商提供的 SDK 都不一样,导致即使使用不同云厂商提供的相同的云服务(例如存储),也会需要通过理解如何使用 SDK,如何配置云服务,如何部署等等进行单个云的操作。 这样导致使用云的门槛和需要维护系统的人力都需要比使用单云策略更复杂、更高。
在上篇《Web3 驱动的分布式计算网络如何成为元宇宙重要基建?》文章里有介绍到,想要达到类人眼的的体验,需要向用户输出 13k 的图片(具体计算请见《Web3 驱动的分布式计算网络如何成为元宇宙重要基建?》。每个像素可以通过 RGB(Red、Green、Blue)三个颜色的「深浅程度」(0-255 的数值)表示,而每个像素值又占用一个字节(1 byte,8 bits)。
因此,可以得出一张 13k 清晰度的图片需要:
13,000 * 13,000 * 3 = 507,000,000 字节(B)
换算成 MB:
507,000,000 / 1,024,000 = ~495MB
一张压缩后的照片大概能减小~80% 的存储需求,那么存储一张压缩后的 13k 清晰度图片需要占用硬件存储:
495MB * 20% = 99MB
一台自带存储硬件 256GB 的 AR/MR/VR/XR 设备只能在本地存储:
256GB * 1000 / 99MB = ~2600 张 13k 高清图片
一个应用里,尤其是中大型应用,在本地起码需要存储个上万帧图片(也就是视频)。在端边设备里可以放置用于存储的硬件是无法随着应用的图像和音频质量的提升而无限增长的,原因在于:
因此,光是存一个应用所需的视频即将用满存储,更不用提多个应用需要的常用音频和视频流所需的存储空间。在可预见未来的元宇宙大规模使用后,现在已有的存储架构方式将不足以支撑未来发展需要的数据存储和使用。
分布式数据存储网络将会存储三种不同类型的数据:
在元宇宙里,一些经常需要被调用的视频和音频数据会存储在分布式的数据缓存内容分发网络里,而不常被调用的视频和音频数据则会存储在非结构化数据库里。
每当数据调取的频率发生变化时,分布式的数据缓存内容分发网络里的内容则会随着调用频率而进行更新。
上图展示了一个作者设想的分布式数据存储网络的架构:
如何解决元宇宙里数据隐私、完整性、以及存储调用效率问题?
Tokenomics 用于基础设施网络有两个好处:
笔者认为,在可预见未来内可以看到 web3 驱动的分布式节点 CDN 更大规模的应用、分布式数据库的小规模应用,以及针对非结构化数据存储的优化及潜在小规模应用。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。