安全边缘/物联网计算用例的IPFS和EdgeFS比较

数据安全性是Edge / Fog计算增长的主要挑战。了解如何通过引入现代分布式数据层EdgeFS来克服问题。

由于减少了带宽消耗,提高了分析效率,改善了物理世界中事件的必要响应时间,不依赖于WAN(广域网),最大限度地延长了正常运行时间,因此我们一直在明确表示Edge / Fog计算转型。像有线电视那样可靠性较差的蜂窝电话,以及更高的安全性。

在安全性方面,好处来自于保护靠近数据源的资产,这些资产从未打算连接到更广泛的网络,更不用说互联网了。

然而,随着应用程序、数据、计算服务被推离中心位置,数据片段必须在越来越多的分布式网络中复制。考虑到这一点,数据安全性仍然是Edge / Fog计算增长的主要挑战。

为了应对这些挑战,我们需要概念上新的分布式数据分发和访问设计时考虑到Edge / Fog安全性的层。

让我们来比较两个可能适合从数据安全需求的开源分布式存储层设计:EdgeFS(http://edgefs.io,Apache许可证)和IPFS(星际文件系统  https://ipfs.io,MIT许可)。

当我们设计EdgeFS时,数据安全性是我们的首要任务。在EdgeFS中,一旦记录,任何给定块中的数据都不能追溯地改变,因为这会使类似区块链的n-ary树中先前块中的所有SHA-3哈希失效,并打破分散位置之间达成的共识。关于IPFS也是如此。

EdgeFS建立在体系结构之上,具有不可变的自我验证位置无关元数据,引用自我验证的与位置无关的有效负载。

虽然两个存储解决方案对有效负载块的处理非常相似,但是对象的命名和发现方式的差异几乎不同。IPFS主要用于对等分类账加密交易,而EdgeFS没有做出这样的设定,而是专注于许多本地或远程内容可寻址网络操作的extream高性能。

 

不可变的有效负载块

 

 

将数据块放置到IPFS的最终结果是使用强加密哈希来识别和验证它,并且可以使用加密哈希来查找要检索的块。这与EdgeFS非常相似,但存在一些差异:

IPFS接受块,然后生成其加密哈希。一个EdgeFS客户端(通过CCOW“cloud copy on write”网关库API),在请求存储块之前,对其进行哈希加密。这样可以避免传输重复的有效负载块,也称为去重,IPFS是一种分布式存储解决方案。EdgeFS将I / O请求路径到目标组,然后在组内进行快速协商,以查找并动态地将新块放在负载最少的目标上。这提高了容量平衡、存储设备的利用率,也称为动态数据放置。

 

EdgeFS FlexHash表是本地站点构造。它会自动发现并驻留在本地站点的服务器内存中。FlexHash负责I / O路径,并在动态负载平衡逻辑中发挥重要作用。基于发现的站点拓扑,它定义了所谓的协商目标组,这些目标组通常在8-24个分区存储设备之间形成,以确保正确的故障域分布。

元数据原理的差异

 

 

IPFS命名系统仍在开发中,示例表明IPFS使用了一种非常不同的方法来发布按名称访问的内容。

IPFS接受原子对象的加密哈希,并将这些引用嵌入到其他命名对象中,这些对象的基本功能是作为目录。

这些目录对象中的每一个也是不可变的,引用特定的冻结时内容。目录对象本身具有加密哈希,可以在更高层目录中引用。最后,发布一个“根”目录,然后通过一个可变名称指向目录对象映射。我怀疑这种设计受到为加密货币分类账算法提供高度安全的持久层的必要性的影响,其代价是通用存储灵活性和性能。

EdgeFS采用不同的方法,其目标是为版本化内容启用共享数据存储库,这些内容可由数千个租户批准的用户同时访问和更新,并支持跨站点一致性组。

 

在EdgeFS中,支持按名称或其他搜索条件查找存储对象的信息,总是作为独立于有效负载的元数据记录。它将存储的有效负载视为不透明的块,磁盘上的组织不需要在块本身内查找引用,从而允许客户端驱动的端对端加密。也就是说,它假定所有的有效负载都是加密的,并且从不尝试分析它。可变元数据信息始终存储在本地(本地站点群集),从而在不牺牲灵活性或性能的情况下启用始终本地、立即一致的I/O策略。

 

不可变版本元数据

 

 

根据定义,关于特定版本对象的大多数元数据必须是不可变的。某些元数据可以独立于版本内容,例如控制对象版本保留的元数据,本地站点复制覆盖,ACL等。

IPFS的优点之一是,当可变命名引用更改为指向新版本时,它不会更改目录对象的存储。这与EdgeFS处理可变命名引用的方式非常相似,在我看来,这远比创建显式版本化名称要好。在EdgeFS中,可变命名总是假定为本地的,并在远程站点到站点传输时“re-hydrated”。这使得跨地域的传输始终是保持不变的,因此可以实现全局复制,从而非常有效地避免不必要的网络传输,即通过WAN进行内联重复数据删除。

 

小结

 

 

现代元数据存储子系统还有许多其他功能,这些功能是IPFS似乎尚未解决的版本化内容存储所必需的:

快速查找属于任何给定文件夹/ directoryPredictable目录或bucket search timesTenant控件中的名称,该控件控制租户元数据驱动的对引用负载的保留的访问和修改。

虽然我承认IPFS的主要和最初目标不是为Edge / Fog计算用例提供服务,但其安全性和全局可扩展性优势确实符合要求。也许有一天它会满足其他需求。但为什么要等?EdgeFS现在已经可用,它满足Edge/Fog计算的最重要需求——数据安全性、成本降低和性能。

EdgeFS利用本地站点资源,并将它们呈现为高度可用的群集段,该群集段是地理位置分散的数据层的一部分。由于其不可变的数据结构设计,通过基于UDP的低延迟协议进行动态数据放置,内置多协议存储网关(S3,NoSQL DB,NFS,iSCSI等)以及高度可扩展的无共享架构,使本地站点的性能具有卓越的特点。支持为Edge / Fog计算时代设计的应用程序。

EdgeFS利用本地可用的站点资源,并将它们呈现为高度可用的群集段,该群集段是地理位置分散的数据层的一部分。由于其不可变的数据结构设计,通过基于UDP的低延迟协议进行动态数据放置,内置多协议存储网关(S3,NoSQL DB,NFS,iSCSI等)以及高度可扩展性,因此实现了出色的本地站点性能特性无共享架构,可以成为专为Edge / Fog计算时代设计的应用程序的真正推动者。

 

原文作者:Dmitry Yusupov(Nexenta Systems的CTO和创始人)

本文由IPFS中国社区编译

原文链接:https://hackernoon.com/comparison-of-ipfs-and-edgefs-for-secure-edgeiot-computing-use-cases-0dgu30zk

本文来源: 赢和财经 文章作者: 佚名
    下一篇