PDFS分布式文件系统介绍

       

1. 传统文件系统的问题


       传统文件系统存在于单个计算机当中,要搜寻其他计算机的文件,必须先知道存有文件的计算机的域名或IP地址,这样会带来几个问题:
 
       a、连接问题:首先不能保证固定IP地址的机器在线,由于机器故障、不明攻击或网络原因导致机器离线的情况屡见不鲜;
       b、 效率问题:如果大家都去某网站下载热门文件,将导致中心化文件服务器传输通道拥塞,下载效率低下;
       c、 安全问题:分享文件时必须提供文件所在服务器的IP  或域名链接地址,如果分享地址泄露,实际上是为黑客提供了直接攻击的目标。
       d、 信任问题:一旦该机器被黑客劫持,可能你得到的文件内容已被篡改,继续使用后果不堪设想;

       

2. PDFS分布式文件系统


       PDFS(PeerSafe Distributed File System)基于P2P网络的分布式Hash块文件系统,能够连接所有计算机设备的相同文件系统。它从根本上改变了用户搜索的方式。通过PDFS,用户搜索的是内容的hash。当文件被添加到PDFS节点上,它得到一个新的名字。这个名字实际上是一个加密哈希,它是从文件内容中被计算出来。通过加密保证该哈希始终只表示该文件的内容。哪怕只在文件中修改一个比特的数据,哈希都会完全不同。可将文件分片存储到不同的节点上,文件被其他节点访问的越多,副本就越多。只要有部分节点在线就可提取文件。

       当你向PDFS分布式网络询问哈希的时候,它通过使用一个分布式哈希表,可以快速地找到拥有数据的节点,从而检索该数据,并使用哈希验证这是否是正确的数据。

       PDFS是通用的,并且存储限制很少。它服务的文件可大可小,对于一些大的文件,它会自动将其切割为一些小块,使PDFS节点不仅仅可以从一台服务器上下载文件,而且可以从数百台服务器上进行同步下载。PDFS网络是一个细粒度的、不可靠的、分布式的、易联合的内容分发网络(Content Delivery Network , CDN)。对于所有数据类型都是很有用的,包括图像、视频流、分布式数据库、操作系统、blockchains等。

       PDFS不需要每个节点存储所有发布到PDFS上的内容。相反,每个节点只存储自己想要的数据。如果每个节点托管一点数据,所有数据通过累积就提供了比任何集中式网络更多的空间、带宽和可用性。分布式网络将很快成为世界上最快、最可用、以及最大的数据存储。没有人有能力关闭所有的节点,所以数据永远不会丢失。

       

3. 应用


       PeerSafe公司采用PDFS分布式文件系统协议开发了安全可靠的文件分享工具沙盘,通过点对点通讯方式构建分布式文件系统网络,根据文件内容的哈希值进行寻址并提取文件,实现自由分享文件的同时保护文件内容不被篡改,解决了分布式网络安全高效存储的问题


没有登录不能评论