什么是分布式文件系统
跨越多个服务器或者多个位置的文件系统。其中涉及的技术包括数据的复制、数据的分片和路由,由于用户可能存储大文件、图片或者其他类似的需求性文件,因此需要设计不同的系统方便用户访问的存取。
- 任何设备通过任何网络位置访问文件,就像访问到自己的文件一样。
- DFS可以方便的再网络上用户间共享文件。
- 根本的原因就是数据量太大和用户用户之间的物理隔离。
大文件管理系统
GFS
使用场景
- 追加写多,而不是随机写。
- 读写的是大文件。
- 一般是顺序读而不是随机读。
系统的构成
系统采用的是领导者和追随者架构,管理简单,但是主控服务器会成为系统的瓶颈。
- 类似于Linux文件系统或者windows文件系统,主控服务器维护着一个命名空间,命名空间由目录和文件构成,目录文件的基本存储单元是chunk,而chunk又由若干个block构成。