分布式存储概述

分布式存储是相对于单机存储而言,之所以要分布自然是为互联网时代信息数量异常爆炸,单机已经难以满足大型应用的多寡存储需求。

存储系统的关注点

关于存储系统,一般我们关注下几乎独面:

  1. 数据分布与负载均衡
  2. 多少存储的可靠性与一致性
  3. 数量看性能
  4. 网容错能力
  5. 系统扩展能力

当单机存储系统被发出雷同栽独立磁盘冗余阵列(RAID,redundant array of
independent disks)技术,
凡把同的数额存储在差不多只硬盘不同地方的方式。通过把数据在多个硬盘上,输入输出操作会坐平衡的办法交叠,改良性能。
是技能为主化解了俺们地方提到的前方三碰,数据足以经过磁盘阵列控制次都匀分布在多独硬盘上,
因为实现负载均衡,并通过冗余来维系可靠性。类似单机挂载多磁盘,数据以磁盘阵列上之冗余副本要保持一致也爱。
储存系统的看性能基本受制于磁盘的习性,通过分散到多磁盘确实达到了提升性的功用。

诚然的问题困难在后少碰:
磁盘阵列解决了单一磁盘的脆弱性,但连无可知升官存储子系统一体化的可用性,或者说容错能力。
同理扩展能力同样受制于磁盘阵列的情理扩展槽的限。

分布式存储的概念及分类

从而分布式存储应运而生,作为存储系统它一样要面对上述问题。
优先来拘禁下她的定义:
分布式存储系统是大方常备 PC
服务器通过网络互联,对外作一个一体化提供仓储服务。

打点的概念看,更多时候我们把分布式存储作为同样种植服务面向各种不同的数目存储需求。

从今数据存储模型上,我们可以进一步分类分布式存储服务呢:

  1. 文件模型: 对许分布式文件系统,如:GFS、HDFS
  2. 涉模型: 对承诺分布式数据库系统,如:Google Spanner、Taobao
    OceanBase
  3. 键值模型: 很多 NoSQL 系统利用,如:Redis

分布式存储的得与失去

当单机存储系统面对有限单难题,分布式存储系统通过集群方式壮大及几百竟然几千华集群规模来缓解系统扩展能力,
经过软件层面对单机服务器的硬件容错能力大大提升了总体集群的容错能力。

在取得这些好处时,自然吧兼具牺牲,所谓有得一定来失去。
说到囤不得不提单机数据库存储的事体特性:A(原子性)C(一致性)I(隔离性)D(持久性),
一旦扩展及分布式存储后,受限于分布式
C(一致性)A(可用性)P(分区容忍性)理论,几乎无可能满足整得事务特性。
各种分布式存储服务实现还对单机存储的作业特性作了衡量取舍,满足特定的劳动场面需求。

除此以外分布式存储系统是冲网络互联的,所以除了主导得磁盘访问性能开销,还差不多矣网性开销。
平凡一般机械硬盘得平均寻道时间啊 10ms,而机房内网得网络访问开销一般小于
0.5 ms,相对性能损失比小。
而原本由磁阵控制程序负担得多少以磁盘中的布、负载均衡策略与一致性保障,
每当分布式存储着还需软件以整机器集群层面去考虑,复杂度大大提高。

总结

多年来打算对后端分布式架构设计领域知识做一个梳,形成一个全面的知识系统,本文算一个始发吧。
方对分布式存储服务进行了完全概括,了解了分布式存储服务的归类及其架构设计的关注点。
继承将越开展,深入到现实项目的分布式存储服务架构设计要点和实现细节。

参考

[1] 杨传辉.
科普分布式存储系统.
机械工业出版社(2013-09), pp. 7-52


下是自己要好开始之一个微信公众号
[瞬息之间],除了写技术的文章、还有产品之、行业与人生之思索,希望能够跟更多倒以及时长长的路上同行者交流,有趣味而关注一下,谢谢。
NoSQL 1

版权声明:本文为博主原创文章,未经博主允许不得转载。

 

网站地图xml地图