根据在这个行业的经验,简单写一下我对这个问题的看法,不一定准确,欢迎大家拍砖!

从概念上来说,传统存储指的是硬件厂商的SAN或NAS存储,由双控制器或多控制器带着若干磁盘组对外提供块、文件服务;分布式存储指的是通过分布式存储软件将若干X86服务器的内置硬盘组合成一个大的存储空间,对外提供块、文件、对象存储服务,它们之间的对比可以从以下几个方面来展开:

  1. 从性能上来讲,存储性能主要体现在几个参数,IOPS、吞吐、时延,分布式存储是横向扩展的,随着服务器台数增长,性能和容量可以线性增长,这里如果台数足够的话,可以堆出远远超出传统存储的IOPS和吞吐,但是通常时延相对传统存储比较高,这个和分布式存储的写入原理有很大关系,即使有些厂家优化的比较好,但是无法从根本上解决(当然有公有云厂商,通过IB网络+RDMA网卡+内存缓存方式性能相当好看这种除外,通过高容量UPS即使机房断电也能保证内存中缓存数据写入到持久化硬盘中);而传统存储的性能跟出厂时的控制器配置关系很大,出厂后很难做出比较大的改善,但是传统存储可以采用高性能的Nvme SSD全闪存储,堆出很高的性能,IOPS、吞吐、时延都可以达到很好的数值。
  2. 从稳定性上来讲,传统存储技术已经在企业生产环境当中检验了几十年,相对比较稳定,而分布式存储软件虽然从原理上来讲是比较可靠,但是万一有bug,可能会导致整个存储集群crash,数据丢失;
  3. 从数据可靠性来讲,传统存储靠RAID保护,而分布式存储靠副本保护,RAID保护的故障域相对有限,比如RAID5,有可能坏掉2块盘,或者2盘柜就会导致数据丢失,而分布式存储的3副本,可以允许坏掉2块盘或2节点。另外从恢复的角度来看,传统RAID恢复较慢,而且不能控制恢复过程,恢复过程中业务影响大;而分布式存储恢复相对较快,有些可以控制快速恢复和慢速恢复,慢速恢复时对业务影响不大。
  4. 从扩展性来讲,分布式存储原理是横向扩展,可扩展至EB级,而传统存储受限于存储控制器性能,一般最多只能到PB级
  5. 从可管理性来讲,传统存储硬件是黑盒子,客户对于其内部了解程度不高,通常由厂家来维护,而分布式存储是由标准的服务器节点构成,而且管理UI相对简单易用,可管理性强;另外传统存储一旦过了服役周期,上面的数据迁移到新存储通常影响业务风险较高,而分布式存储替换相对较为简单。
  6. 从使用场景来讲,传统SAN存储更适用于金融、医疗、企业当中数据库类的业务,对于存储稳定性要求高,且容量要求不高的场景;而分布式存储则适用于存放非结构化数据,存储容量需求大的场景。分布式存储可以在一个UI中统一管理块、文件、对象存储,适用场景更多,企业可以利用分布式存储构建一个统一存储,而传统存储则只能分别提供。
Logo

为所有Web3兴趣爱好者提供学习成长、分享交流、生态实践、资源工具等服务,作为Anome Land原住民可不断优先享受各种福利,共同打造全球最大的Web3 UGC游戏平台。

更多推荐