浙江移动总结的集中式存储和分布式存储的对比(转自Joe)

liubill

<p><br></p><p>自2015年开始对国内几个大厂商的分布式存储产品进行功能及可靠性测试,2016年初开始在虚拟化资源池进行小范围部署,2017年扩大部署规模并接入重要业务系统,根据2018年的年中统计,目前分布式存储承载的核心系统包含中心化、CBOSS、CRM、统一开通等;非核心系统包含日志分析、数据稽核、统一认证和渠道管理系统等。</p><p><br></p><p>目前现网由H公司和T公司2个厂家的分布式存储产品提供服务。</p><p><br></p><p>[Joe]H是华为,T应该是天玑;搞了N年去IOE,底下怨气很大呀</p> <p>集中式存储由于写入环节较少,在写时延方面明显优于分布式存储。读时延方面集中式存储和分布式存储均相对较低,但通过对比发现集中式存储通过专用设备优化,在读时延上依然有一定的优势。</p><p><br></p><p>[Joe]性能上,IO响应延迟还是集中式存储更优,所以最核心的那些业务,计费账务CRM等,分布式目前还是不适合;所以我一直说,最核心还是要上全闪,剩下的就是分布式,两级分化</p> <p>由于集群节点数量并不能真正线性扩展,因此资源池的性能也就有了上限。比如常见的40个节点分布式存储集群性能可到50万IOPS、5 ms左右时延,高端配制可超过80万IOPS,2 ms左右时延。目前相同容量的主流高配集中式存储性能接近200 万IOPS、1.3 ms左右时延。分布式存储相比集中式存储还是有一定差距的。此外,由于分布式存储的三副本特性,一份数据需要写入3份,额外占用IO资源,因此对于写密集型应用,分布式存储在性能上不如集中式存储。</p><p><br></p><p>[Joe]估计和用的厂商产品有关,浙江移动认为一个群集也就20~40个节点,节点数再增加性能就不会线性了(其实我们的ScaleIO线性扩展性很好的),所以在绝对性能上,仍然是集中式胜出</p> <p>结论:</p><p><br></p><p>由于现阶段集中式存储在时延、稳定性和软件成熟度方面有明显优势,因此较适合应用于有数据强一致性要求、高IOPS、低时延的OLTP类交易业务场景;而分布式存储适用于海量数据、大数据块、顺序读写、时延不敏感的场景。</p><p><br></p><p>本文建议国内运营商在现阶段扩大分布式存储使用范围,但短期内不宜完全舍弃集中式存储,尤其对于技术研发力量较弱的单位,应当根据应用场景合理规划存储类型,确保生产系统稳定运行。同时在分布式存储的日常运维过程中要加强架构管控,确保分布式存储单节点以及集群整体的性能,加强兼容性评估测试,定期升级软件版本,加紧核心技术课题攻关,培养出新一代的能创新、善思考的技术团队,加强核心能力内化,为运营商后续业务快速迭代创新奠定扎实的IT基础。</p><p><br></p><p>[Joe]... 但短期内不宜完全舍弃集中式存储 ...</p>