[姚文辉课程笔记]大规模分布式存储系统的挑战

【小概率事件】

(1)磁盘机器损坏:磁盘具有损坏率(5000中有每天5-6个),要对数据进行紧急复制
(2)Raid卡故障:Raid卡将数据写入磁盘
(3)网络故障:集群中的部分节点网络失联、网络丢包等
(4)电源故障:机器掉电,影响数据可靠性
(5)数据错误:数据在磁盘上可能会发生错误
(6)系统异常:多个节点时钟不一致、机器死机
(7)热点:计算热点过度抢占存储资源,热点机器需要做存储隔离,否则可能发生错误
(8)软件缺陷:用户经常重启、用户频繁切换文件、软件设计不合理、低效的用户程序

分布式存储系统应具备识别和检验数据有效性的能力,防止数据混乱。

0

Leave a Reply

Your email address will not be published.