[姚文辉课程笔记]大数据对分布式存储系统需求

【大数据对分布式存储系统需求】

关键网站:www.sortbenchmark.org。可以通过这个网站来查看性能。

【大数据对分布式存储系统需求】

(1)高容量:需要至少100PB
(2)高吞吐量:每小时1PB
(3)数据的高可靠性:数据不能丢失、错误
(4)数据的高可用:需要达到99.95%
(5)高效运维(自动化运维):业务种类多、硬件设备多、软件负责度高
(6)低成本:数据压缩、混合存储
要实现这6个方面,如果要满足上述要求,对大数据的要求比较大。
偶尔会发生硬件错误,导致系统重启或数据错误。
在大数据场景下,要正确处理这种小概率事件,并减少这种小概率事件的发生。使得大规模下的小概率事件成为常态。

0

Leave a Reply

Your email address will not be published.