灾难恢复(DR)从广义上来说是经常被存储界讨论的一个话题,不过在这篇文章中,我打算探讨整个市场中的其中一个细分市场:针对大型归档的灾难恢复规划。
首先,我对归档的定义是什么?什么是大型归档?归档就是被保存信息的目录,只不过这些信息中的大部分信息的访问频率很低。
归档的定义近来有些变化。就在三四年前,归档的存储介质一直都还是磁带,只配有小型磁盘高速缓存(通常只占总容量的5%以下)。管理磁带和/或磁盘的软件被称为分级存储管理(HSM),而且这种软件是从35年前的大型机上发展而来的。
如今,我们的许多归档已经存储在磁盘上,而且我们在网络上备份数据。例如,我的工作用个人电脑和家用个人电脑都通过互联网进行备份,而基于云的归档如今也很常见。这当然会引发可靠性方面的质疑,不过这又是另一个话题了。
我对大型归档的定义很简单:任何超过2000个SATA磁盘驱动器的归档。现在,这个数量相当于4PB,随着磁盘容量的增长,明年可能将相当于8PB。考虑到2000个驱动器的预期故障率,我将2000个驱动器作为大型归档的大小标准。即使2400个驱动器的RAID-6设置上,鉴于为单个应用程序管理这么多驱动器所需要的重建时间,这也是一个难度很大的系统。
三种灾难类型
我们有三种灾难需要考虑:单个文件或几组文件的故障、元数据损坏以及我经常说的”喷洒器错误”。
计算机室的喷洒器坏掉可能会破坏所有的设备,而单个文件或一组文件的故障与之相比则是完全不同的问题。一个文件或几组文件的故障的发生概率更高,而且比起全面性的灾难(地震、飓风、闪电电击、供电功率骤增、喷洒器坏掉等)更加普遍。不过,当我设计系统架构的时候,我会保证数据随时至少有两个副本。在大型归档中,鉴于重新复制数据所需要的时间以及考虑到灾难发生后存储系统的数据完整性,两个副本可能还不够。
元数据损坏问题的发生概率不高,不过它确实可能发生,而且发生的概率比许多人想象的要高。元数据损坏可能是文件系统元数据的损坏,或者,如果有使用重复数据删除的话,数据块中某个块的损坏(如果没有得到很好的保护将是个灾难)。
当然,在设计数据保护水平的时候,成本是一个很大的因素。许多厂商宣称有99%、99.999%甚至99.999999%的可用性和可靠性。但是,当你需要保存PB级数据的时候,这种可靠性的概念需要重新考虑。
虚拟NAS设备
虚拟NAS设备是数据存储管理和整合的新解决方案,提供与虚拟文件服务器类似的好处,如熟悉的操作系统和文件系统,并且可以使用一个专门的NAS设备,通常该设备使用软件(而不是专门的设备)来模拟一个NAS。
虚拟NAS设备用更少的内存为更多用户服务,并且可以按需扩展,它还可以按需移动物理机,以便提供最佳的性能。
虚拟NAS设备的灵活性给企业带来了更多的存储选择,举一个案例,瑞士Nasuni公司使用固定大小的虚拟NAS保存活动数据作为缓存,自动将旧数据移动到云中,如果用户需要旧数据,只需要指定时间,从云中拖出数据即可。虚拟NAS网关是一个创造性的解决方案,使其更容易实现存储管理策略自动化。
无论是使用文件服务器还是虚拟NAS设备,在考虑存储整合时,虚拟化技术应该进入你的视野,只要和周密的存储策略和业务计划匹配,按需配置存储设备也是一种很好的数据存储管理选择。
本文作者Henry Newman是Instrumental Inc.的首席技术官。他是一位行业咨询师,在高性能计算和存储领域拥有28年的工作经验。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
作者
翻译
相关推荐
-
DR和业务连续性标准如何帮助实现合规性?
灾难恢复和业务连续性标准代表了计划必须符合的控制措施。只要这些计划在很大程度上符合标准——在组织的政策和规划结构中,合规就有可能。
-
聚焦云端IT弹性 Zerto布局中国市场
在IT弹性中有几大因素:专有云、托管云、公有云、混合云。云用户都需要知道如何保护、如何管理、如何迁移,以及在需要的时候如何恢复。那么,如何创建未来一代的IT弹性基础设施?
-
亚马逊AWS故障带来的灾难恢复启示
如果你的灾难恢复系统依赖于亚马逊AWS或其它云服务商,你需要确保有一个应对云服务故障的灾难恢复计划。
-
企业BC/DR勿忘IoT风险管理
万物互联背后所带来的安全性问题正在引起业务连续性和灾难恢复专家的关注,他们需要创建出新的风险评估机制,对潜在的业务影响加以分析。