如何为企业选择最合适的企业数据存储解决方案?
by Canonical on 23 October 2024
围绕 IT 基础架构所做的选择对业务成本和性能都有很大的影响,其中涉及到运营、财务、数据分析和市场营销等多个领域。鉴于数据在所有这些领域中的重要性,甚至是在整个企业中的重要性,在选择新的存储系统时做出正确的决定至关重要。本篇文章将介绍选择时的一些考虑因素,以确保您在成本效益和性能之间取得平衡。
一、性能
存储性能涉及多个维度,首先来考虑最简单的度量指标:
IOPs(Input/Output operations per Second)– 每秒输入/输出操作数,即一秒钟内可处理的操作次数。
响应时间(Response time)– IO 操作处理后安全存储到存储系统中并向请求应用程序发送确认信息所耗用的时间。
带宽(Bandwidth)– 一秒钟内可以传输的数据量的度量方式。
如果考虑每次 IO 操作的大小,情况会变得更加复杂。每次 IO 操作的大小对所用总带宽会有影响。传输 4KB 的数据比传输 1MB 数据所需的时间更少,因此会影响 IO 请求的响应时间。
我们来看两个例子:
1. 数据库
数据库通常使用较小的 IO 大小,每次操作通常只更新一个数据库表,因此所用的总带宽将会很低。但是,响应时间对于该用例而言至关重要,因为数据库接收到数据已安全写入的确认信息越快,处理下一个事务的速度就越迅速。
2. 流媒体
编辑多个 4k 视频流时,视频编辑应用程序需要访问所有这些数据,因此相较于每次 IO 操作请求的响应时间,更加重要的是利用存储系统的所有可用带宽,尽可能快地传输整个视频文件。
二、可扩展性
所有企业组织在其存续期间的某个时刻都会面临数据增长的情况。全球每天产生数 EB 的新数据,虽然很少有企业组织必须要处理如此规模的数据,但他们的存储系统也应该是可扩展的,避免现有的工作负载出现中断。
在某些系统中,通过不断地添加磁盘机架(纵向扩展)可以实现,这样虽然可以扩增容量,但并不会提升系统控制器的性能。在更加新式的横向扩展存储系统中,扩增容量的同时也能提升计算能力,因此同时实现更大容量与更好性能。
三、可靠性
存储系统的主要目的是安全存储数据。如果应用程序不能一致地检索数据,存储系统则几乎无用。为了保护数据,新式存储系统采用镜像、奇偶校验或纠删码等技术来确保磁盘或 SSD 的丢失不会导致数据丢失。存储系统还具有多个控制器和多个客户端连接,以此确保在任何这些组件出现故障时都具有高可用性。横向扩展存储系统具有更高的可靠性,因为组成集群的软件组件分布于多个节点,这使得集群能够经受多次硬件故障。
四、灵活性
存储系统必须能够容纳许多不同的工作负载,且每个工作负载都有各自的要求。有些可能要求高性能,有些可能要求存档,但无论什么要求,在这些不同类别的存储池之间进行迁移数据的功能都很重要,因为这样可以为其他应用程序释放宝贵的快速存储空间。
容量扩增和消耗方面,能够以牺牲一定性能的方式从小型存储系统扩展到大型存储系统非常重要。迁移数据一直都充满挑战,并且可能导致应用程序运行中断,只是迁移到更大容量的存储系统应该成为“过去式”!
当企业组织不再需要用到存储系统的全部可用容量时,能够缩小集群规模也很重要。这就是横向扩展系统比专有纵向扩展系统更具优势的地方,因为它们是基于通用硬件构建而成,这些硬件可以根据需要重复用于其他应用程序。
五、功能集
在比较多个解决方案时,聚焦于对您来说重要的功能是很重要的。您需要使用哪些协议(块、文件或对象),系统是否支持所有这些协议?您是否需要快照、克隆等本地复制功能?如果需要,系统可以创建和管理多少此类复制数据?您是否会需要远程复制,或者静态数据加密或对象版本控制等合规性功能?
与企业组织中的应用程序所有者进行合作,有助于明确真正重要的功能,而不是根据供应商有时共享的“英雄存储数字”或极限值来选择解决方案。
六、成本效益
在以上各个领域中,做出的决策有可能导致存储系统成本增加,因此用例的需求与系统的功能相匹配显得至关重要。例如,我们可以构建一个全部采用闪存盘的存储系统,但是对于不经常访问的存档类存储来说,有必要这样做吗?同样地,在考虑可用功能时,您是否需要远程复制,该功能是否需要额外的许可费用?
实事求是地说,了解您不需要的东西和了解您确实需要的东西一样重要!
七、企业存储的开源选择
要想在性能、可扩展性、灵活性和成本等所有需求方面取得平衡,可能需要做出妥协,并深入了解自己想要在这些方面取得的效果。
专有存储阵列通常需要为支持服务和未来升级预先支付大量费用,并且在某些情况下,升级困难且耗时,特别是必须从较小系统迁出以便进一步扩展的情况下。 公共云解决方案初期既便宜又灵活,但在您存储了大量数据之后,它就不再是最经济有效的方法了(如果您有兴趣了解更多详情,请点击此处阅读我们该主题的相关白皮书!)。
Ceph 等开源存储系统已可用于企业部署,并且可以为本文中描述的所有需求提供具有经济效益的解决方案。Canonical Ceph 是一个适用于所有规模和所有工作负载的存储解决方案,从边缘到大规模企业级部署,以及所有协议(块、文件和对象)均可适用。
具有不同性能、容量和协议需求的各种用例都可以通过单个横向扩展集群进行管理。Ceph 能够利用商用硬件横向扩展,这意味着扩展为增量模式,并且可以根据性能或容量需求进行调整。
了解更多
下载我们的白皮书 – 面向企业的软件定义存储,了解以下信息:
- 企业在扩展存储系统时面临的预算挑战
- 开源式软件定义存储如何为基于遗留设备的存储系统提供可行的替代方案
- 如何使用 Ceph 来确保:
- 可靠性
- 可扩展性
- 灵活性
- 如何在扩展规模的同时保持成本效益
- 如何通过整合到单个多协议存储集群中的方式来减少数据孤岛
- 如何通过本地和远程数据复制为灾难情况做准备
- 托管服务如何在降低成本的同时提供“体验即服务”
更多资源
订阅博客文章
查看更多内容
安全数据存储对于推动 AI 人工智能的关键性
立即报名 八月十四日下午2:00 网路研讨会直播 -使用 Ceph 的 AI 存储 没有数据就没有 AI 人工智能是近年来最激动人心的一场科技革命。Nvidia、Intel、AMD 和其他公司继续生产速度越来越快的 GPU,进而支持更大的模型和决策过程中更高的吞吐量。 除了当下对人工智能的大量宣传之外,还有一点仍被人们所忽略:AI 需要数据。 首先,存储系统需要对不断增长的数据集的高性能进行访问,但更重要的是,它们需要确保这些数据得到安全存储,以供当下以及未来之用。在典型的 AI 系统中,用到了多种不同类型的数据: 所有这些数据的收集、处理和输出都要耗费时间和计算能力,因此需要对数据进行保护。在某些情况下,诸如自动驾驶汽车的遥测数据之类的数据可能永远无法复制。即使在训练数 […]
CentOS EOL — 其对于Ceph存储而言意味着什么?
柳暗花明又一径 2020 年,CentOS Project 曾宣布他们将只专注于 CentOS Stream,这意味着 CentOS 7 将是最后一个与 Red Hat Enterprise Linux 通用的版本。CentOS 7 的生命周期结束(EOL)日期为 2024 年 6 月 30 日,此后将不再针对该操作系统发布安全更新、补丁或新功能。 如果用户在该版本 CentOS 上部署了 Ceph,他们在未来将面临挑战。解决上述生命周期结束挑战的方法有很多种,但每种方法都有细微差别: 风险 如果用户什么都不做,其逐渐老化的部署最终将没有受支持的路径来升级到未来的 Ceph 版本,从而使他们在新功能和功能性方面处于落后地位。更糟糕的是,没有针对关键安全漏洞的安全补丁可供该 […]
Ubuntu Linux 为什么成为金融服务领域取代 CentOS 的首选?
金融服务由技术驱动。而客户体验越来越多地由数据驱动,通过定制产品和服务可以体现出个人行为和偏好。所有这一切都建立在安全稳定的技术基础之上,只有这样的基础才可以提供敏捷性和灵活性,以适应客户需求的同时保持合规性。 使用 CentOS 作为创新基础的金融服务机构见证了 CentOS 8 于 2021 年退出,随后是 CentOS 7 于 2024 年 6 月退出。不过,最近的一项研究显示,各行业近四分之一的企业组织仍在使用 CentOS。 听起来是不是很耳熟?众所周知,金融机构在进行重大技术变革时是最谨慎的。考虑到金融业务的敏感性,这也就可以理解了。事实上,尽管过渡到云已成为一种成熟的方案,但仍有 60% 的金融机构表示,他们采用的传统技术堆栈成本过高且存在不足。与所有传 […]