开源分布式数据库,就是在这样的背景下,成为全面云化时代匹配企业数字化转型的最佳选择。数据显示,到2021年传统商业数据库市场会下降20%至30%,而与此相应的则是云数据库的迅猛增长,按照Gartner预测,到2023年全球3/4的数据库都会跑在云上。
其中,Greenplum就是近年来涌现出来的优秀开源分布式数据库的“代表”,凭借其超强的数据存储、处理和实时分析能力,Greenplum今天已被广泛应用于数据仓库和大规模数据处理领域。2019年Gartner报告显示,Greenplum在经典数据分析领域全球排名第三,实时分析领域全球排名并列第四,Greenplum也是两个领域中排名前十的产品中的唯一一款开源产品。
但Greenplum过去主要基于传统的物理机部署,在数据库“云化”的大潮中也面临着很大的挑战,因为与在裸金属上运行的传统物理机管理相比,在虚拟机以及多云或者混合云环境中运行的Greenplum无论是性能的损耗,以及可管理性都遭遇着很多难题。
VCF on VxRail的出现提供了解决这一难题的“答案”——它不仅能够为企业私有云和公有云提供灵活、始终如一、安全的基础架构,同时也可以为在虚拟化以及多云环境中运行包括Greenplum这样的数据库应用提供统一的管理平台,是企业构建云数据仓库乃至大规模数据处理的理想平台选择。
从这个角度来说,超级云数据库,也必有超级云平台,特别是企业上云仍然是大势所趋,而云数据库作为上云过程中最为核心的业务迁移项目,选择戴尔科技云平台VCF on VxRail,相信能够让企业云化转型“事半功倍”。
GreenPlum数据库云化的挑战
众所周知,Greenplum是基于PostgreSQL的分布式数据库。
它具备以下特点:
1、支持MPP架构,Greenplum采用MPP架构,具备线性扩展存储能力及分布式任务处理能力,支持数据的大规模并行计算;
2、Greenplum支持主节点与计算节点增加冗余备份,节点宕机时可自动快速切换,能够降低整体数据仓库服务宕机风险确保数据不丢失。
此外,Greenplum支持多种数据存储方式,包括支持行存储及列存储的数据存储方式以及外部表存储,满足不同场景下的数据存储需求,且高度兼容PostgreSQL语法,提供可视化的管理控制台,企业也可以方便通过Greenplum快捷管理监控数据仓库,降低入门成本。因此,Greenplum自推出之后,在数据仓库领域具备了极大的优势,并在全球范围内拥有良好的口碑。
不过,也要看到类似GreenPlum这样的MPP数据库,过去几年也正面临着全新的挑战,那就是在虚拟机上运行时往往会使得IOPS的性能损耗,已成为一个不争的事实。同时,跨云平台一致性的管理也是GreenPlum的一大难题,这也导致了很多企业级客户目前关键业务的数据库仍然还运行在传统的物理机上。
全部评论:0