国产数据库异军突起,矩阵起源发布MatrixOne更新版本

当前,全球范围内创新型数据库技术产品不断涌现,市场格局剧烈变革,数据库产业迎来快速爆发期。IDC发布的数据显示,2022年全球数据库市场规模有望突破400亿美元。另据中国信通院测算,预计到2025年,中国数据库市场总规模将达到688亿元,市场年复合增长率为23.4%。

在数据库市场越来越激烈的同质化竞争中,企业怎样才能脱颖而出?矩阵起源(MatrixOrigin)创始人王龙表示,要想真正兑现市场潜力,企业的技术实力是决定性因素:“市场有多大,取决于我们在满足这么大的市场需求的过程中,到底能够做到多好。 ”

运行速度比同类产品快50%以上

2022年2月,矩阵起源刚刚发布了新一代超融合异构数据库产品MatrixOne的0.2版本,面向公众交出了自己的答卷。王龙的底气从何而来?外界或可从这款产品的表现中一探究竟。

品牌官网发布的MatrixOne 0.2.0版本的性能测试报告显示,根据在SSB测试集的测试结果,MatrixOne的性能在同等只PK计算引擎的能力维度下,表现已优于ClickHouse。此次测试环境由3台16核32G内存的云主机搭建。在去除过滤、分区的前提下,只比较计算能力,在单表和多表测试查询中,MatrixOne在每个查询上的运行速度均快于Clickhouse,平均快50%以上。

切实有效的创新点之一,就是在计算引擎早期架构中即创新采用因子化拆解的工程实现提供自动化的计算下推,在多表复杂Join、分组聚合等核心算子实现上达到理论最优,在非主键join场景下超过其他所有的MPP数据库计算引擎。在性能提升的同时,也从架构上简化了查询优化器的相关设计,在任意多表join上可以做到最坏情况下的理论最优解,避免了传统优化器陷入局部次优解的局面。

另外一点是成功在向量化计算引擎内实现了高性能Hash表。为了避免Golang语言实现引起的开销,Hash表在关键语句上引入了汇编来加速,并做到了并行无锁执行,连同因子化加速技术一道确保了计算引擎在多核的伸缩性上领先同类。

从以上测试结果和计算加速方案来看,作为一款从零开始自主打造的国产数据库,MatrixOne刚建设8个月就具备了和其他产品PK性能的积累,进化速度着实令人惊叹。

更简单、更灵活,持续打破数据边界

目前,国际国内市场上数据库种类繁多,企业或用户想要为自己的应用系统和数据智能平台选择数据库,光选型、测试就要花很多时间和人力;之后还要针对每个数据库系统做开发、部署、运维;如果有新的需求变化或者是业务变化时,这个流程又得走一遍。这些涉及的软硬件投入和人力投入都是巨大的,并且在大多数情况下是可以优化和避免的。

简单地说,MatrixOne的目标就是把用户选用数据智能系统的门槛降下来。MatrixOne将会包含支持分析、事务和流计算负载的能力,来满足大部分应用场景的需求。这样的多功能数据库,第一可以在选型时治好用户的选择困难症,并大大降低企业的运维和运营成本;第二,在遇到变化时,也能够通过灵活‘变形’来最大可能的满足用户的需求,从而帮助企业提高业务敏捷性。

王龙表示:“在0.2的版本里,我们做到了数据实时插入可见且确保一致的情况下,也能够满足高性能的数据分析需求。当然,当更多这种看似矛盾的能力加进来的时候,工作的复杂度也会几何级数地增加,但是我们也有信心。把复杂留给自己,把简单和灵活留给用户,这就是我们想要提供的价值。”

MatrixOne作为基础软件,从开始走的就是开源路线。通过一套简单、松耦合的架构设计,以及大量示范和文档,矩阵起源希望能够打造一个具备极致创新空间的开源社区。目前,有不少爱好者加入了MatrixOne开源社区,一起参与讨论和贡献代码。接下来,MatrixOne的前进道路还任重道远,但其在SSB测试集和NYC Taxi测试集的亮眼性能表现,已令人对MatrixOne的未来充满期待。

(0)
上一篇 2022年3月11日 10:12
下一篇 2022年3月11日 10:30