襄阳门户网

搜索
襄阳门户网 襄阳门户 企业宣传 查看内容

明白:OceanBase 数据库产品简介2023/7/12 17:34:57

2023-7-12 17:34| 发布者: 天若有情| 查看: 86| 评论: 0

摘要:   1. 发展历程及产品简介  OceanBase 的产品是蚂蚁集团完全从 0 开始研发,数千万行代码中的每一行都是OceanBase 研发人员自主开发的,包括 SQL 引擎和存储引擎,完全没有涉及任何开源数据库产品(MySQL、Postgr ...
网站出售

  1. 发展历程及产品简介

  OceanBase 的产品是蚂蚁集团完全从 0 开始研发,数千万行代码中的每一行都是OceanBase 研发人员自主开发的,包括 SQL 引擎和存储引擎,完全没有涉及任何开源数据库产品(MySQL、PostgreSQL 等)。因此,ceanBase 拥有 100%自主知识产权,不受开源数据库协议的影响。这一点很重要,100%自主知识产权意味着当数据库出现问题的时候,OceanBase 的工程师不需要求助开源社区,OceanBase 自己就可以兜底,这对于要求稳定、要求可靠、要求有可预期性的核心业务系统是一个刚需。数据库灾备方案https://www.oceanbase.com/solution/disaster-recoveryoceanbase,完全自主研发的原生分布式数据库,连续年稳定支撑双,创新推出“三地五中心”城市级容灾新标准,一套引擎同时支持tp和ap的混合负载,具备数据强一致,高扩展,高可用,高性价比,高度兼容oracle/mysql等特性,已助力+行业客户实现关键业务系统升级。

  数据库在任何企业都是至关重要的基础设施,本着对客户负责的态度,OceanBase 在阿里内部经过了 10 年的孕育和发展后再逐步推广到外部市场。项目是 2010 年开始启动的,项目负责人是阳振坤老师,阳老师之前在北京大学、百度、微软等公司工作,一直从事分布式系统相关研究工作。最开始这个产品只是一个分布式存储的项目,通过 API 形式给应用访问。第一个业务是淘宝的收藏夹,现在也依然是 OceanBase 的客户,这个业务是单表非常大的业务。2013 年,为了让 OceanBase 变成一个通用的关系型数据库,OceanBase 开始做 SQL。第一个业务是阿里妈妈,是一个报表或者批处理的业务,今天也依然跑在 OceanBase 上面.2014 年,OceanBase 进入蚂蚁金服,开始进入金融级的场景,第一个用户是网商银行,网商银行是纯电子化的银行,从最开始,所有核心交易都运行在 OceanBase 上。这一年的双十一,OceanBase 也正式的接入了支付宝的部分流量。

  2016 年,OceanBase 正式发布了 1.X 版本,增强了分布式事务等能力,支付宝 100%流量也都运行在 OceanBase 上了,包括交易、支付、会员、积分等核心模块。这么多年来,经过了多次“双十一”峰值流量的考验。

  2017 年,开始应用到外部客户,成功应用到南京银行。

  2019 年,OceanBase 正式发布 2.X 版本,2.0 版本相比 1.0 版本,有很多的改进,从以前只兼容 MySQL 到同时兼容了 ORACLE,OceanBase 可以实现在一个集群内同时跑两种模式的数据库。另外,OceanBase 提升了 HTAP 能力,一套数据库同时支持 OLTP 和 OLAP 的业务。2020 年,OceanBase 成立独立公司,开展独立商业化运营,第二次参加 TPC-C 认证,再次打破之前的记录。因此,OceanBase 是经过充分验证的,十年打磨,厚积薄发。

  OceanBase 能够在阿里及蚂蚁内部有着如此广泛的应用,主要因为产品的 6 个核心特性,高可靠、高性能、高可用、高兼容、高透明和多租户 6 个核心特性。高可用和高扩展性之前(分布式数据库与集中式数据库的差异)已经做了介绍,不再赘述,简单介绍下其他特性。 1:高性能:OceanBase 采用了很多先进的技术来提高数据库的性能。比如 LSM Tree、无锁结构、消除磁盘的随机写等等,这些技术帮助我们充分使用硬件的能力,再辅以高扩展性,OceanBase 就可以提供一个世界级性能的 OceanBase 集群。在实际的生产系统里,OceanBase 可以在峰值的时候提供 6100 万次每秒,单表最大容量可以到 3200 亿行。和高性能伴随的是低成本,因为 OceanBase 采用了 LSM Tree 结构,所以当数据落盘的时候是更 有组织的,有更高的压缩比,可以有效减少磁盘空间。 2:高透明:OceanBase 支持很多创新的技术,比如全局一致性快照、全局索引、自动事务两阶段提交。使用 OceanBase 数据库,应用就像使用一台单机数据库一样,不需要做针对分布式数据库的特别感知和修改。3:高兼容:我们在一套 OceanBase 集群上同时提供两套生态,一套是 Oracle 生态,一套是 MySQL 生态,有效地降低业务迁移改造的成本。同时 OceanBase 和国内主流的操作系统、芯片也都做了互认的支持,可以有效满足技术供应链安全的需求。

  另一方面,OceanBase 已经通过了等保三级、CNAS 等认证。未来,OceanBase 也将不断获取新的认证,满足各个行业的合规要求。

  2. TPC-C 认证成果

  为了证明 OceanBase 的实力,OceanBase 是首个参与 TPC-C 评测的国产数据库,也是首个参与 TPC-C 评测的分布式数据库。2019 年首次参加,即打破了 Oracle 保持了 9 年的世界纪录,是 Oracle 纪录的 2 倍多。2020 年 5 月又再次参加 TPC-C 认证,再次刷新了纪录。TPC-C 认证对分布式数据库的挑战很大,OceanBase 是全球第一个通过该认证的分布式数据库,证明了分布式数据库可在保证 ACID 的前提下,实现水平扩展。

  那么 OceanBase 是如何完成了 TPC-C 测试的呢?第一,整个测试过程,OceanBase 集群使用了 1557 台服务器,充分展示了基于普通 PC服务器的水平扩展能力。第二,系统带负载运行 8 小时,性能抖动不超过 0.5%,充分展示了 OceanBase 的稳定性。第三,OceanBase 的测试采用阿里云公有云上的标准 ECS 服务器,是可以公开购买的。系统价格是 3.98¥/tpmC,平均成本只有 Oracle 的一半左右,充分展示了 OceanBase 的性价比。

  以上就是 OceanBase 参加 TPC-C 的测试成果和测试过程,接下来我们谈下公众对 TPCC 测评的一些误解。

  误解 1,这只是一个跑分测试,只要想尽一切办法,把 TPS 提高就可以了。TPC-C 有 30 年的历史,以前各个厂家为了取得高分,采用了一些非常规手段,此后,为了保证测试的公平性和实用性,TPC-C 官方不断完善和优化评测过程,堵死了几乎所有投机取巧的手段,力求模拟最真实的使用场景。而且每次测试结束后,审计员都会登陆系统,搜集数据,检查数据,一旦发现有任何的数据不一致,会取消测试结果。所以,TPC-C 难的不是跑一个高的分数,而是在100%满足严苛规范情况下跑一个高分。误解 2:“OceanBase 用最新的硬件和 9 年前 Oracle 去比,胜之不武。”事实是,虽然硬件相比 9 年前已经有很大的发展,但 Oracle 在集中式数据库这个赛道上足够成熟和强大,所有的传统数据库厂商都放弃了和 Oracle 在这个赛道竞争,即使竞争者使用新的硬件超越了Oralce,Oracle 肯定也会使用新的硬件超越。误解 3:“分布式数据库在 TPC-C 评测中有优势,分库分表也能得到很好的效果。”事实是,分布式环境在 TPC-C 的评测中面临的挑战,比传统“集中式”数据库大很多,比如分布式事务带来的性能挑战和 ACID 挑战、item 表所带来的性能挑战。因此,在 OceanBase 之前,从来没有任何一个分布式数据库参与 TPC-C 评测。

  误解 4:“我用很少的机器就能跑出很高的 TPC-C 分数,根本不像 OceanBase 一样需要这么多机器。”事实是,TPC-C 规范约定,每个仓库(warehouse)最多只能产生 12.86 个tpmC,因此要达到 7 亿的 tmpC,需要 5400 万个仓库,按每个仓库 80MB 数据计算,需要4320TB 的存量数据(单副本)。这还没有包含测试过程中要保存的历史订单数据,TPC-C 标准要求至少保留 60 天的历史订单。因此,除非参与正式的 TPC-C 评测,否则没有厂商在测试中遵守此规范,所以当然不需要那么多机器。但这样的测试,其难度和真正的 TPC-C 评测相比,根本不是一个数量级的。

  3. 内外部应用案例

  OceanBase 的定位是一个通用的关系型数据库,可以广泛应用到金融、电信、保险、政府等各行各业,满足各个行业对通用数据库的各类需求。

  金融交易要求较高的可用性,并需要确保事务的 ACID,OceanBase 可以满足;

  信行业有海量数据 OLAP 应用的需求,OceanBase 可以满足。

  保险行业期望平滑的扩容和缩容,OceanBase 也能满足。

  OceanBase 应用到外部客户之前,已经在阿里及蚂蚁内部,广泛应用到多个核心系统。

  首先是支付宝核心交易,支付宝最常用的模块,如交易,支付,积分等业务的核心链路都运行在 OceanBase 上,日常每秒都有上万笔交易,双十一期间,每秒可以达到几十万笔交易。支付宝是典型的在线 OLTP 数据库场景,支付宝对 OceanBase 所有核心特性进行了验证,包括响应时间、处理速度、事务的完整性、并发量等,将 OceanBase 真正打磨成了金融级数据库。从产品成熟度上来讲,证明了 OceanBase 能够承担金融在线交易的场景。国内其他的数据库产品很少有机会能够在这么大的场景下,进行实实在在的打磨。“收藏夹”是典型的“写少读多”场景(一次写入、多次读取),峰值的数据读取请求量达到数百万次/秒;而且,由于淘宝巨大的活跃用户体量,这些读请求要访问几个数据量很大的表才能拿到所需数据,其中最大的表保存了数千亿条记录。OceanBase 数据库借助完备的分布式事务能力、完备的 SQL 引擎、优异的性能以及线性水平扩展等能力,很好地解决了海量数据下的在线、高并发、低延时查询等等需求,为数亿淘宝用户提供了良好的使用体验。网商银行虽然不是传统意义的银行,它没有个人存款的卡或者存折,但它是真正的商业银行。网商银行,创建伊始,就采用了 OceanBase 承载其所有业务流量,因此 OceanBase 承担了网商银行所有的数字资产。网商银行创新的采用三地五中心方案,无论服务器故障、机房故障还是城市灾难,都可以实现 RPO=0,RTO<30 秒的高可用性。证明了 OceanBase 能够提供最高等级的容灾方案,能够承载银行核心系统。 Paytm,是印度的支付宝。Paytm 主站核心数据库也采用了 OceanBase 数据库。

  数据来源:OceanBase 官网。

路过

雷人

握手

鲜花

鸡蛋

文热点