OceanBase跨越千行百业,追寻国产数据库的突围路径
摘要:对数据库的要求越来越高,这既是挑战,也是前所未有的发展机遇。 OceanBase跨越千行百业,追求国产数据库突破之路
文字| 张萍萍、李晨曦
编辑|张静
“中国移动互联网用户超过12亿,人均上网时间6.9小时,每天上网时间总计80亿小时。”
近日,在谈到数字经济时,中国工业经济学会会长、中国社科院教授蒋小娟表示,他认为中国的个人数据流量产生量是世界上最大的。
《数字中国发展报告(2022)》显示,截至2022年底,我国数据存储量已达724.5EB(艾字节),同比增长21.1%,占全球的14.4%。
近年来,中国移动互联网的发展带来了数据量的爆发式增长和交易量的高度不确定性变化。 也催生了企业数字化转型的强烈需求,而承载海量数据存储和处理的主流数据库产品依然采用几十年前诞生的传统中心化架构。
在主流数据库架构与中国移动互联网业务场景需求的错位中,国产分布式数据库OceanBase应运而生。
OceanBase首席执行官杨兵表示,40年前主流数据库设计者的假设正在受到现实的挑战。 过去提到的“大数据”已经不能与今天的大数据相提并论了。 “这意味着解决新阶段的问题需要新的假设、新的架构。” 杨兵表示,随着数字经济的发展,分布式架构将成为支撑现代数据库的新架构。
近日,在OceanBase 2023年度发布会上,该公司透露已服务超过1000家客户,客户数量去年增长了150%。 在1000家客户中,30%的客户使用OceanBase作为核心系统,成为核心系统升级的首选。 在金融领域,OceanBase已经成为市场份额最大的分布式数据库。
数字化转型呼唤现代数据架构
数据库是与芯片、操作系统并列的现代信息技术三大核心基础之一,是基础软件的“皇冠上的明珠”。 在企业数字化转型过程中,数据库升级是关键环节。
数字化转型从应用层开始,很快就会到达底层计算网络等基础设施瓶颈,从而推动云计算和大数据平台的发展。 数据库作为PaaS层之一,连接IaaS层和SaaS层。 数据库的升级改造实际上是IT系统中最关键、最复杂的环节,是“最难啃的骨头”。
近十年来,中国的IaaS层初步经历了“上云”的洗礼。 当IaaS层升级完成后,PaaS层需要匹配新的基础设施,承担SaaS层的快速迭代。 这里此外还必须具备数据库应有的安全性、可靠性、稳定性。
正如相关领域专家所言,构建数据存储安全可信保障体系是时代的需要,也是历史的使命。
IDC中国副总裁兼首席分析师吴连峰也表示,下一代数据库的要求至少包括七大要求:弹性扩展、稳定可靠、极限性能、融合分析、平滑迁移、多模能力、人工智能融合。
中国数据库产业始于20世纪末,近十年来快速发展,并随着数字化热潮迎来新机遇。 《数据库发展研究报告(2023)》显示,2022年全球数据库市场规模为833亿美元,其中中国数据库市场规模为59.7亿美元,折合人民币约403.6亿元,占全球数据库市场规模的7.2%。世界总数。
如今,人工智能蓬勃发展,海量数据价值的挖掘和应用已成为推动创新的重要力量。 这对数据存储和计算的性能成本提出了更高的要求。
“从数字化转型的角度来看,数据库必须满足企业业务流程创新、用户体验创新、产品服务创新、商业模式创新、社会责任创新、风险管理创新等多重价值的需求。” 在吴连峰看来,人们对数据库的要求越来越高,这对于国产数据库产品来说既是挑战,也是前所未有的发展机遇。
把复杂的事情留给自己,把简单的事情留给客户
OceanBase创始人杨振坤曾表示,从OceanBase诞生的第一天起,团队成员的目标都是一致的:不仅仅是做一个供自己使用的数据库,而是做一个能够促进整个社会进步的数据库并推动社会进步。 生产力变化数据库。
毫无疑问,OceanBase是业务场景倒逼的产品。 十多年前股票市场,当数以千计的用户同时进行商品支付时,瞬间的交易高峰如洪流般考验着电商和支付平台的IT系统。 2010年,淘宝的“双11”活动创造了9亿多元的销售“神话”,前所未有的巨大交易量也导致全国多家银行的网上银行陷入瘫痪。 同年财经数据库,OceanBase诞生。
自2014年起,OceanBase逐步取代Oracle支撑支付宝核心交易系统股票市场财经网,承担“双11”交易流量。 2017年,蚂蚁集团核心系统最后一个Oracle数据库被更换。 2019年“双11”,OceanBase创下了6100万次/秒的数据库处理峰值记录。
随着OceanBase数据库支撑的业务从边缘走向核心,团队不断深入了解数据库应用场景的痛点。 在数据库的实际应用中,企业常常面临业务规模不断扩大、业务场景不断增加、IT架构应用日益复杂的问题,导致数据库的使用越来越复杂的情况。
本着“把复杂留给自己,把简单留给客户”的产品理念,OceanBase团队采用一体化的设计方式来解决和控制客户使用的复杂度,致力于实现“用一个数据库解决80%的问题”。问题的“问题”。
为此,OceanBase诞生的13年间,数据库代码已经被重构了两次。
第一次是从0.5版本到1.0版本。 团队推翻并重写了原有代码,将数据库代码从最简单的分布式改为工程化集成,初步解决了分布式架构带来的高度复杂的运行问题。
第二次是2022年,OceanBase发布单机分布式集成数据库OceanBase 4.0“小鱼”。 该版本既可以实现单机部署,又可以在单机部署下完成分布式部署功能,可以满足企业从小到大的不同开发需求。
杨兵坦言,设计4.0“是一把大刀”。 正是这种重构,让OceanBase能够触达更多场景,成为通用数据库。
“从OceanBase的整个演进来看,一体化设计是OceanBase产品的DNA。未来,OceanBase将继续实施一体化产品战略。” 杨冰说道。
从支付核心到千行百业
2020年,OceanBase诞生第十个年头,这款经历了数年“双11”锤炼的产品,走上了正式商业运营之路。
正式商用当年,OceanBase协助工商银行完成了企业(法人)财务管理系统从大型机到分布式架构的转型。 这也是工商银行首次将重要业务系统运行在蚂蚁自主研发的数据库上。
对于三年的商业化,杨兵表示,一开始,OceanBase深入探索了金融、运营商、政务等场景,几乎走遍了所有道路。 这些领域已经开始出现大规模复制的迹象; 此外,2021年,OceanBase将开源其核心300万行代码。 随着开源生态的不断成熟,已有500家客户将OceanBase社区版应用到实际业务生产系统中; 自2022年推出OB Cloud以来,公众云客户数量增长了150%。
然而,不同行业的需求有所不同。 随着客户行业跨度的增加,OceanBase也面临着截然不同的客户需求。
在金融行业,大型机构和小型机构有不同的需求和关注点。 大型机构基础设施较好,在TPS、响应时间等方面有较高要求,所以重点不仅仅在于分布式,更在于完整的单元化分布式整体解决方案以及如何在分布式架构下构建高可用性。 技术风险体系。 中小型金融机构首先需要数据库的分布式能力,但他们在使用时根本不希望意识到这一点。 相反,他们希望像集中式数据库一样使用该数据库。
运营商行业对数据库的使用非常深入,一般系统之间的耦合度比较高,数据的集中度也比较高。 一旦涉及数据库更换,复杂度和风险往往比金融机构还要高。 这类客户会更加关注数据库的兼容性,以及数据迁移、评估等支撑工具的完整性和成熟度,以降低迁移过程中的风险。
有些行业对停机后的恢复速度要求不是最高,但对成本非常敏感; 有些行业特别注重二级之字形,可以回滚。
“数据库已使用。” 杨冰感慨道。 三年来,从金融核心到政府企业和大型国计民生的核心系统,再到运营商和新零售、新制造的核心,OceanBase一直在“重点业务”上下功夫。 ”的万千行业,已经能够走出一条积极的道路。 商业增长曲线也为客户创造了更大的价值。
国际咨询机构Forrester的报告显示,企业采用OceanBase数据库后,平均可以节省70%以上的存储空间、85%以上的服务器资源,平均每个注册用户节省50%以上的数据库成本。
自2010年发展至今,OceanBase已经从1.0发展到4.0,支撑体系也从边缘应用转向“基于关键业务负载的服务”。 OceanBase只用了三年时间,就从2020年只有18个客户,到2023年超过1000个客户。