低谷与高光:阳振坤与国产数据库笔直十五年 但天天的高光更正量很小

作者:休闲 来源:百科 浏览: 【】 发布时间:2025-07-22 17:10:53 评论数:
大批的低谷营业场景以及数据需要令二心向往之,但天天的高光更正量很小。

作者不断关注云合计、阳振

这所有,坤国不断效率,产数OceanBase逐渐接下了大淘宝100%的据库流量。OceanBase简直也只是笔直适才站上了起跑线,

2006年在baidu就开始追寻阳振坤脚步的低谷杨传辉,9月开始妨碍文档代码整理,高光2012年秋天,阳振OceanBase也开始针对于中小客户的坤国需要优化,并用C以及C++写了一套凤巢零星,产数为了确定水平上坚持OceanBase的据库自主性,当用户碰头时,笔直情急之下,低谷压倒阿里高管投入大批财力与人力,根基便是淘宝艰深100%的流量。

对于此,”

所幸,

初生牛犊不怕虎的OceanBase,也能做合成的HTAP数据库新星,带着团队探究新的措施。可能从2010年提及。纵然惟独要读取其中一条记实,击败不断九年位居榜首的Oracle。你做的数据库天猫还在用,取患上今日乐成眼前的逻辑。提供的“天时”。修完大学课程只用了三年、是碰头时衣着凉鞋的抽象。在全场的掌声中,做一款扩散式数据库。把相关负责人叫以前一起谈:

“OceanBase有甚么下场,也为了证实数据库产物的价钱,

随后,惟独有两台机械乐成实现,2016年先后,在内存改好后写回去,花了快要一年光阴。

在大厂中妨碍起来的数据库,源源不断的第二个难题是,也讯问紧迫备战的团队们:“有无定夺?”

偏偏站在窗边的阳振坤,

2014年9月之后,

下一个紧张的抉择规画,就要先清晰硬盘以及内存的差距:硬盘中的数据需要基于“块”的方式读取、在他眼中,阿里需要能耐更强的数据库。一个试验做扩散式数据库的机缘?

阳振坤给出的论点之一是,


内外“交困”:费口舌不如跑分

“在公司里做一件事,2010年5月11日,各方打平。

2017年,从经济短处上说,搜罗规画,节点与节点之间平等,

但,敲键盘写代码。在北京大学合计机钻研所试验室阻止进去的一个小隔间里,让Oracle已经有些左支右绌:Oracle数据库至多反对于20个节点的同享模子,“推销”到口都干了之后,宣告阳振坤声誉退休。每一每一也难以真正落地。2025年5月12日,便带队高管们,

也因此,当时,也不助理。但他接下挑战,而新的措施中,他其后第一个直部属属。

最后的难题是,OceanBase公司发送全员外部信,判断“去IOE”的策略后的早期,硕士只用了一年多的阳振坤,正是他入职阿里的第十五周年,其后的立项只花了六个星期。自己那天敲开的通往合计机钻研所的大门,就永世不信誉,南京银行,而是自动走进市场、

1989年春天,

“双十一”流量的10%,泛起惊人的削减——小型机、

OceanBase在技术与商业规模的双线并进,需要扩散式,开源尚未成为主流的当时,像个农人同样。若何让营业团队信托,那时进来说扩散式零星的意见,

早期,

可是,这也是OceanBase突破重重难关,他开始把目力放到外部商业化上。

一个多月前,而且,也磨炼了良少数据库、2009年开始做“双十一”的淘宝,团队成员们无意会笑评:“60岁的迷信家,惟独快捷碰头内存清晰数据更正的情景,一套可能要两千多万,眼前来看不可不断。

可是,阳振坤团队引入了Paxos协议技术:让一笔生意用三台机械做,立项已经成。惟独肉体饶富,给面试者画OceanBase的框架图,三次“重启人生”

光阴并吞2025年5月12日,

但OceanBase的妨碍并未就此停下。用营业打磨OceanBase的能耐,建议他们去到如火如荼睁开“去IOE”的支出宝。团队不断实现其后打造扩散式数据库的应承。尽管如斯,防止“用高射炮打蚊子”,做患上不够好的部份,从原需32台效率器,企业可能把规模小的营业用单机零星跑,有一段光阴也向王坚陈说,

可是,

成长于阿里的OceanBase,接下来确定会往扩散式走;且传统单机数据库缺少扩展能耐以及高并发能耐,但阿里的数据量需要多少十万台效率器。便是让扩散式以及单机零星同时存在,在2012年11月15日并吞支出宝。让OceanBase从一个重大的存储零星,中国尚未数据库能经由TPC-C基准测试,这笔账可能这样算:一台PC机出倾向的多少率假如是千分之一,每一每一泛起重大边界。已经感时再也不来。2023年在金融行业营收规模2.7亿国夷易近币,但当时零星的极限容量是每一秒3000笔定单。

做学识降生的阳振坤,是开源。最终,更有扩展性。OceanBase这个数据库老大哥概况也进一步意见到,咱们豫备从这跳上来。向王选表白说,份额第一。但OceanBase再也找不到新的营业,鼎力推选团队产物:“咱们的同砚颇为优异:给他们一个信托,他仍是抉择并不那末好走的自研蹊径。也自己贴发票报销。Oracle分心中也给OceanBase的妨碍“泼油救火”:在“双十一”前夜的压力测试中,”

九十年月时,在IBM的钻研中间田,但这并不易,技术团队与营业团队的期望,这种零星在高配置装备部署以及低配置装备部署下都坚持不错功能的打法,

要清晰这个做法的立异,外部营业催患上紧,Oracle就报错解体。转头看,

入职后约莫一周,若何向导OceanBase渡过一个个难关?他以及OceanBase相互造诣的这一起,阳振坤退出淘宝后,

互联网大部份名目周期是两周,也证实这步预判是精确的:2009年景交金额惟独约莫5000多万的“双十一”营业,阳振坤带着满满至心以及一套着实的处置妄想,这个名目就被坚持了——因其两年内还不能在中间营业运用,哪怕会给营业带来短处,数据库、初生的OceanBase能处置这个下场?

“数据库惟独出一次下场,当时数据库的功能“连1%都没做好”。是由于当时淘宝珍藏夹面临的功能瓶颈,也已经逾越了国家尺度。但在会集式数据库为主流的年月里,蚂蚁高层也正式抉择,减到了14台,

但这所有变更只爆发在布景,在会集式数据库盛行的年月,就在那年,且运行时要依赖高端硬件配置装备部署。曾经有新退出团队的年迈人背阴振坤报怨说,种种“天时天时人以及”,与光阴妨碍毫无悬念的赛跑时,阿里云飞天零星的第一个客户阿里金融已经深有体味:当时深受折磨的阿里金融掌舵者胡晓明,攻略营业线的老大,被以为不能主力投入。无畏出下场’这些虚的。

他们在忙繁忙碌中渡过了第二年,



就患上把硬盘里这个块读进去,他仍是不迈出这一步。阳振坤入职阿里,在前端依然可能实时看到更新。职级是P11。在金融行业当地部署市场中,对于其其后席卷云合计市场至关紧张。但营业团队并不接招,阳振坤刚强捉住这次“复活”机缘,团队开始将其降级为残缺的扩散式数据库零星——每一个节点都可能再做更正,前先后后,奈何样赢患上各营业线的信托、都不买账。

从国产数据库不被看好确昔时,若是碰头硬盘上100个差距的位置,患上以分心研发,”

阳振坤还给时任蚂蚁总体的CEO彭蕾写了封邮件,彼时OceanBase声誉缺少,在同样艰深使掷中,他去到遥想钻研院负责首席钻研员,

团队在两个月摆布妨碍重大版本的测试,

退休那天,呈多少千倍削减。营业量扩展时再叠加更多机械。其后短短五六分钟陈说里,团队最终仍是证明了自己价钱。

而运行OceanBase之后的淘宝珍藏夹,OceanBase抢夺到了1%的流量测试机缘。

假如用户珍藏的100件商品存在多个差距的定常块里,高端存储加之Oracle的各项用度,阳振坤感慨。这位60岁的挨次员,也要把全部块读掏进去后再找到需要的记实,若何飞腾软硬件的老本?

当时,他对于OceanBase的睁开妄想,其在关连数据库零星上做到单机/单机房倾向不丢数据、

当时以及阳振坤同样信托扩散式的,

2002年,“百”口莫辩之时,冒险把营业交给一个从0开始的自研名目,可是,

如前所说,

产物能耐逐渐成型后,加之早期阿里外部立异空气浓郁,当OceanBase在阿里普遍运用后,是从淘宝外部妨碍起来的OceanBase,

彼时,又难获营业信托。支出宝试验给出的打法是用MySQL+艰深PC机替换。若何对于外效率、营业团队只好找到阳振坤:“给你们10%行不可?”

团队如获至宝,又患上从硬盘上魔难每一个块的更正情景。

作者 | 赵之齐

编纂 | 胡敏

十一年前,负责无线通讯规模的钻研;其后又打仗扩散式零星,阳振坤罕有地给自己的人生放了一个月的假,营业团队给出的每一次磨合机缘,深耕合计机规模三十年的他,也是阳振坤团队为消除了客户不信托感以及目生感的自动。两年一过,其强盛的产物实力眼前,开拓一款扩散式数据库的创想便逐渐成型。baidu处置相关使命。阳振坤并吞了大学,

在团队成员的影像中,只是说道:

“出了下场,奈何样在会集式数据库盛行的时期里,抱着对于社会第一线使命的好奇,在36岁突入工业界,对于离不开关连数据库的互联网来说,他笑说自己“彷佛个大龄推销员”,你事实患上证实自己有价钱”,下个客户来读,招待削减作者微信Ericazhao23交流)

酣战当时,

运气眷顾分心人,2020年先后国产数据库赛道在卷的“自研”,阳振坤曾经随着王选去美国,若能登榜,同样不可或者缺的,在破费情景中试运行。

2010年,且经由TPC-C基准测试、做网页熬一两周就看到下场了,12台处置动态数据,至少在当时,阳振坤第一次见到了王选。AI等相关规模,基底细似于2009年阿里做的ODPS零星。他们会给咱们惊喜致使事业,”


职业生涯中,是时候走出阿里这个“舒适区”了。外部尚未此外措施处置——

用户每一次掀开珍藏夹时,冯春培(混名孔丘)以及程立(混名鲁肃)等人已经处置了晃动性的下场,阳教师想了良多多少多天仍是无解,

要末乐成,并在阿里外部证实其价钱。其后开拓的外部客户,患上到的用户信托将无可挽回。在阳振坤看来,是他的恩师王选的紧张教育:“顶天即将”。扩散式数据库“奈何样看都是一件需要做的事”。市场即将。因此,是阳振坤向导团队在一个个魔难前做出的紧张抉择规画,阿里“双十一”的备战室里,

而此前一天,可能经由使命职员的实时修复以及忠实赔罪重获用户反对于;但在支出宝的“钱”上出下场,腾讯、让所有数据的更正在统一个点上,阳振坤不断坐在他的办公桌前,也不人敢用了”,一个块的巨细艰深是512字节。

这个看似半路杀出的“程咬金”,在飞天零星、其后的故事人尽皆知:OceanBase乐成了,但要求团队支出更多肉体技术调优。可能直接碰头恣意一个字节的数据,

阳振坤做作担起这一重任。那是他人生第一次转变赛道、让阳振坤随着他做了13年的激光照排。阳振坤提了不下十次“难题”,这件事就做成为了。也是互联网金融相关营业。阳振坤谋求做出“面向未来的工具”,

但早期获客举步维艰,阿里的刘振飞向他递出了橄榄枝。为大客户量身定制,

阳振坤并吞baidu是在2006年。中小型用户的五十个营业里,以求过一个不被飞天报警铃声打扰的牢靠的春节。挨次碰头,在扩散式的坚持上,听者都一头雾水。两人便已经看好扩散式的未来。

就连当时颇为看好原生扩散式数据库远景的支出宝CTO鲁肃,谨严决断后,两年的光阴窗口里,而Oracle已经稳坐第一位的位置,一个做作的可患上优势是,时任蚂蚁总体CEO的彭蕾鼓舞团队之际,推开了窗,可能试验把天天营业低谷期(如清晨两点之后)更正的数据,会让零星的可用性清晰着落。OceanBase站上了数据库产物的起跑线,在线情景等形态变更,不光在技术上登顶天下,试运行四个月后,向时任蚂蚁CEO的彭蕾“应承”道:

“(OceanBase)出了下场,本能够退出快捷睁开的淘宝营业团队,

鲁肃这个下场眼前的逻辑是:若何在飞腾硬件老本的同时坚持零星晃动性?多少经试探后,Oracle的授权费也过于高尚,2019年10月2日,阳振坤审核到,其中,但纠结再三,也有OceanBase外部职员评估,OceanBase 0.5版本已经做到“半扩散式”零星:所有数据更正都在统一台机械上妨碍,在向雷峰网(公共号:雷峰网)回顾OceanBase的履历时,他有底气敢为人先。王坚牵线,带着OceanBase团队,阳振坤地址的团队取患上国家科技后退一等奖,互联网睁开快捷,依然不自己的自力办公室,验证可行;再花六个月实现第一个正式版本,在微软亚研、阳振坤做了一个抉择:跑分。又成为了阳振坤的心头紧张事变。阳振坤直言,碰头了淘宝珍藏夹的主管魏虎。

在这之后,种种压力下,在他们的拷打下,营业量也很大。阳振坤不需要背负KPI,让支出宝实现100%的运维可用率。质疑声多患上团队成员的耳朵都快被磨出趼子:

中国的数据库规模已经睁开了多少十年,像传教者。两台同时坏的多少率可能便是百万分之一,履历了一场“西岳论剑”:嬴者才有不断做数据库的权柄。阳振坤向雷峰网说道。在根基架构部份,他们也能做到……”

履历长达半年的商讨谈判,在阿里外部运用的OceanBase、但幸好,便是用这样的定夺,商业化的齿轮也运行起来,是身处“去IOE”(IBM小型机、站在王选办公室外忐忑的那个24岁年迈人,这也确定水平“笼络”了营业团队的心。OceanBase。日复一日地面对于那些视如己出的代码。假如良多用户同时碰头珍藏夹,阳振坤随后又花了两周光阴找客户、日后,就在当时,是阳振坤精确的分说以及团队配合的坚持。吴泳铭也违心授权各团队自下而上搞立异,阳振坤心知这破釜沉舟终是成为了。速率更快。又有奈何样的故事?

低谷与高光:阳振坤与国产数据库笔直十五年阳振坤


坚持扩散式的“妄图家”

Oracle九年来第一次痛失TPC-C基准测试榜首之位,有客户对于他印象最深入的,

其后,已经蛰伏期待当初多时。摸不出多少分玩笑多少分真,

国产数据库起步最难题却也满怀愿望的以前十多年里,并非一块好啃的骨头:淘宝的数据库出下场,在公共视线中徐徐升起。

那是阳振坤心目中挨次员理当有的模样。也问过阳振坤:“你若何保障OceanBase不弄丢支出宝用户的一分钱?”

阳振坤被这个下场问懵了。面试官是吴泳铭,但购物车对于淘宝而言是简直不可容错的中间部份,尚有王坚——他是阳振坤在微软的老板。妨碍为国产数据库的一大领头产物,国产自研扩散式数据库OceanBase的独创人阳振坤站在推开的窗边,回顾当时,这种做法短期内能反对于支出宝的生意需要,OceanBase作为一个径自的公司自力经营。

这个妄想俘获了淘宝珍藏夹团队们的心。

其后阿里的妨碍速率,令他对于这之外的所有,他看到良多挨次员纵然鹤发苍苍,但他改的网页早就看不到了”。早期硬盘中,便是败给当时在公共视线里还老成持重的OceanBase。仍是难以防止地开始受到质疑。也依然坐在办公室,因此,淘宝珍藏夹仍是OceanBase的用户。市场即将。这样上来,是阳振坤奠基下的极客基因。至多只是用户临时无奈购物,

而高昂要成为一家科技公司的阿里,常面临“先有鸡仍是先有蛋”的为难:不营业的磨炼,但没能侥幸地取患上第二个像淘宝珍藏夹同样具备代表性的营业。证实OceanBase的可行性”的称许后,

深知数据库妨碍需要周期的他,信托其中搜罗打磨出扩散式数据库产物的可能。惟独有一两台机械不断使命,要末清静。Oracle会在官网上临时揭示阿里的logo,

这一点,

而在取患上吴泳铭“给你两年光阴,三台则是十亿分之一。2010年淘宝第二届“双十一”的平台生意笔数每一秒峰值就已经抵达2500笔,种种光环下,

至此,他开始学习了Google开拓的两种扩散式存储以及数据库模子,

直到2016年初,阿里高层发现公司每一年在IOE上的支出,会指向一个如斯华美又广漠的未来。数据库在会集式这条路上已经走到尽头,30多年前,团队总会不断推掉、

故事的开始,阳振坤每一每一会拿出一张纸,给他这个不数据库布景的人,他确定能想处处置措施。阿里可能酿成“给IOE打工”。作为用户,各营业线对于新技术的加倍谨严自不用说。

淘宝珍藏夹以及OceanBase的这场相遇,不论多少点,

在面试新人的历程中,数据总量大,阿里还想从已经有的MySQL开源数据库发力。终于碰着一个违心试验的名目:淘宝珍藏夹。有阿里外部人士泄露,击败Oracle登顶。对于他们来说老本过高。OceanBase的能耐不证自明。

两种操作的中间差距是:削减大批一再的措施,并以及原本的数据并吞,纵然是CTO吴泳铭,防止重大性。招待削减微信Ericazhao23交流。从2010年起磨炼自己,”

把自己与OceanBase成败绑在一起的阳振坤,缔造更大的商业价钱,并不规模在技术层面的提升,要更健壮、

之以是有机缘,

重重挑战当时,可能说是一场双向救赎。OceanBase顺遂地渡过了双十一,无意连团队外部成员也颇有微词。能用公司外部成熟的营业磨炼产物。

但,数据量一上到90%,一战成名,

他首先向魏虎论述了自己的审核:淘宝珍藏夹大部份数据的特色是,先放在内存里,阿里每一年要给IOE三家美国公司简直200亿元推销费,阳振坤团队开始了验证测试。此前在用户眼中是“不靠谱”的代名词。开始第二场新的试验。他依然坚持最重大的一壁示人。阿里是Oracle在亚洲最大的客户之一,也都接管了相似技术。Oracle数据库以及EMC存储)节点上的阿里,而此前阳振坤在baidu使命时,向阿里云高层们鞠下无言的一躬,(更多幕后故事,可能惟独两三个营业单机零星做不了、零星就能不断运行。需要处置的新下场是:大批运用Oracle数据库的支出宝,(无言鞠躬眼前若何风波暗涌?招待削减作者微信Ericazhao23清晰)

有了这一“重蹈覆辙”,数据库就要频仍碰头硬盘数据。提出“单机扩散式一体化”意见。OceanBase零星开始交流支出宝最中间的账目零星中的Oracle数据库。他以及年迈共事们一起在工位上看代码,那这个下场确定无解,OceanBase这个既能做生意、但如今,在2018年报名退出了这项测试,数据量激增,

他开始在外部追寻第二个大型营业。当时的OceanBase仍是“半扩散式”零星:只是写入一个单点,

而且,他依然跑遍了营业部份,拆开来说是,5月11日,

特意在阿里外部,32岁的他被破格提升为教授。但数据库的睁开不三五年,

想法有了雏形后,2台负责动态数据。捋捋未来的妄想。可是,咱们就豫备从这跳上来。阳振坤做对于的第一个抉择规画是,零星都要魔难商品价钱、鲁肃出面签字,2020年自力为公司,“最难题的部份已经实现为了”,押在了阿里技术人每一年的“大考”上:“双十一”。也源自他铭刻于心的恩师王选的教育:技术顶天、阳振坤声誉退休。不甚么特殊。而内存则能随机缘晤配置装备部署,这块硬币的另一壁是,阳振坤也常需要宽慰夷易近意。但自己的支出却彷佛离收获不可企及。合租的室友在天猫使命,OceanBase是否承住这份压力?众人瞩目下,也深入学习了Google的扩散式存储以及数据库模子。若何压倒他人,名目面临封锁危害。愿望能成为他的学生。阳振坤把赌注,阳振坤给出的回覆是:“再过三年,到国产自研雨后春笋般爆发的如今,1997年,当时阿里外部数据库的数目高达6500个,团队对于这个倾向都定夺满满。服从宣告:OceanBase经由了测试,

阳振坤去了阿概况试,

这步降级,但尚未哪一个数据库真正做患上乐成,

王选的一个许诺,也是对于员工的约束:从前惟独主库坏了,

数据库也有自己的全天下功能排行榜,他感慨:“假如一个下场,花了整整两年光阴。到2019年有2600多亿,阳振坤在2010年退出阿里后,陪陪家人,他提出的仅有要求是:两年内证实这个名目的可行性。坚持扩散式数据库的道路。也需要建树自己技术根基。主管技术,OceanBase还受到过阿里外部其余数据库的挑战,三年不新标杆营业的OceanBase,

就在此时,已经偏远将自己活成那幅画面中的一部份。就有了2014年OceanBase“双十一”作战室里的名时事:

当晚,这之后,

阳振坤曾经将目力投向淘宝购物车,


与营业磨合:战战兢兢六七年

数据库产物能耐的提升,若一律运用扩散式零星,都是不可失手的关键战争。本该是收获的季节,概况也难以想象,

2014年,1995年,九年。因此,每一读一个块可能需要1毫秒,咱们以为技术上做不到的,

其后在阿里的履历则比力侥幸。用户掀开读取淘宝珍藏夹的速率就会变患上颇为慢。但随着打仗企业规模扩展,艰深PC机的倾向率远高于IBM小型机以及EMC存储,

这一技术的刷新,年过花甲的他,在2011年12月31日破晓并吞阿里云,

那一年里,履历长达一年审核后,妄想正式投产。让阿里云患上以在2015年以前就打下技术以及产物优势,到下一个低谷期(好比两点)时,技术顶天、在这个简朴的办公室里,中间件等相关研发强人,巨匠详细指进去,

可是,彼时刘振飞正负责淘宝的布景零星经营规画。阳振坤开始带队做外部营业。华为等公司在基于MySQL的零星中,而直到明天,也难以直接干涉营业部份的产物运用抉择,

深谙此理,OceanBase数据库等一系列技术根基建树历程中,两人此前在微软一起共事,开始打榜。在2010年已经抵达9亿多,如南京银行,你们奈何样就乐成了?Oracle这么多年都没做出扩散式数据库,2016年尾,数据库的合计量以及I/O需要就会大幅削减。于是,已经远超Oracle的处置能耐。PolarDB以及ADB数据库零星共运用了约5万台效率器,营业线向导要自己背负营业目的,原本的措施,把数据库开成“白盒子”,需要把握“知足营业团队高定制化需要”与“打磨自己数据库产物通用能耐”之间的失调。也是OceanBase降生的第十五年。你们奈何样可能做进去?

当时团队规模也就百十来人,临危授命。巨匠就要多少分钟内起来做家养对于账,再把当日更正跟原本的数据做大并吞写回去。永世卡住的一个关键是:若何向营业部份揭示OceanBase的价钱。那之后花了十多年长出累累硕果的OceanBase,也是国产云数据库睁开15年的紧张缩影。阳振坤向雷峰网说道。不要说‘感应不晃动、阿里外部也有良多取患上Oracle认证的顶级工程师。对于此心缺少而力不够。绕不开的,

他向鲁肃自荐用OceanBase替换Oracle,

两年期限临近的关键,Bigtable以及Spnaner,对于淘宝外部的营业技术团队逐个登门碰头,更正都存在内存里,

为了更好提升数据库功能,对于产物自己之专一,但公司随后意见到自研的紧张性,

阳振坤常挂在嘴边的一句话,由于有解的话,在微软时,有说法指,在第二年6月正式开源。OceanBase取患了第一个外部客户,给用户揭示。如今是OceanBase的CTO,2020年6月正式建树的OceanBase公司,

深入点讲,

而且,避无可避的难关。鼎力提升珍藏夹运行的功能。重来。实现所有名目的交流只是光阴下场,数据库难以妨碍;但不够成熟的数据库,

这个扔到阳振坤眼前的难题,再花了两周在代码上做重大的原型论证。惟独用户有更正,当时国内简直尚未人做相似名目,阳振坤向当时淘宝技术负责人吴泳铭提出这个想法。

此外,就要读取100个差距的“块”(Block),至关于被迫站到了绝壁边上。阳振坤向导OceanBase的妨碍史,就像如今以及他人讲量子合计,但读取数据时运用多台机械2022年先后,铸造出职业生涯中最广大也是最辛勤的名目,重启。能把这个名目做成,

至此,因此,能睡上牢靠觉,在市场的检测下调解优化。

最近更新