它处在整个产品或者产业链最底层的位置,替换风险很大,但收益相比起来却小得多。
这也是为什么像IBM、微软这样的后来者,也无法取代Oracle。
而对于星河集团而言,“去O”的主要难点在于:
传统关系数据库都是通过外部硬件来保证可用性,在用便宜的PC机替换高端服务器之后,硬件更容易出故障了,如何保证数据库高可用?
高可用和数据一致性如何同时保证?
分布式系统怎么同时实现CAP的要求?(CAP指:一致性(Consistency,C)、可用性(Avaibility,A)、分区容错性(PartitionTolerance,P))
几十年来,这么多做数据库的厂商,国内国外基本没有人成功过……
而且从公司的业务发展的角度,也不可能等你几年把数据库做出来,再去发展业务。
更可行的做法,是先基于开源做出一些东西,让业务先往前走。
所以,目前王坚为首的技术团队,采用的是数据切分(sharding)的策略。
将部分海量数据应用,先从集中式Oracle切换到分布式MySQL集群,从纵向扩展到水平扩展,解决了数据库扩展性的问题。
同时,目前百度研究院正在研发自有的分布式关系数据库——OceanBase。
这里不得不提到一个人,阳振坤博士。
这也是一位“超级大牛”:
84级帝大数学系,硕士师从本系的张恭庆院士,后又转向计算机领域,博士师从计算机系的王选院士。
大学只用了3年,硕士1年多,24岁成为王选院士博士……
95年其所在团队研究成果获国家科技进步一等奖(排名第四),1997年,32岁被破格晋升为教授、99年成为帝大首批“长江学者奖励计划”特聘教授。
他是跟随王坚博士,从微软亚洲研究院“跳槽”,来到百度研究院的十几名科学家之一。
目前担任百度研究院系统数据库项目组组长、高级技术专家(P9)。
阳振坤博士一直都是研究分布式技术和分布式系统的。
他十分看好云计算系统的发展机会,在加入百度研究院后,就主动请缨,开始担纲支持分布式关系数据库OceanBase的研发。
而王坚对于他的研发项目,也非常支持。
认为OceanBase数据库,将会是未来星河云计算战略中,最重要的一环!
隋波听到这里,也不禁有些庆幸。
正是他提前请来了王坚博士,并且全力支持“云计算”战略。
才能有这么多前世的技术大牛,汇集到星河旗下,并且能够提前发挥出巨大的作用……
最后,王坚博士也向大家汇报了目前集团“去IOE”计划的工作进度:
易趣商品库已在去年6月,完成去“I”,计划于今年年中,完成去“OE”;
数据库,将在今年3月完成去“I”,10月完成去“OE”;
易迅社交及游戏数据库,将于今年年10月,一次性完成“去IOE”;
目前集团数据量最大的易趣交易库、现金流结算系统;易付宝交易系统和账户系统,则预计要到明年底,才能完成去“IOE”。
之所以各公司的进度不同,主要也是因为不同业务对系统的需求不同。
比如,
易迅是即时通讯和社交、游戏业务,注重实时和可靠的在线服务。
服务要“永不中断”,对系统的要求是健壮、容灾、负载能力强;
百度是搜索业务,注重分布式计算能力。
对系统的要求上,不论是扒取海量内容还是响应并发请求都需要高效迅速;
而易趣是电商业务,最重视的是并发事务的处理,对事务状态的控制、交易安全的控制……
尽管平台系统复杂,技术开发难度大。
但王坚博士依然称:
“预计到2008年,集团所有业务,都将完成去IOE!”
隋波第一个用力的鼓起掌来!
他心中兴奋莫名。
虽然“去IOE”,只是星河集团自研系统,迈出的第一步。
但这一步,却是最关键的!
因为它实现了星河系在技术领域,“自主”的开始。