百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

褚霸:阿里云数据库要放大招!

ccwgpt 2025-03-01 13:10 60 浏览 0 评论

云栖社区(欢迎订阅微信)

原文链接:yq.aliyun.com/articles/8473

如需内容转载合作,请联系:yqeditor@list.alibaba-inc.com

4月19-21日的2016云栖大会深圳峰会,有前沿技术深度分享、Workshop阿里云开放实验室、行业企业聚会、Tech Insight实战干货,更有20+场分论坛,120+高浓度实战演讲,100+阿里核心技术专家。为了让大家更为深入地了解云栖大会深圳峰会的日程设置,云栖社区对20+位分论坛出品人进行了系列采访。

本期采访嘉宾——阿里数据库大神褚霸。

余锋,花名褚霸。他身上的标签很多,比如阿里数据库领域技术带头人、专注代码19年、踏实靠谱务实热心的牛人工程师、Erlang社区大神,甚至江湖中还流传着“拜霸神教”的传说。这些标签和故事,可以从ATA的采访,以及知乎多位友人爆料中看到。而刚成为阿里五年陈的褚霸将率数据库技术团队在云栖大会深圳峰会上亮相。他告诉云栖社区:将有大招要放!

阿里云研究员 褚霸

从技术创业到阿里云数据库团队

大招是什么?很多猜测。

不妨先从褚霸的发展来看。1997年毕业之后,在几家大公司呆过之后,一直喜欢“各种折腾”的褚霸创业了三次:做软硬件结合的报警器,开发类似网银的互联网金融系统,类似于P2P做PPStream的看视频的产品。每次都是产品很牛,但因为资金支持、市场投放等因素都没成功。所以他对自己的总结是:“这不是我擅长的,我的定位点是踏实做技术。”

2010年,看到正明(章文嵩)这么一个社区大牛来到了阿里,他也随之而来。来到RDS团队后,带领着10余人的团队,真正把技术钻研透彻,解决了当时许多棘手的问题。渐渐的技术氛围好了,业务也好了,瓶颈也被打开了,口碑自然就起来了。很多同学转岗过来,大量牛人进来,人才的聚集使得技术推动业务,业务反馈技术优化的正循环开始形成。业务的井喷自然会推动团队将技术研究到精细化,做的更好,能力在实战中得到锻炼,技术人员自然会高速成长。团队不知不觉扩到了40多人,后来更是接近了100人。现在,产品和服务还在不断增加中,现在提供了包含MySQL,SQLServer,PostgreSQL,PPAS,MongoDB,Memcache,Redis,PB级数据库存储分布式数据库,数据传输,数据管理等在内的众多云数据库服务。

实际上,社区TOP 10数据库里面有6种阿里云已经在支持或者兼容了。“我常想,数据库最核心的竞争力就是它是数据库引擎,相当于汽车的发动机。所以我们和竞品做评测比试,性能、稳定性等,都是其他家的1-2倍。用户这么评价我们,数据库性能如丝般柔顺。与此同时,数据库引擎近些年会有颠覆性引擎,比如Tokutek的TokuDB(MySQL开源存储引擎),比如图数据库,所以我们还要紧跟这些技术变化,跟着大社区趋势来走。当然,还有利用集团的力量,OB(OceanBase)中的突破技术更好地应用在我们数据库中,来提升整体竞争力。”

褚霸曾对ATA记者说:“因为不擅长管理,所以我会花更多时间来引导大家如何来学习,怎么去有追求,怎么去开阔技术视野,给他们更多空间,放权给他们,这样他们自己也是自信满满的,能够按自己的爱好、兴趣、专长,去做自己专长的事情。那我只需要在关键节点上去看住,保证团队往前跑的不摔,然后陪着大家,这样我觉得会顺点。”他是如此说,也是如此做的。最初几年,常常半夜和同学们一起发布系统,他相信陪伴也是一种力量。

有很多同学都看过褚霸的技术博客。但对于博客分享,他有切身感触。“其实我是最恨记笔记的那种人,上学的时候从来不记笔记。但后来我钻研很多技术,2-3年后有人问我,我再去想的时候只能记得这件事情做过,但细节已经完全想不起来。而以前认识一个小伙子,喜欢写博客,基本就是当成笔记来做的。以后再遇到问题,让别人翻翻博客就好。我觉得这样方法很好,在我们研究过程中,有很多收获,很多耐不住开心想要分享的。所以我也学习他,最初写的很烂,只有2-3行,也有是炫耀性的。而后来,我花几个小时或者几天解决的问题,也帮助了无数遇到这些问题的朋友,让大家都少花一些时间。积累400-500篇后,影响很大,比如学Erlang的人几乎没人没看过我的博客。你可能做小小的一个事情,但是可以帮到很多人,那这种带来的不单单是技术上的,有很满足的感觉,从07年坚持到现在的一种习惯。”

阿里数据库一直积极拥抱社区并与社区互动,比如是好几个分支的committer,WebScaleSQL也是核心成员,一直都是第一队列。甚至还有几位同学会不断追踪社区变化。以后,褚霸对云栖社区说:“还可以做更多。”

豪华阵容亮相云栖大会深圳峰会

做更多?先剧透,具体留给大会现场。

在褚霸看来:数据时代的到来使得用户对数据库的需求非常复杂。一方面,数仓、计算、分析、搜索等需求,需求在自然延伸;另一方面,数据积累越来越多,历史归档需求希望获得低成本技术服务。“这些都是我们后续要重点满足的。事实上,我们在新产品方面已经非常克制。比如GreenPlum是为了搭建数据仓库计算环境,PataData(阿里自研)是为了解决PB级别数据底层存储的问题,而MongoDB从3年前开始关注,到现在正式面向用户,时间是很长的。2015年的公测产品较多,但今年会将节奏收回来,走向更深应用层面。比如安全合规方面做更多,6月份安全特性会全面超越竞品。”

这意味着,今年会主做“硬骨头”项目,让产品和服务体现更大的价值。

背后必然是团队人才的阶梯性变化。谈到人才招聘和培养,他的观点非常鲜明:不在于数量,而在于质量。“够不够屌?一人扛起产品的半壁江山”。现在团队进来的都是高P。有位Oracle专家收到很多offer,但当听说阿里云数据库在某个他感兴趣的技术领域会深挖,他立即表示如果收入只有一半也愿意过来。所以这些人才不完全是看待遇的,而是看技术方向。这个例子也说明了阿里云数据库团队的人才布局:更好的人才做核心的事情,流水线的事情会逐步交给生态伙伴来做。

如何建立数据库的生态?起点就是云栖大会深圳峰会的数据库分论坛。这是论坛的议程:

4月19-21日,2016云栖大会深圳峰会,欢迎报名!

涵盖技术趋势、DBA转型、源码维护和运维、优化和故障排查等技术人最为关注的热点。更多干货将由阿里云数据库团队骨干现场分享。当然,如果想与阿里云数据库专家们有更多交流,欢迎来云栖社区数据库公众号,他们都在这里。

相关推荐

详解DNFSB2毒王的各种改动以及大概的加点框架

首先附上改动部分,然后逐项分析第一个,毒攻掌握技能意思是力量智力差距超过15%的话差距会被强行缩小到15%,差距不到15%则无效。举例:2000力量,1650智力,2000*0.85=1700,则智力...

通篇干货!纵观 PolarDB-X 并行计算框架

作者:玄弟七锋PolarDB-X面向HTAP的混合执行器一文详细说明了PolarDB-X执行器设计的初衷,其初衷一直是致力于为PolarDB-X注入并行计算的能力,兼顾TP和AP场景,逐渐...

字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强

梦晨发自凹非寺量子位|公众号QbitAI字节最新深度思考模型,在数学、代码等多项推理任务中超过DeepSeek-R1了?而且参数规模更小。同样是MoE架构,字节新模型Seed-Thinkin...

阿里智能化研发起飞!RTP-LLM 实现 Cursor AI 1000 token/s 推理技术揭秘

作者|赵骁勇阿里巴巴智能引擎事业部审校|刘侃,KittyRTP-LLM是阿里巴巴大模型预测团队开发的高性能LLM推理加速引擎。它在阿里巴巴集团内广泛应用,支撑着淘宝、天猫、高德、饿...

多功能高校校园小程序/校园生活娱乐社交管理小程序/校园系统源码

校园系统通常是为学校、学生和教职工提供便捷的数字化管理工具。综合性社交大学校园小程序源码:同城校园小程序-大学校园圈子创业分享,校园趣事,同校跑腿交友综合性论坛。小程序系统基于TP6+Uni-app...

婚恋交友系统nuiAPP前端解决上传视频模糊的问题

婚恋交友系统-打造您的专属婚恋交友平台系统基于TP6+Uni-app框架开发;客户移动端采用uni-app开发,管理后台TH6开发支持微信公众号端、微信小程序端、H5端、PC端多端账号同步,可快速打包...

已节省数百万GPU小时!字节再砍MoE训练成本,核心代码全开源

COMET团队投稿量子位|公众号QbitAI字节对MoE模型训练成本再砍一刀,成本可节省40%!刚刚,豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。COMET已应用于字节...

通用电气完成XA102发动机详细设计审查 将为第六代战斗机提供动力

2025年2月19日,美国通用电气航空航天公司(隶属于通用电气公司)宣布,已经完成了“下一代自适应推进系统”(NGAP)计划下提供的XA102自适应变循环发动机的详细设计审查阶段。XA102是通用电气...

tpxm-19双相钢材质(双相钢f60材质)

TPXM-19双相钢是一种特殊的钢材,其独特的化学成分、机械性能以及广泛的应用场景使其在各行业中占有独特的地位。以下是对TPXM-19双相钢的详细介绍。**化学成分**TPXM-19双相钢的主要化学成...

thinkphp6里怎么给layui数据表格输送数据接口

layui官网已经下架了,但是产品还是可以使用。今天一个朋友问我怎么给layui数据表格发送数据接口,当然他是学前端的,后端不怎么懂,自学了tp框架问我怎么调用。其实官方文档上就有相应的数据格式,js...

完美可用的全媒体广告精准营销服务平台PHP源码

今天测试了一套php开发的企业网站展示平台,还是非常不错的,下面来给大家说一下这套系统。1、系统架构这是一套基于ThinkPHP框架开发的HTML5响应式全媒体广告精准营销服务平台PHP源码。现在基于...

一对一源码开发,九大方面完善基础架构

以往的直播大多数都是一对多进行直播社交,弊端在于不能满足到每个用户的需求,会降低软件的体验感。伴随着用户需求量的增加,一对一直播源码开始出现。一个完整的一对一直播流程即主播发起直播→观看进入房间观看→...

Int J Biol Macromol .|交联酶聚集体在分级共价有机骨架上的固定化:用于卤代醇不对称合成的高稳定酶纳米反应器

大家好,今天推送的文章发表在InternationalJournalofBiologicalMacromolecules上的“Immobilizationofcross-linkeden...

【推荐】一款开源免费的 ChatGPT 聊天管理系统,支持PC、H5等多端

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!项目介绍GPTCMS是一款开源且免费(基于GPL-3.0协议开源)的ChatGPT聊天管理系统,它基于先进的GPT...

高性能计算(HPC)分布式训练:训练框架、混合精度、计算图优化

在深度学习模型愈发庞大的今天,分布式训练、高效计算和资源优化已成为AI开发者的必修课。本文将从数据并行vs模型并行、主流训练框架(如PyTorchDDP、DeepSpeed)、混合精度训练(...

取消回复欢迎 发表评论: