从王坚的一句,到上万名大学生的赛场:中国数据库的“换道超车”之路

“2010年起不再购买小型机!


大数据产业创新服务媒体

——聚焦数据·改变商业


十多年前,阿里巴巴首席架构师王坚博士这么不经意的一句,像一颗投入湖面的石子,在时任淘宝技术保障部负责人刘振飞心中激起了千层浪。彼时,他刚接过一份预算,其中一项是花费800万采购一台IBM小型机。这在当时的技术圈看来是“标配”,甚至还是颇有性价比的明智之选。

当时,正值中国互联网经济如宇宙膨胀般迅猛增长,淘宝的交易量与数据量正经历指数级攀升。王坚之言的背后是必须要做的产业抉择:如果支撑业务的核心系统--数据库,没有掌握在自己的手中,那么不论是对阿里,还是对中国互联网经济而言,都要面临长期受制于海外巨头的战略风险。

王坚之言就像一把刀子,划开了温室大棚的棚顶,拉开了中国互联网史上波澜壮阔的“去IOE”战役的序幕,也无意间,为中国数据库乃至整个基础软件的自主创新之路,写下了生动的注脚。

时光流转,亲历了国产数据库生死突围的刘振飞,作为北京科技大学的校友站在2025年全国大学生计算机系统能力大赛的现场,看着台上台下充满活力的师弟师妹们,那段激情燃烧的峥嵘岁月,想必会再次涌上心头。

只是这一次,战场已从企业机房转移到了校园赛场

十支队伍会师决赛

北邮夺魁

近日,2025年全国大学生计算机系统能力大赛暨第五届OceanBase数据库大赛在北京科技大学落幕。本届赛事吸引全国高校的1223支队伍、2620名学生参赛。

正如系统能力培养研究专家组成员计卫星教授所指出的,大赛的核心价值在于用 “真实产业问题”牵引教学。这场比赛没有“纸上谈兵”,赛场即战场。

进入到决赛阶段,选手们面对的是与互联网大厂研发团队同等级别的挑战。选手将基于Apache 2.0开源的AI原生混搜数据库OceanBase seekdb,完成两大赛题:一是在有限的硬件资源(8核16G)下,对开源的AI原生数据库OceanBase Seakdb进行内核级调优,目标是让“全文检索+过滤”的混合查询快到极致,同时保证高精度(召回率≥0.95)。二是用自己优化后的数据库,现场搭建一个多模态RAG系统。它不仅要用大模型回答问题,更需要像人一样,具备“思考”与精准检索信息的能力,直击当前AI应用中答案可追溯性与可信度的核心痛点。

在决赛现场,数据猿记者见证了十支队伍的答辩过程。

来自中国数据库领域的专家学者教授和产业界技术专家组成的评委团,与选手展开了技术含量很高的“交锋”。评委们的提问往往直指要害,毫不留情:“当并发请求激增时,你的缓存策略如何避免雪崩?”“你的索引合并算法,在数据持续写入的场景下,性能拐点在哪里?”

能坚持到决赛的队伍,都有着不俗的实力。他们不仅能够沉稳应对这些专业问题,还能偶尔提出让人眼前一亮的创新思路,引得评委频频点头。最终,来自北邮的「编程高手」队凭借其在数据库内核优化与AI应用开发两个维度的综合卓越表现,夺得冠军,并捧回了10万元真金白银的奖金。

据了解,本届大赛特设人才激励机制:特等奖、一等奖、二等奖及三等奖获得者可获OceanBase招聘“绿色通道”,免线上笔试和初面,直通终面。公开信息显示,自2021年以来,已有160余位学生通过校招加入OceanBase,其中20余人通过OceanBase数据库大赛绿色通道入职,实现了从赛场到产业的“无缝衔接”。

数据库从“记账本”向

“数据赋能平台”演进

在这场竞赛中我们还看到了更深层的东西,华东师范大学数据学院教授、CCF数据库专委会主任周傲英的阐述,为这场竞赛注入了更深层的哲学思辨。

他揭示了人们对数据的认知有了一个深刻转变:数据的意义不仅在于它的大和小,它已经成为生产要素,超越技术的范畴,成为经济、社会的范畴。中国人传统上理解数据,重在“以数为据”,作为决策和问责的依据。既然是依据,原则自然是“越少越好,够用即可”,否则就会陷入“过度留痕”的形式主义。然而,当数据在当今时代被明确为关键“生产要素”时,逻辑发生了根本性的逆转——数据变成了“越多越好”,因为其潜在的价值与创新可能性几乎与规模成正比。

“这一转变,彻底重构了数据库的使命。”周傲英指出。数据库不再仅仅是用于“存钱取钱记账”的核心业务记录系统,它必须演进为能够释放数据要素价值的“数据赋能平台”。这场认知革命,正是大数据和AI浪潮带给数据库领域最根本的冲击。

数据库的发展历程是典型的应用驱动创新:从实际问题出发,构建系统,形成抽象,再升华为理论,从而实现业务、技术与理论三者的协同演进。周傲英回忆,当年大数据概念出现时,数据库领域许多学者和从业者起初是排斥甚至愤怒的,认为从抽象的层次来看这是一种倒退。经过一段时间的反思,他们才逐渐意识到问题所在:过去数据库领域总试图用一个系统解决所有问题,而实际上,不同的应用场景需要不同的系统支撑。

“我们依然在做抽象,但不再追求‘一刀切’,而是针对一类应用,构建最适合它的系统。这或许正是大数据时代给我们上的最重要的一课。”

伴随着认知的革新,数据库技术本身也经历了一场深刻的形态演进。周傲英乐观的认为,数据库在未来将扮演更加重要的角色,其关键在于互联网和人工质量带来的应用大爆发。为应对海量数据与高并发,分布式数据库应运而生;为追求极致的处理速度,并行数据库不断演进;为保证业务不间断,高可用数据库持续发展;为满足实时决策需求,实时数据处理系统蓬勃兴起。这些都不是凭空产生的,而是应用需求与技术能力相互推动、共同进步的结果。

云计算的普及,进一步从底层改变了数据库的部署和使用方式。数据库不再仅仅是独立部署的软件,越来越多的系统设计之初就是基于云原生的。云原生数据库或数据平台的核心使命,正是将数据库技术大众化——通过云服务的方式,降低使用门槛,让每个人、每个组织都能便捷地获取和使用数据能力。这标志着数据库从一个由专业DBA掌控的“高级工具”,真正成为了普适化的基础设施。

他表示,展望前路,中国数据库乃至整个基础软件的发展,必须秉持彻底开放的理念:构建开放的架构,以开源的方式协同推进,并始终保持开明的心态。我们决不能固守过去的任何成功范式,被传统数据库时代的辉煌所束缚。在经历了大数据与AI的剧烈冲击与洗礼后,更应以最大的开放姿态,拥抱这个技术范式迭变的时代。

对此,刘振飞深有共鸣。

一场技术自主自强的接力赛

刘振飞在现场,回顾了阿里巴巴去IOE那段激动人心的历史细节。这些故事今天听起来,依然令人振奋。

他回忆,到了2013年,“去IOE”已经从王坚之问成为了技术团队的共识。那年最关键的任务,是把支付宝的传统商业数据库给替换掉。6月份,第一台小型机正式下线,团队还去机房搞了个小小的仪式。说到这,刘振飞还提到了一个有趣的细节,“有意思的是,负责这件事的很多同学,都很年轻。但正是有了阿里的这个业务战场练手,他们才有机会成长为真正的技术骨干。”

这件事对团队和公司产生了极大的振奋。支付宝当时还发了一条微博作为纪念:“再见,亲爱的小型机”。产业的蝴蝶效应自此开始产生,没多久,IBM中国就传出裁员的消息了。

现在回头看,“去IOE”能做成,有几个关键因素:

一是业务倒逼。当时,淘宝和支付宝的业务量每年翻着倍涨,传统架构根本扛不住,成本也受不了。这是最现实的驱动力。

二是技术信仰。相比较技术能力,更大的挑战在于改变人的观念。在几乎处于空白的领域,有敢于超越国外最先进技术的勇气,是需要一定的信仰支撑的。

三是用时间换空间。不要一开始就动核心交易系统,从边缘业务做起,做出标杆,树立信心,再逐步推进。

四是时代给了机会。那几年,PC服务器性能快速提升,SSD硬盘开始普及,开源生态日渐成熟,让我们有了“换道”的可能性。

五是双11这个“练兵场”。每年双11的流量洪峰,逼着技术系统快速迭代。2009年,淘宝每秒只能处理400笔订单,支付宝每秒处理200笔支付;到了2018年,这个数字变成了几十万笔。没有自主技术,根本不可能实现。

“去年我看到Oracle创始人拉里·埃里森的一次采访,他说:‘我们不能让中国培养出比美国还多的工程师。’”刘振飞坦言,“这句话听起来带有竞争色彩,但反而让我更坚信,我们这条路走对了。真正的技术自主,不是关起门来搞发明,而是在中国这片拥有世界上最复杂、最宏大应用场景的土地上,解决真实世界提出的难题,并在过程中锤炼出一支能打硬仗的队伍。”

他最后引用了恩格斯说过一句话:社会一旦有技术上的需要,这种需要就会比十所大学更能把科学推向前进。

从王坚那句石破天惊的话,到如今上万名大学生的技术竞赛。数据库自主自强的这条路,始于强烈而真实的应用需求,兴于开放协同的开源生态,成于一代代技术人的接续奋斗。而这场发生在校园与产业之间的接力,正是这条路上最富活力、也最具希望的风景。

就像今天这场竞赛,从校园到产业的距离,其实并不远。那些在数据库自主创新道路上,刻下丰碑的人,很多也都是刚褪去校园的稚嫩,在时代需求和产业革命的历史机遇下,走上了前台。

大会现场,评委们严格发问的场景,恍惚间让人产生一些联想。有时候,改变历史的,可能就是一个正确的问题,在正确的时间,被正确的人提了出来。

从未来回看今天,决赛现场的一些发问,也许已经在某些同学心中激荡起了涟漪。

文:俊驰 / 数据猿
责编:凝视深空/数据猿

☆往期好文推荐☟

当AI开始卖广告,一个万亿市场正在浮出水面

AI教父也折戟?李开复妥协,道出AI创业的难

智启新十年,数聚新未来|第八届金猿大数据产业发展论坛圆满落幕

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1213966.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

语音情感数据集构建:SenseVoiceSmall自动标注实战教程

语音情感数据集构建:SenseVoiceSmall自动标注实战教程 1. 为什么需要语音情感数据集? 你有没有遇到过这样的问题:想训练一个能听懂情绪的客服语音系统,却卡在第一步——找不到带情感标签的语音数据?市面上公开的情感…

自动驾驶仿真:SGLang处理多模态指令初探

自动驾驶仿真:SGLang处理多模态指令初探 在智能座舱与自动驾驶仿真测试中,一个常被忽视却至关重要的环节是——如何让大模型真正“看懂”车载屏幕、理解用户自然语言指令,并精准驱动设备执行操作。传统LLM服务仅支持纯文本交互,面…

基于深度学习的船舶检测系统

目录深度学习的船舶检测系统概述关键技术方法典型应用场景性能优化方向源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!深度学习的船舶检测系统概述 深度学习在船舶检测领域通过计算机视觉技术实现对船舶目标的自动识别、定位与跟踪&am…

Unsloth兼容性测试:支持哪些主流模型?

Unsloth兼容性测试:支持哪些主流模型? 在大模型微调领域,选择一个既高效又兼容性强的框架,往往决定了项目能否顺利落地。Unsloth自发布以来,凭借“2倍训练速度、70%显存降低”的硬核指标迅速获得开发者关注。但很多用…

GPT-OSS怎么接入应用?API调用避坑指南

GPT-OSS怎么接入应用?API调用避坑指南 你是不是也遇到过这样的情况:好不容易找到一个开源大模型,部署成功了,网页界面也能跑通,可一到写代码调用API,就卡在报错、超时、格式不对、鉴权失败上?尤…

YOLOv10官版镜像集成TensorRT,速度提升2倍

YOLOv10官版镜像集成TensorRT,速度提升2倍 在目标检测工程落地的实战中,一个反复出现的矛盾始终存在:模型精度越来越高,但推理延迟却成了卡脖子环节。YOLOv10的发布本已带来端到端架构的重大突破——它彻底摆脱了NMS后处理依赖&a…

AI助力Excel:一键生成随机数范围的高级技巧

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Excel工具,能够根据用户输入的最小值和最大值,自动生成指定数量的随机数。要求:1. 使用Excel公式RANDBETWEEN()实现基础功能&#xff1…

Google AI Studio:AI辅助开发的新利器

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 使用Google AI Studio的AI模型辅助开发一个Python脚本,实现自动化数据清洗功能。要求:1. 输入为CSV文件路径;2. 自动识别并处理缺失值、异常值&…

Sambert语音水印添加:版权保护合成部署教程

Sambert语音水印添加:版权保护合成部署教程 1. 开箱即用的多情感中文语音合成体验 你有没有遇到过这样的问题:辛辛苦苦生成了一段高质量的中文语音,结果被别人直接拿去商用,连个署名都没有?或者在做有声内容分发时&a…

美女教你Python:效率提升10倍的AI编程技巧

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个Python编程效率对比演示应用,要求:1) 展示传统方式编写Python代码的过程 2) 展示使用AI辅助生成同样功能代码的过程 3) 统计并可视化两种方式的时间…

AI如何自动修复Windows驱动错误代码31?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个AI驱动的Windows驱动修复工具,能够自动检测系统日志,识别错误代码31的根源,提供修复方案。功能包括:1) 扫描系统驱动状态 2…

SEALOS vs 传统部署:效率提升的五大关键点

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个对比分析工具,展示SEALOS与传统部署方式在效率上的差异。工具应包含以下功能:1. 部署时间对比;2. 资源利用率对比;3. 运维复…

SGLang如何简化LLM编程?亲身试用告诉你

SGLang如何简化LLM编程?亲身试用告诉你 你有没有写过这样的代码:为了实现一个带条件分支的多轮对话,要手动管理历史消息、拼接prompt、处理JSON格式约束、反复调用API、再做后处理校验——最后发现,80%的代码其实在和框架“搏斗”…

零基础也能用!YOLOv9官方镜像快速部署实战指南

零基础也能用!YOLOv9官方镜像快速部署实战指南 你是不是也经历过这些时刻: 下载完YOLOv9代码,卡在环境配置上——CUDA版本对不上、PyTorch装错、torchvision报错; 好不容易跑通demo,想换自己的一张图测试,…

AI一键生成Docker-Compose配置,告别手动编写烦恼

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 请生成一个完整的docker-compose.yml配置,包含以下服务:1) Nginx作为反向代理监听80端口 2) Node.js应用运行在3000端口 3) MongoDB数据库带持久化存储 4) …

如何用AI辅助R-Studio数据恢复?智能修复新方法

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个AI辅助的R-Studio数据恢复增强工具,能够自动分析磁盘损坏模式,智能推荐最佳恢复策略。功能包括:1)自动扫描并分类损坏类型 2)基于历史案…

实测cv_resnet18_ocr-detection:单图检测3秒出结果太高效

实测cv_resnet18_ocr-detection:单图检测3秒出结果太高效 1. 这个OCR检测模型到底有多快?实测数据说话 你有没有遇到过这样的场景:手头有一张发票、一份合同或者一张产品说明书,急需把上面的文字快速提取出来,但打开…

5分钟用QWEN-AGENT打造你的第一个AI应用原型

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 使用QWEN-AGENT快速生成一个AI聊天机器人的原型,要求:1. 支持基本的问答交互;2. 能够理解并回应用户的简单问题;3. 提供对话历史记录…

为什么选BSHM做批量人像处理?效率说话

为什么选BSHM做批量人像处理?效率说话 你有没有遇到过这样的场景:运营团队突然要上线300张商品详情页,每张都需要把模特从原图中精准抠出来,换上纯白背景;设计部门紧急需求50组社媒海报,人物需无缝融入不同…

如何用AI辅助在VMware Workstation中快速搭建开发环境

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个AI辅助工具,能够根据用户选择的开发语言(如Python、Java、Node.js等)和框架(如Django、Spring、React等)&#…