阿里云李飞飞:大模型Token调用激增百倍,首提AI原生数据库硬标准

AGI
李飞飞直言,“今天有些数据库厂商已经喊出AI Native(AI原生)数据库,我不认为现在任何人做到了所谓的AI Native。”

图片来自AI生成

图片来自AI生成

“现在谁喊AI Native(AI原生)数据库,谁就是‘大跃进’。” 阿里云资深副总裁、数据库产品事业部负责人李飞飞如此表示。

AI浪潮正以前所未有的力度,重塑数据库。过去数据库的核心任务是存得住、查得快、事务不出错,大模型到来之后,企业亟需一个能统一处理多模态数据,并能与大模型高效协同的新型数据基础设施,这个有着数十年历史的基础软件市场,正在被大模型悄然改变。

云厂商的主流做法是,在其云原生数据库底座上,快速集成向量检索、模型调用等AI能力,强调平滑升级、成本优势和对海量现有客户的延续性。而新兴势力则更倾向于讲述原生AI的故事,主张为AI工作负载从头设计存储、查询与计算架构,以获取极致的性能与灵活性。

这种对比颇有些类似AI芯片行业数年前的故事,AI芯片创业企业试图实现打造专用芯片,以实现更高的性能和更好的性价比,挑战英伟达。但是,大模型的快速演进使得那些定向优化失效,反而是更具备通用性的英伟达GPU,持续保持市场统治力。

李飞飞直言,“今天有些数据库厂商已经喊出AI Native(AI原生)数据库,我们还是实事求是,不想那么喊,因为AI赛道本身还在快速演进,我不认为现在任何人做到了所谓的AI Native。”

什么才算是真正的AI Native(AI原生)数据库,李飞飞提出了自己判断 AI 原生数据库的两项标准:超一半的数据库实例由 AI Agent(智能体)直接驱动使用;超一半的数据库输出是Token。当前尚属于向AI原生数据库演进的过渡阶段。

数据库的行业逻辑,变了

“未来一段时间,人工智能行业的瓶颈可能不再是算力,而是数据和存储。”李飞飞表示,在人工智能向超级智能(ASI)演进的路径上,经典的“内存墙”问题以新的形式回归,近期DRAM等存储硬件价格大幅上涨,正是这一趋势的体现。

存储涨价是行业变革的一个缩影,真正的推力是由大模型掀起的、重塑整个产业链的合力。AI时代的数据是文本、图片、音频、视频、向量、图结构等,传统数据库只擅长前两种的一小部分,现在要同时处理结构化 + 半结构化 + 非结构化 + 向量化表达,数据库向多模态的融合数据库演进。

李飞飞认为,从学习人、辅助人到自我迭代超越人,大模型正在吞噬一切冷数据和温数据,将其压缩为模型参数。然而,企业业务系统中实时产生的“热数据”(Hot Data),因其动态变化、高频更新的特性,短期内无法被大模型完全内化。

“热数据才是维持智能引擎运转的高价值燃料。”李飞飞强调,将高质量、实时的私域热数据,与通用的、具备强大认知能力的大模型有机结合,是实现“辅助人”到“超越人”的关键。而最佳的化学反应发生地,正是数据库内部。

为此,阿里云在过去两年将PolarDB从一个云原生数据库,快速演进为一个 “AI就绪的云原生数据库”。其核心理念是:将大模型能力嵌入数据库,让智能交互在数据实时产生的地方发生,数据不必来回搬运,也更好地保障了数据主权与隐私安全。

和过去不同的是,数据库厂商要同时懂数据和模型。传统数据库团队强在系统工程,AI 团队强在模型算法,但 AI 时代的数据库,需要两者深度融合,这不是加几个向量索引就能完成改造,而是架构层面的改变,为此阿里云也很早和百炼团队合作,但是一年前,当李飞飞宣布打通百炼时,外界还有疑问,并不完全理解阿里云的意图。

“现在回头看,绝对是轻舟已过万重山。在过去的短短几个月内,通过阿里云瑶池数据库产品体系(包括云原生数据库PolarDB、云原生数据仓库AnalyticDB、云数据库RDS等)调用百炼、PAI及内置模型算子服务所消耗的Token量,增长了超过100倍。”李飞飞说。

阿里云数据库的“4+1”行动

一位数据库产品负责人对笔者表示,业界对 “AI 原生” 的理解确实存在差异。“有的认为深度集成向量计算和模型调用就是原生,有的则认为需要从存储引擎到查询优化器为 AI 工作负载彻底重写。”

另一位行业分析师则认为,定义权之争的背后是技术路线与市场卡位的双重博弈。“原生“这个词本身就意味着代际优势和市场洗牌的机会。没有厂商愿意在此时落后于叙事。

李飞飞表示,AI原生数据库是技术演进的必然方向。从云原生到AI就绪、再到AI原生,现阶段阿里云PolarDB正在打造AI就绪的云原生数据库。

从云原生到“AI就绪”,阿里云提出了一个“4+1”的核心演进框架。首先,是存储层走向AI数据湖库(Lakebase)。传统数据库擅长处理结构化数据,而AI时代需要处理文本、图像、视频等多样化数据。多模态AI数据湖库(Lakebase)架构融合了数据库与数据湖的能力,成为支持多模态数据处理、特征提取与检索的第一步。

其次,是统一的元数据管理,AI时代的数据源爆炸性增长,且格式高度异构,元数据本身的规模已从过去的兆字节跃升至太字节级别。阿里云将Zero-ETL技术应用于元数据层,实现了数据源变更时元信息的实时自动同步,高效治理海量异构数据。

第三,是多模态检索与处理能力,数据库需从单一的结构化查询,演进为能同时支持向量、全文、图等多种检索方式的融合引擎,实现对非结构化数据的深度理解与利用。

第四,是模型算子化与Agent AI的原生支持。大模型虽能“吞噬”冷、温数据,却无法实时消化业务系统中持续产生的“热数据”,将模型推理能力以“算子”形式内置到数据库,让大模型能直接、实时地与高价值热数据互动,让Token的消耗变得场景化、有价值。同时,数据库必须成为AI Agent开发、部署和运行的最佳平台,因为未来大量的数据库交互将由自主Agent完成。

最后的“+1”,是跟上硬件创新步伐。经典的“内存墙”问题在AI时代重新凸显,内存等硬件成本正进入长期上涨周期。数据库系统必须充分利用CXL内存池化、异构计算(CPU/GPU)统一调度等硬件级创新,通过池化、共享与弹性来化解成本压力,将硬件红利转化为用户价值。

为什么是 “50%”?

尽管阿里云试图为AI原生数据库设立高门槛,但市场并未等待共识达成。过去一年,包括谷歌云、Snowflake、微软,以及国内的腾讯云、字节跳动火山引擎、蚂蚁集团 OceanBase 等,都已将 “AI 原生” 或 “AI 增强” 作为数据库产品的核心卖点。

各家路径虽有不同,但共识相近,与大模型服务的深度集成,提供从数据准备、向量化到推理调用的一站式体验,成为竞争焦点。

回到李飞飞所谈的“AI原生数据库“判断标准,“一半实例给 Agent 用”,这关乎谁在主导数据交互,未来企业内大量常规的数据查询、写入、分析任务将由 AI Agent 自主完成,而非人类工程师编写固定代码。

“一半输出是 Token”,传统数据库的核心产出是规整的表格,供给业务系统或分析师。而在李飞飞描绘的图景中,未来的数据库更像一个 “数据与 AI 的融合反应堆”,实时业务数据在此被即时转化为 Token,与内置或外联的大模型进行推理交互,直接产出智能决策、自然语言回答或驱动业务流程。

AI能力之外,行业也格外关注数据库的成本,阿里云数据库产品事业部产品管理与技术架构部负责人王远表示,规模效应始终是释放成本红利的基础。阿里云通过资源池化、多租户间的共享以及极致的弹性伸缩,这三者的共同作用,是在AI时代硬件成本上涨的背景下,确保价格优势的关键。

例如,并非所有数据都需要昂贵的高速存储,PolarDB通过智能化冷热数据分层与调度,自动将数据迁移至高性价比的存储介质,在用户无感的情况下降低存储成本。同时利用CXL等新兴硬件技术,构建超大规模的远端内存池,该池可供多租户共享复用,大幅提升内存利用率,并间接提升CPU利用率,以对冲当前内存价格的快速上涨趋势。

目前,阿里云PolarDB海内外企业客户超2万,部署规模超300万核,覆盖全球86个可用区。PolarDB 云原生与Data+AI相关功能与创新技术已规模化应用于金融、汽车、政务、互联网、电信等领域的核心业务系统,服务了某大型商业银行、理想汽车、小鹏汽车、MiniMax、GoTo集团、度小满、米哈游等知名企业。(本文作者 | 张帅,编辑 | 盖虹达)

转载请注明出处、作者和本文链接
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

快报

更多

2026-01-24 22:18

五粮液:伴随宏观经济持续回升向好等因素,行业将逐渐步入修复期

2026-01-24 22:01

美国因风暴取消超9000个航班

2026-01-24 21:53

比亚迪计划 2026 年向中国以外地区销售 130 万辆汽车

2026-01-24 21:52

银河航天徐鸣:手机直连卫星将引领6G通信革命

2026-01-24 21:35

超一成日本漫画家与插画师因生成式AI收入下滑

2026-01-24 21:10

《2026年综合运输春运安全生产和服务保障总体方案》印发

2026-01-24 20:49

决胜巅峰M7收视率峰值破纪录|独家

2026-01-24 20:08

1月24日新闻联播速览23条

2026-01-24 19:35

宁德时代与闽运集团深化战略合作,共推公共交通全面电动化

2026-01-24 19:16

北京火箭大街六大共性平台启动,助力提升产业国际竞争力

2026-01-24 19:00

特大冬季风暴逼近,预计美国1.7亿人受影响

2026-01-24 18:55

11部门联合开展2026年“春暖农民工”服务行动

2026-01-24 18:52

2025年湖北交通投资首破两千亿元大关

2026-01-24 18:40

云南跨境人民币收付总量突破1000亿元

2026-01-24 18:18

北京市政协去年立案提案1488件,交办提案均已办复

2026-01-24 18:07

胡润发布流量机构百强榜:七成位于杭州、北京、广州、上海、深圳、青岛

2026-01-24 18:00

“西藏江南”林芝2025年接待游客超1700万人次

2026-01-24 18:00

去年境外来穗人员通过境外银行卡和移动支付消费超3500万笔

2026-01-24 17:30

多省份公布去年结婚登记数据:江苏多市去年结婚人数大增,深圳同比增28.54%

2026-01-24 16:57

安徽省脑机接口创新发展大会在蚌埠开幕

扫描下载App

Baidu
map