于2025年举行的那场技术发布会上,蚂蚁集团推出了依靠自身研发的AI原生数据库,这一行为标志着数据库赖以存在发展的技术,从传统上的事务处理系统,往新塑造的智能数据融合阶段迈进了。
此产品是以开源的形式予以发布的,其目的在于为开发者供给一个具备轻量特点、有着高效特性、能够开箱即用的数据底座,只需三行代码就能够迅速构建起知识库或者智能体这类 AI 应用,并且还能够泰然自若地应对百亿级的多模数据检索挑战。
换一个角度来看哈,但要说到技术架构这个层面,这个数据库所具备的核心突破,其实是在于它那种人工智能原生的混合搜索能力。
在处理复杂查询之际,传统数据库常常得借助外部系统,来拼接向量检索,还要进行全文搜索,以及开展结构化查询,如此一来,不但链路冗长,而且容易引发数据一致性方面的问题。
此产品借助其内部装设的“粗排 + 精排”多等级检索机制,使得开发者能够于一个SQL查询里汇聚向量、标量、文本以及空间地理数据的检索条件。
比如说,于金融反欺诈情形里,能够径直开展类似于“查询最近七天交易金额超出五万元、地理位置呈现异常并且行为向量与历史欺诈样本相似度高于90%”的复合式查寻,这般的能力是源于其底层对于多模数据所具备的统一存储模型。
对此数据库而言,就SQL操作以及开发者体验方面,它与MySQL生态相兼容,这表明数百万MySQL开发者能够以零成本进行迁移。
它对用于标量数据操作的标准SQL语法予以支持,与此同时,它还对向量检索的语法糖做了扩展,这就致使进行相似性搜索变得如同使用普通SQL那般简单。
在产品方面,是为那些属于习惯Python生态的AI工程师,提供了与之对应的驱动,而且在兼容性上,能对包含Dify、LangChain等在内,多达30余种的主流AI框架做到全面兼容。
这种有着双轨制特点的接口设计,在极大程度上降低了,AI应用于数据层时的工程复杂性句号。
性能优化是该产品的另一大看点。
它不是单纯地把数据库和AI引擎进行打包,而是在内核的层面展开重构。

它依靠那种成熟的事务引擎,这个数据库保证了在当下进行实时写入高频数据之际,是可以提供ACID事务保证的。
它所采用的混合搜索机制,在检索性能的优化方面,能够于低延迟的状况下,实现召回精度的提升。
例如,在RAG(检索增强生成)这个场景当中,和其同期所开源的“分层记忆架构”相结合,能够在大幅度降低Token消耗(也就是据称多达96%)的情况之下,依旧可以于SOTA评测里头获取较高分数,而这对于那些需要高频次调用大模型API的应用来讲,就意味着明显的推理成本降低变化。
在运维与部署层面,该产品展示了极高的灵活性。
它支持嵌入式这一部署模式,它还支持客户端与服务器这种部署模式,最低仅仅只需要1核CPU,最低单单仅需2GB内存,它能够通过pip命令达成秒级安装,它极为适合在边缘设备当中飞速迭代,非常合用于开发环境作有效变动。
于企业级生产环境里,它能够顺利地融入最为新颖的4.4一体化版本,此版本把TP即事务处理、AP也就是分析处理以及AI能力融合到单一内核之中,还支持分布式扩展以及多云部署。
对于运维人员而言,不再需要去进行多套异构系统的常规维护用以处理不同负载,在此基础上,数据链路得到缩减式简化,权限方面的混乱状况以及存在的延迟风险也随之有所降低。
实际应用案例进一步验证了其技术价值。
于联通这般的通信巨头内部之中,倚靠这数据库的混合搜索能力去构建统一的AI知识库,不但解决了海量私有文档的检索效率相关问题,更为关键的是借助内置的权限体系,达成了细粒度的数据安全管控。
蚂蚁百宝箱运用它那实时在线搜索的能力,让智能体于交互进程里的信息获取精准程度得到了显著的提高。
在历经“双11”那个极限场景锤炼的情况下产生了一款数据库产品,这款产品的代码,以及它的设计理念,在开源社区当中获得了延续。
新启用的.ai域名,这同时也标志着,其战略方向历经了一种转变,从单纯的“数据存储”,朝着“数据理解”的范式进行跃迁。
随着商用LTS版本在2026年初的时候推出,这款产品有希望给全球的开发者提供一个更加普惠以及更加可靠的AI时代数据底座,进而推动数据库技术由“业务支撑系统”切实演变成“AI原生数据入口”。

Comments NOTHING