资讯中心

这里有你想要的最新资讯与动态
当前位置:首页>资讯>腾讯云开源AI Agent记忆系统大幅降低Token消耗

腾讯云开源AI Agent记忆系统大幅降低Token消耗

【2026-05-14】

腾讯云数据库团队近日正式开源了一套名为“tencentdb agent memory”的AI Agent记忆引擎,这一系统主打本地优先的记忆管理架构,旨在解决大模型在复杂任务中长期记忆缺失与上下文成本过高的问题。随着AI Agent逐渐走向多工具协作与长流程执行,该类基础能力的优化正在成为行业关注重点,此次开源也被视为工程化落地的重要一步。

从具体设计来看,这套系统的核心思路是将“记忆”拆分为不同层级进行管理,并在本地完成高效存储与检索。其底层默认采用SQLite结合sqlite-vec作为向量数据库后端,以降低部署复杂度并提升本地运行效率。同时,它支持通过OpenClaw插件以及Hermes Gateway进行扩展接入,使其能够适配不同Agent框架。在结构划分上,系统将记忆明确分为长期与短期两类:长期记忆负责保存对话原文、原子化事实、场景分块以及用户画像等关键数据;短期记忆则聚焦任务执行过程,例如工具调用日志会被外置到refs文件中,同时借助mermaid图谱对任务结构进行可视化记录。

值得注意的是,在接入OpenClaw后,该系统在实际任务中的表现提升较为明显。根据测试数据,在widesearch任务场景下,token消耗从221.31万大幅下降至85.64万,降幅超过六成,同时任务通过率提升超过50%。在长期记忆评测personamem中,准确率也从48%提升至76%。这些数据意味着系统不仅在成本控制上更高效,同时在复杂语境下的理解能力也有明显增强。一个明显变化是,Agent在处理长链路任务时,不再依赖单一上下文窗口,而是通过结构化记忆实现多层信息调用。

从行业背景来看,AI Agent的发展正逐渐从“能回答问题”转向“能完成任务”。在这一过程中,记忆能力成为制约体验与成本的关键因素之一。传统大模型依赖上下文窗口堆叠信息,但在多轮工具调用、长任务执行场景中,这种方式很快会导致token成本激增,同时信息衰减问题也愈发明显。因此,越来越多厂商开始探索外部记忆系统或模块化记忆架构,以实现更稳定的长期任务执行能力。

类似的探索在业内并不罕见。例如部分开源Agent框架已经引入向量数据库或知识图谱来增强记忆能力,也有项目尝试将任务日志结构化存储,以降低重复推理成本。不过多数方案仍处于实验或半成品阶段,在一致性、可扩展性以及工程落地层面仍存在挑战。腾讯云此次选择以“本地优先+结构化拆分”的方式推进,并将其与数据库底层结合,体现出更偏工程化的路线,而非单纯算法层优化。

从整体趋势来看,AI基础设施正在进入“记忆工程化”阶段。过去行业更多关注模型参数规模与推理能力,而现在逐渐转向如何让模型在复杂任务中“记得住、用得起、调得快”。这一转变也意味着,围绕Agent的竞争将不再局限于模型本身,而是扩展到记忆系统、工具链以及执行框架的整体效率。

综合来看,tencentdb agent memory的开源不仅是一次产品级发布,更像是对AI Agent基础架构的一次重新拆解。随着类似系统逐步成熟,未来Agent在长任务执行与多工具协作中的成本有望进一步下降,而其应用场景也可能从实验性扩展到更广泛的生产环境。短期来看,这类结构化记忆方案仍处于快速演进阶段,但长期趋势已经较为明确,即AI系统将越来越依赖外部化与分层式记忆来支撑复杂智能行为。

新用户领取高达 50 USDT 数字货币盲盒
立即创建账号,开始交易!


创造币安账号
本站为您提供币安交易所官网的注册地址、加密货币及区块链的科普文章以及行业资讯等内容,文章及观点不构成投资意见。