本文由 RTE 开发者社区成员通过社区网站投稿提供,如果你也有与实时互动(Real-Time Engagement,RTE)相关的项目分享,欢迎访问网站 rtecommunity.dev 发布,优秀项目将会在公众号发布分享。

目录

什么是 AI 记忆?

AI 记忆的类型

短记忆 vs. 长记忆

User Memory vs. Agent Memory:两种记忆,两种侧重

记忆 vs. RAG:到底有什么区别?

为什么 AI 应用需要记忆?

现在的长记忆方案有哪些?

记忆设计机制对比

现有记忆方案的常见问题

Memobase:为 AI 原生应用打造的长记忆解决方案

为什么选择 Memobase?

Memobase 的核心功能

Memobase 的应用场景

大模型厂商的记忆服务 vs. 第三方提供商如 Memobase,该如何抉择?

🚀 即刻启程,为你的 AI 产品注入长记忆

你是否也曾对 AI 聊天产品的 “健忘症” 感到抓狂?聊了几句之后,它就忘了你是谁或者聊过什么?又或者,你正在开发一款 AI 应用,希望能加入 长期记忆功能 ,却不知从何下手?

其实,现在的很多 AI 产品团队都面临着同样的问题。如今大多数 AI 应用大多缺乏长期记忆,导致用户体验冷冰冰的、缺乏人情味。

Memobase 正是为了解决这个问题而生的:作为一个开源的记忆解决方案,我们希望可以彻底改变 AI 应用记忆和理解用户的方式,让你的 AI 产品可以提供更贴心、更温暖、更懂你用户的互动体验。

在这篇文章中,我们将探讨:

什么是 AI 记忆?

简单来说,AI 记忆可以看作是 AI 当前有限上下文的一种拓展。在产品的整个生命周期中,用户或者 agent 可能会产生海量的数据,甚至达到数百万到数千万条,然而 AI 大模型能够处理的上下文是有限的,通常在 8K 到 128K tokens。这就意味着,仅靠 AI 自身的上下文处理能力,是无法完全应对如此庞大的数据量的。

因此,为了实现产品的完整功能,就需要引入一些额外的机制。例如,现在比较常见的对话 session 机制,就是通过重新开启对话窗口来清空之前的对话内容。但这种方式在一定程度上会导致信息的丢失。

AI 记忆的核心目标是在尽量减少信息损失的前提下,让产品能够容纳的上下文近乎无限。它就像是为 AI 打开了一扇通往更广阔数据世界的大门,使得 AI 能够更好地处理和利用海量数据,从而提升产品的性能和用户体验。

AI 记忆的类型

短记忆 vs. 长记忆

短记忆:就像电脑的内存,负责存储当前对话中的信息,帮助 AI 理解用户的实时意图。例如,用户问 “第二个选项怎么样?”,AI 需要记住之前讨论过的选项才能给出合适的回答。

短记忆的特点:

长记忆: 就像电脑的硬盘,负责存储用户的身份、偏好、历史互动等信息,让 AI 产品能够像个知己一样,在每一次互动中都能更贴心更有温度。例如,AI 可以记住用户喜欢简单的解释,在某些事情上遇到过困难等等。

长记忆的特点:

User Memory vs. Agent Memory:两种记忆,两种侧重

AI 的记忆系统可以针对两个对象设计:User MemoryAgent(智能体)Memory 。它们的功能各不相同,但目标都是提升用户体验。

User Memory:理解用户,建立 “个人档案”

用户记忆的重点是围绕每位用户建立详细档案,从而记住他们的偏好、个性化需求和关键事件。

组成部分

示例代码:

const userMemory = {    profile: {        learningStyle: 'visual',        technicalExpertise: 'beginner',        preferredExamples: 'real-world'    },    events: [{date: '2025…', emotion: 'happy', learn: 'Memobase, a user-profile memory backend…'},{date: '2025…', emotion:...}    ]};

适用场景: 需要高度个性化体验的应用,尤其是 2C 的应用,比如教育,笔记,陪聊,虚拟伴侣,游戏等泛娱乐类的应用。

Agent Memory: 则侧重于 AI Agent 自身的学习与能力发展。它相当于为 AI 构建自己的记忆库,包括比如:

示例代码如下:

const agentMemory = {    personality: {        communicationStyle: 'friendly_professional',        expertiseAreas: ['technical_support', 'onboarding'],        responseFormat: 'step_by_step'    },    skills: {       Github_PR_Merge: 'When I merge a PR, I should use rebase rather than merge…',       Buy_Flight_Tickets: 'I should first search for the starting location and landing location on Google, then select booking.com because I have the permission to …'    }};

Agent memory 更倾向于优化工作流程,适合生产力、服务与自动化类应用,例如客服机器人,生产力工具和智能助手。

记忆 vs. RAG:到底有什么区别?

严格来说,记忆是 RAG(Retrieval-Augmented Generation)的一个子集。两者都需要从外部提取信息并融入到 AI 的生成提示中,但它们的应用场景和目标差异明显。

核心区别:

1.规模和范围

2.信息密度

3.检索方式

如何选择?

总之,RAG 和记忆并不是非此即彼的互斥关系,而是互补的工具。RAG 解决的是广泛的知识检索问题,而记忆的目标是让 AI 具备贴心的个性化互动能力。如果你想打造一款能记住用户需求、提供真正个性化服务的 AI 应用,记忆无疑是不可或缺的一环。

一个简化的知识分层框架

为了更好地理解记忆和 RAG 的区别,我们可以将知识分为三个层次:

啥时候用 RAG?

如果你的应用需要在大型知识库中进行精确搜索,例如公司内部维基、技术文档或大量数据集,那么 RAG 会是你的首选。

啥时候用记忆?

如果你关注的是长期交互,尤其是信息密度较低的对话数据(例如,总结一系列聊天),那么记忆是更好的选择。

为什么 AI 应用需要记忆?

我们已经了解到,AI 能够利用各种类型的知识,从海量的全球数据到公司特定的信息,但 用户级记忆 的真正价值在于,它可以让 AI 更加智能和贴心。为什么记忆对 AI 应用这么重要?让我们一起来看看:

1. 个性化互动

想象一下,一个 AI 助手不仅能记住你的兴趣爱好,还能记得你喜欢的笑话风格。每次跟你聊天时,它都能聊到点上,让你感觉它更像一个真正的朋友,而不是冰冷的机器。这种个性化的体验,不仅更有趣,也让用户更愿意长期使用。

2. 上下文连贯性

如果你告诉 AI 聊天产品:“我今天想吃汉堡和薯条。” 普通的 AI 可能会直接给你推荐附近的餐馆。但一个有记忆的 AI 可能会提醒你:“可你不是说要锻炼三个月练出六块腹肌吗?” 这样的互动不仅更聪明,也让用户觉得 AI 更懂自己。

3. 节约成本

我们参与的一个聊天机器人项目,在引入 Memobase 后,通过从 32K 切换到 8K 上下文窗口模型,把大语言模型(LLM)的成本降低了多达 70-75% 。因为 Memobase 可以有效地管理用户特定知识,而无需在输入提示中不断重复冗长的对话历史记录。这种优化不仅节约了资源,还让应用运行得更快。

总结一下,记忆不仅仅是一个锦上添花的功能,它是让 AI 从普通的工具变成真正有温度的助手的关键。而像 Memobase 这样的专业解决方案,可以帮助你有效管理大规模用户的长记忆。

现在的长记忆方案有哪些?

随着 AI 技术的发展,很多长记忆方案被设计出来以提升用户体验。接下来,我们一起看看这些方案的优缺点,以及它们各自适用的场景。

记忆设计机制对比

这里我们以一个表格的形式,对比现在最主流的记忆设计机制:

下面是一个具体的例子,帮助大家理解这几种记忆机制的区别:

现有记忆方案的常见问题

尽管市面上有很多记忆解决方案,但它们往往存在一些局限性。LangGraph 团队总结得很好:

“目前的大多数 ‘智能体记忆’ 产品都太通用化了。试图满足所有需求,结果却没有一个能真正解决用户的痛点。”

如果你计划为自己的应用增加记忆功能,以下几个问题值得认真思考:

1. 记忆系统会记住哪些内容?

你清楚系统会记录什么吗?很多现有方案并不允许开发者决定记什么、不记什么。但不同的 AI 应用对记忆的需求完全不同,比如:

然而,现在许多解决方案完全依赖 AI 来决定记录什么。这种做法要么会导致 过度记忆(无用信息太多,成本飙升),要么会 遗漏重点(关键信息没被记住)。

2. 增加记忆功能会影响性能吗?

有些记忆系统要求在用户互动过程中实时更新记忆(比如通过函数调用或工具操作)。这种方式可能导致:

更高效的解决方法是将记忆功能解耦——也就是让记忆成为一个独立的存储层,专门负责记忆的读写操作,而不干扰 AI 产品的主要交互职责。

3. 记忆功能会不会增加太多成本?

记忆不是免费的,更新和管理记忆需要消耗额外的计算资源。常见的两种更新机制:

其实,大多数场景下并不需要实时更新记忆,因为 AI 本身可以暂时记住当前对话的上下文。只要确保下次用户互动前,记忆能被正确更新就足够了。所以,对于用户记忆来说,批量更新 往往是更合适的选择。

总结

虽然目前有许多 AI 记忆解决方案,但大多数都存在定制化不足、效率低下或成本高昂的问题。那些一刀切的方法、复杂的函数调用以及实时更新的弊端表明,开发者需要更灵活、更实用的解决方案。我们 Memobase 团队坚信以用户为核心设计、优先采用批量更新以及存储层解耦的理念,相信这对大部分 AI 应用,尤其是 2c 应用,是更高效更实用的记忆方案。

Memobase:为 AI 原生应用打造的长记忆解决方案

通过深入分析现有的 AI 记忆方案,我们发现了一个明显的问题:当前的大多数解决方案在构建一个高效、灵活、可控的记忆系统上捉襟见肘,无法满足大多数 AI 原生应用的需求。这也是为什么我们开发了 Memobase,希望可以填补这个记忆解决方案的空白,帮助 AI 产品团队打造全新一代的 AI 原生应用。

为什么选择 Memobase?

Memobase 不只是一个普通的记忆解决方案。它是一种全新的理念,专门用来解决传统 AI 记忆的限制:

1. 基于用户档案的强大系统

虽然 “用户档案记忆” 的概念已经存在,但却缺乏真正强大、易用的开发者友好型工具,能充分释放其潜力。Memobase 则正是为了解决这一问题而生。

2. 灵活定制,让产品团队掌控记忆

我们深信,AI 产品团队应该对存储的数据以及其组织方式拥有完全的掌控权。Memobase 的灵活架构让你可以根据应用需求,自定义记忆结构。

3. 记忆分层:减负提效

Memobase 将记忆当作一个独立的存储层,而不是让 AI 在每次互动时都实时更新记忆。这种解耦的设计不仅提升了性能,还降低了成本,同时简化了开发流程。

4. 核心设计:批量处理

Memobase 支持批量处理,以异步方式更新记忆。即便你的应用需要服务大量用户,它也能保持快速响应。

Memobase 的核心功能

📁 Profile-based 的架构

🔐 隐私与安全

🌐 可扩展性与高性能

🤖 开发者友好

🚀 内置记忆模板

为了给你一个更直观的体感,下面是从我们的一个模板中摘录的一段,大致展示了可以存储的信息类别。

- topic: "Special Events"description: "用户生活中的重大事件和里程碑。"sub_topics:- name: "Anniversaries"description: "结婚纪念日、恋爱纪念日等。"- name: "Trips"description: "用户和 AI 伴侣一起进行的旅行。"- name: "Date Plans"description: "关于未来约会或外出的计划和讨论。"- topic: "Relationships"description: "记录用户的关系信息,特别是和 AI 伴侣的关系。"sub_topics:- name: "Marital Status"- name: "Friendships"- name: "Family Relationships"- topic: "Personality"description: "记录用户的个性或偏好的他人个性特征。"sub_topics:- name: "User Personality"- name: "Preferred Personality"description: "AI 伴侣的偏好个性特征(例如,温柔、冷静、有点受虐倾向、外表冷漠但内心热情、忠诚)。"- topic: "Basic Information"sub_topics:- name: "Birthday"- name: "Age"- name: "Occupation"- name: "Habits"- topic: "Interests and Hobbies"sub_topics:- name: "History"- name: "Fortune Telling"- name: "Food"- topic: "Important Memories"description: "收集事件的记忆,例如生病,每个事件类别都有子类型。"sub_topics:- name: "Illness"- name: "Final Exams"- name: "..."

Memobase 的应用场景

Memobase 立志帮助 AI 原生产品打造更贴心更有温度的产品。我们在与多家头部 AI 应用的种子客户深入合作,这些应用涉及 AI 虚拟陪伴,AI 教育、AI 游戏等等。在这些合作中,这些合作中我们不仅共同开发并完善 Memobase 的功能,还帮助我们打磨了最佳实践的记忆模板。以下是 Memobase 的一些典型应用场景:

🎓 AI 虚拟陪伴:建立更深层的连接

🛎️ 教育平台:个性化学习

✍️ AI 游戏:打造沉浸式体验

🏥 AI 笔记和情感疗愈

大模型厂商的记忆服务 vs. 第三方提供商如 Memobase,该如何抉择?

不少朋友可能会有这样的疑问:大模型厂商会不会自己推出记忆解决方案呢?我们的答案是:也许会。

据我们了解,目前大多数大模型厂商尚未推出独立的记忆服务,只有比如字节在小规模测试豆包的记忆方案。即使未来他们推出了相关解决方案,像 Memobase 这样独立且专注的记忆服务仍然是不可或缺的,其原因主要有以下几点:

1. 摆脱供应商锁定,保持灵活性

2. 聚焦于记忆,功能更强大

3.开源的力量

🚀 即刻启程,为你的 AI 产品注入长记忆

想为你的 AI 产品快速加入长记忆功能,让她提供更贴心更温暖的用户体验吗?以下是几种快速入门方式供你选择:

1.浏览我们的 GitHub 仓库https://github.com/memodb-io/memobase):深入了解 Memobase 的工作原理。

2.查看完整文档https://docs.memobase.io/):我们的文档包括简单易懂的分步教程,帮助你轻松上手集成 Memobase。

3.加入我们的微信群: 与其他开发者交流,分享你的问题和反馈。也可以通过下面的二维码扫码入群,也可以添加 Memobase 团队小伙伴的微信:zhao-hanbo

Memobase 是开源项目,欢迎你贡献代码、改编项目,或基于它开发属于自己的解决方案。现在就开始着手打造更智能、更个性化、靠记忆驱动的 AI 应用吧!

以上信息由 RTE 开发者社区成员通过社区网站投稿提供,如果你也有与实时互动 ( Real-Time EngagementRTE) 相关的项目分享,欢迎访问网站 rtecommunity.dev 发布,优秀项目将会在公众号发布分享。同时还有 RTEMeetup demo 分享、《编码人声》播客录制、RTE Open Day 展位优先申请等机会。

有意投稿者请联系微信 creators2022 请备注身份和来意。


↙↙↙阅读原文可查看相关链接,并与作者交流