我的AI助手为何忘记了重要约会:如何为AI赋予'记忆力'

巨大的墙面上,无数照片和便签被红线错综复杂地连接在一起的侦探调查板
AI Summary

曾经只会简单罗列和存储信息的AI,现在正通过'图数据库'编织信息之间的关系,像人类一样把握语境,变得越来越聪明。

想象一下:为了安排本周末重要的出差行程,你和智能手机上的AI助手聊了一个多小时。你们预订了航班,确定了入住的酒店,甚至非常细致地讨论了与当地客户共进晚餐的菜单。几天后,你在打包行李时随口问AI:“我明天的出差行程是怎样的?”然而,AI却若无其事地回答:“您没有预订的出差行程。需要为您创建新行程吗?”

刚才还聪明地帮你比价机票的助手,突然像金鱼一样失去了记忆。你顿时感到脊背发凉。到底出了什么问题?明明使用的是世界顶尖的智能AI模型,为什么连这种基本的事实都会忘记?

这不仅仅是你一个人的糟糕体验。这是全世界许多试图将人工智能深度融入日常和工作中的开发者及用户们正在共同面临的问题。一位开发者在经历了其AI Agent(智能体,一种为了实现特定目标而自主判断并运行的人工智能)完全忘记自己航班预订的致命问题后,陷入了深深的沉思。随后他下定决心:要彻底改造AI的大脑结构,为它打造一个全新运作方式的“大脑” [我的AI智能体忘记了我的航班,所以我给它装了一个大脑 - DEV Community]。

过去的人工智能只是将与你的对话或重要事实像一份冗长的文本文档一样罗列并存储起来。但如今,最前沿AI系统的设计者们正在摆脱这种简单的列表或扁平文件(Flat file,一种完全不定义数据间关系、只是平面地记录文本或数字的简单文件形式),转而使用被称为“图数据库(Graph Database)”这种拥有全新范式的记忆装置 [向量存储 vs 图数据库:智能体记忆力比较]。

这场悄然却宏大的技术变革,将从你智能手机里的语音助手,到管理企业庞大计算机网络的AI,从根本上改变人工智能理解人类生活的方式。

为什么这很重要?(Why It Matters)

这项技术的变革为什么会与我们的日常生活息息相关?最通俗地说,这意味着AI终于拥有了像人类一样的“眼力见”和“把握语境”的能力。

回想一下我们与他人交谈时的情景。人类的大脑不会像录音机一样,简单地按时间顺序记住过去说过的句子。人类会像蜘蛛网一样,将信息立体地交织在一起进行记忆。例如,当你脑海中浮现出“哲秀”这个朋友的名字时,他有花生过敏症的事实、他养的小狗的名字,以及最后一次和他去意大利餐厅时的愉快回忆,都会在一瞬间串联起来浮现在脑海中。正是这种“连接”创造了在与人交谈时所感受到的舒适语境。

但是,迄今为止的AI完全无法以这种方式运行。在传统构建AI时,工程师们往往只是盲目地将海量对话记录塞进简单的文本文件中,或者彻底依赖现有的向量搜索(Vector search,一种将单词的表面含义转换为数学坐标,仅找出最相似文本块的一维搜索方式) [用于AI语境的基于图的记忆解决方案:排名前五的比较 …]。

这种扁平文件方式存在致命且严重的局限性。系统架构专家敏锐地指出,如果不去真正模拟数据库的结构,绝不可能在一个简单的文本文件中表达出如此复杂的关系。这与在开发常规软件或网站时,绝不会将所有用户数据只保存在像记事本一样的一个文本文件中的道理是完全一致的 [为什么AI智能体需要数据库作为记忆,而不是像SKILL.md那样的扁平文件 - Glen Rhodes]。

如果AI智能体拥有的不再是碎片化的片段记忆,而是结构化且彼此紧密连接的记忆,会发生什么魔法呢?像“帮我找一下上次我提到的那家餐厅里见过的朋友的电话号码”这种复杂的多跳推理(Multi-hop reasoning,跨越多个连接环节找出信息的思维方式)才终于成为可能 [向量存储 vs 图数据库:智能体记忆力比较]。

你再也不需要每次都从头开始,向AI详细地解释你的家庭关系、喜好或上周的日程安排了。这不仅超越了个人助手的便利性,在庞大的企业环境中也扮演着核心角色。当代理型AI(Agentic AI,能够自行制定计划并执行的高度人工智能)与图数据库强强联手时,AI就能自动掌握企业复杂多变的工作流程和部门间的关系,甚至在无需人类指示或干预的情况下,做出完美契合语境的自主决策 [赋能新兴应用的代理型AI与图数据库组合 …]。

通俗易懂的原理解析(The Explainer)

那么,这种全新的AI记忆系统在内部究竟是如何运作的呢?为了通俗易懂地解释计算机科学的复杂原理,我们来打两个核心的比方。

第一个比喻:无尽的收据箱 vs 侦探缜密的调查板

传统的向量存储(Vector Store,将文本数值化并大量存储的空间)或扁平文件方式就像是一个巨大的“收据箱”。箱子里杂乱无章地堆放着数百万张收据。如果你想寻找特定的信息,就必须把箱子倒空,把所有写着类似词语的收据都找出来,然后一张一张地阅读。想要追踪收据A和收据B之间究竟有何关联,几乎是不可能的。

相反,非文本形式的图数据库(Graph Database)方式则像推理电影中常见的“侦探调查板”。嫌疑人的照片、犯罪现场、使用的凶器、案发时间都被贴在板子上,而它们之间被一根根绷紧的“红线”连接在一起。

全新的基于图的记忆解决方案让AI超越了简单的单词搜索,使其能够孜孜不倦地追踪这些实体(Entity,如人、事物、概念等独立对象)之间的复杂关系 [用于AI语境的基于图的记忆解决方案:排名前五的比较 …]。这种关系型记忆方式,在交织着海量知识的AI系统中,当上下文语境和信息间的关联性显得尤为重要时,提供了一个非常强大且不可或缺的替代方案 [用于AI记忆的图数据库——当SQL不够用时]。

多个AI智能体为了协同工作而构建的“共享知识图谱(Shared Knowledge Graph)”,具体由4个精密的结构层组成 [[为AI智能体构建共享知识图谱 Fastio](https://fast.io/resources/ai-agent-knowledge-graph-context/)]:
  1. 实体存储 (Entity Store):清晰定义用户、进行中的任务、重要文档文件等具体对象,并赋予它们唯一标识符(ID)的地方。可以把它看作是用图钉牢牢固定在调查板上的人物照片。
  2. 关系索引 (Relationship Index):这就像一张地图,准确地展示了这些对象之间是如何交织和连接的。哪个AI助手负责什么任务,或者某项规则衍生自哪份特定的文档,都能让人一目了然。它起到的就是连接照片的紧绷红线的作用。
  3. 语境检索层 (Context Retrieval Layer):当AI收到人类的提问时,能够聪明地筛选出庞大图谱中需要截取和提取的特定部分的逻辑功能。
  4. 更新协议 (Update Protocol):这是一套安全的规则集,允许AI通过对话自主察觉并添加新的事实,或者修改与过去信息相冲突的陈旧信息。

第二个比喻:严苛的整理魔法与5项评估标准

打个比方,正如我们不会把生活中经历的每一件琐事都毫无遗漏地写进日记本一样,AI也不应该盲目地记住听到的每一个词。事实上,盲目相信错误记忆的AI更可怕。因为这类AI会自信满满、理直气壮地重复过时或完全错误的信息,从而对用户造成致命的伤害 [面向AI智能体的代理型记忆:FalkorDB, GraphRAG … - Medium]。

因此,前文提到那位试图解决“航班预订被遗忘”问题的AI开发者,设计了一个过滤系统。在将记忆永久存储到数据库之前,该系统会严格对信息的价值进行打分。在存储某项事实时,该系统会以下列5个可解释维度(Interpretable dimensions)作为严苛的标准进行评分 [我的AI智能体忘记了我的航班,所以我给它装了一个大脑 - DEV Community]:

  • 未来效用性 (Future utility):“这个信息在明天或一个月后还有用吗?”(例如,“今天天空很晴朗”的效用性很低,但“我对猫毛严重过敏”的效用性就极高。)
  • 事实可靠度 (Factual confidence):“这个信息是100%值得信赖的事实吗?”(它能准确区分这是一句玩笑话,还是已经确定的商务会议日程。)
  • 语义新颖性 (Semantic novelty):“这与我过去已知的内容相比,有多么不同、新颖且新鲜?”(这是为了避免用重复的信息浪费大脑容量。)
  • 时间近期性 (Temporal recency):“这是多久前更新的事情?”(相较于去年的喜好,昨天提到的喜好更能代表现在的我。)
  • 内容类型 (Content type):明确分类该信息是属于严格的业务相关范畴,还是个人的休闲爱好。

只有顺利通过这5道关卡并经历严格审查的精炼信息,才会被安全地存入真正的“图谱增强检索(Graph-Augmented Retrieval,一种不仅寻找信息,还会将信息关系图谱一并查找的高级信息检索技术)”系统。这就好比搬新家时,只挑选出最必要且珍贵的物品,贴上标签并装进结实的箱子里,原理完全一样。

当前现状(Where We Stand)

这种惊人的记忆魔法并非遥远未来的科幻电影情节。目前,这项技术已完全走出实验室的研究阶段,正在呈爆发式地被引入实际的商业服务和企业基础设施中。

如今,当多个AI智能体组队处理复杂任务时,它们不再像过去那样,将长达数百页、海量的对话记录(Chat logs)作为文本块整体相互传递,从而强行共享语境。取而代之的是,它们使用名为知识图谱的庞大中央存储层(Central memory layer),以共享的结构化数据形式,密密麻麻地存储各种重要的事实。

这样一来,每当其他智能体需要特定信息时,无需阅读海量文本,就能在这个中央结构网中即时、轻松地查找数据 [[使用记忆构建AI智能体:LangChain + FalkorDBGraphwise增强其图数据库成为大脑… 为AI智能体构建共享知识图谱 Fastio赋能新兴应用的代理型AI与图数据库组合… 向量存储 vs 图数据库:智能体记忆力比较](https://www.falkordb.com/blog/building-ai-agents-with-memory-langchain/)]。简而言之,这就像公司团队成员不再需要相互发送数千封电子邮件并在混乱中挣扎,而是只需看着一个完美整理的共享仪表板,就能进行愉快高效的协作。

在企业级环境中,这种趋势也已成为主流。例如,在企业中,让学习了数万份文档的AI经常给出毫不相干的离谱回答,这种情况屡见不鲜。但是,像FalkorDB或Graphwise这样的下一代数据库解决方案,通过GraphRAG(Graph Retrieval-Augmented Generation,基于图谱的检索增强生成)这种先进技术,大幅减少了AI特有的顽固幻觉(Hallucination,AI巧妙编造谎言的现象),并经过深度优化,以提供基于事实、准确且高度相关的结果 [面向AI/ML和生成式AI并带有GraphRAG的FalkorDB图数据库]。

尤其令人惊叹和有趣的是,这种强大的大脑基础设施可以非常轻松地引入到现有系统中。利用被称为Python运行时补丁的编程技术方式,开发者根本无需从头彻底修改现有系统的源代码。打个比方,就像不需要做脑部手术,只需吃下一粒特殊的营养剂就能让大脑功能发生飞跃性的提升一样,只需引入最新的插件并用一行代码进行注册,眨眼之间就能将旧版AI智能体的大脑升级为超高速图数据库驱动的内核 [使用mem0-falkordb为大语言模型智能体提供图谱记忆]。

未来将何去何从?(What’s Next)

未来,人工智能的记忆装置将比现在进化得更加有机且聪明。在与知识图谱完美结合的未来代理型AI架构中,系统将远远超越仅识别碎片化模式的水平。

想象一下,未来的AI在现实世界错综复杂的关系中,能够像人类一样推理,并采取自主行动。例如,在读取企业的供应链数据图谱并获悉台风消息后,提前预测到库存短缺的变化并向其他工厂下达订单;或是结合你过去的饮食习惯图谱和你目前低落的情绪状态,主动为你推荐最佳的治愈系晚餐菜单。这种先发制人的方式将成为新的标准 [使用知识图谱和记忆存储扩展代理型AI]。

此外,AI智能体还将通过近期在IT界引起热议的MCP(Model Context Protocol,模型上下文协议,一种旨在让AI模型与各种外部数据源安全通信的通用通信规则),直接接入庞大的知识图谱。通过这种方式,它不再依赖外部不确定的互联网搜索结果,而是更牢固地扎根于(Grounded)经过验证且可靠的领域数据(Domain Data,特定专业领域的核心数据),从而做出零失误的缜密判断 [Graphwise增强其图数据库以成为AI大脑…]。对于人命关天的医疗诊断、涉及天文数字金额的金融分析、或是连一个字的错误都无法容忍的法律审查等对准确性有着极致要求的领域,这将成为AI蜕变为真正值得信赖的合作伙伴的决定性钥匙。

而最令人心潮澎湃的未来,莫过于我们每个人都将在一生中,与AI共同构建出专属于自己的生活方式知识图谱。你的日常习惯、独特的工作作风、复杂的家庭关系,以及几十年来积累的喜爱的电影和餐厅,都被数百万根红线精巧地连接起来——这个世界上独一无二、完美的“个性化记忆宝库”,将驻扎在你手中的智能手机里。

AI的视角(AI’s Take)

MindTickleBytes的AI记者视角:仅仅机械地阅读并背诵几千本书,并不能让人成为一位充满智慧和洞察力的人。人类的智慧并非来源于死记硬背书本上的句子,而是源于将生活中的经验与知识有机结合起来的能力。

人工智能也是如此。超越简单信息与数据的盲目堆砌,只有在完美具备将信息之间看不见的语境和充满人情味的意义进行立体化连接的能力,即“知识图谱”时,它才能蜕变为真正的合作伙伴与助手。如果说过去的AI是一个杂乱无章堆满文件的仓库,那么未来的AI将成为一位洞悉文件深层含义并提供最合适答案的智慧图书管理员。

在即将到来的激烈未来竞争中,决定胜负的关键绝对不是哪项AI服务能够进行最海量知识的一维搜索,而是谁能构建出一个用最深邃、最有机图谱去理解人类生活的“智能记忆系统”。因为技术的本质,终究在于更深入地理解人类。

参考资料

  1. 使用mem0-falkordb为大语言模型智能体提供图谱记忆
  2. 我的AI智能体忘记了我的航班,所以我给它装了一个大脑 - DEV Community
  3. 为什么AI智能体需要数据库作为记忆,而不是像SKILL.md那样的扁平文件 - Glen Rhodes
  4. [为AI智能体构建共享知识图谱 Fastio](https://fast.io/resources/ai-agent-knowledge-graph-context/)
  5. 面向AI/ML和生成式AI并带有GraphRAG的FalkorDB图数据库
  6. 面向AI智能体的代理型记忆:FalkorDB, GraphRAG … - Medium
  7. 用于AI语境的基于图的记忆解决方案:排名前五的比较 …
  8. 向量存储 vs 图数据库:智能体记忆力比较
  9. 使用知识图谱和记忆存储扩展代理型AI
  10. 用于AI记忆的图数据库——当SQL不够用时
  11. [使用记忆构建AI智能体:LangChain + FalkorDBGraphwise增强其图数据库成为大脑… 为AI智能体构建共享知识图谱 Fastio赋能新兴应用的代理型AI与图数据库组合… 向量存储 vs 图数据库:智能体记忆力比较](https://www.falkordb.com/blog/building-ai-agents-with-memory-langchain/)
  12. Graphwise增强其图数据库以成为AI大脑…
  13. 赋能新兴应用的代理型AI与图数据库组合…
测试你的理解
Q1. AI过去存储信息的方式(简单文本或扁平文件)最大的局限性是什么?
  • 占用太多计算机存储空间
  • 难以把握信息之间的'关系'和语境
  • 必须连接互联网才能使用
简单文本或扁平文件方式只是对信息进行简单的罗列,因此在推断信息之间复杂的连接纽带或关系时存在局限性。
Q2. 在共享知识图谱(Shared Knowledge Graph)结构中,扮演地图角色、展示信息之间如何相互连接的元素是什么?
  • 实体存储 (Entity Store)
  • 关系索引 (Relationship Index)
  • 更新协议 (Update Protocol)
关系索引扮演着地图的角色,展示实体之间是如何相互连接的,从而帮助AI理解语境。
Q3. 在新的记忆系统中,AI在决定要记忆哪些信息时,所评估的5个标准中不包括哪一项?
  • 未来效用性 (Future utility)
  • 事实可靠度 (Factual confidence)
  • 情感吸引力 (Emotional appeal)
AI评估信息的维度不是情感吸引力,而是未来效用性、事实可靠度、语义新颖性、时间近期性以及内容类型这5个维度。