持续化AI Agent的一些想法--“机械生命”

这是我的草稿, 还有很多要改的地方, 但大概或许应该能让某些人看懂了吧? (至少能当个什么AI笑话?(雾))

最初开始想这些事是在2024年中旬的时候, 当时在想能不能搞出一种基于LLM的可以持续存在的智能体, 或者换个词–“机械生命”, 这里的“持续存在”不仅仅指像物体一样静止地存在或是像扫地机器人那样仅通过预设程序中的一些指令行动的智能体, 而是那种更像人类或是生物那样可以以一种智能、创新和持续进化的模式存在智能体. 当时就有点想把我想象的东西写出来, 不过因为有懒所以拖到了现在. :(

前一两个月, 我了解到 langchain, MCP 等这样的东西, 越发感觉我的构想已经有了实现的大部分基础(maybe 已经被人实现了(), 或者是在很早之前就被实现了也不一定), 所以趁现在我还没发现有人做出来的时候先把它写出来.

回顾一下最近比较火的manus, 即所谓AI Agent, 本质上就是一个训练后的基座LLM+工具链(toolchain, 如网页搜索、计算器、api…). 这个可以称得上是一个“机械生命”吗? 并非, 但已经有了一个雏形. Manus已经学会了自己调用外界的工具了, 解决了半年前我设想中“机械生命”中所想到的外部接口处理的问题.

所以, 现在我们如何才能实现真正的“机械生命”? 或者说, 其中“生命”那一部分?

记忆, 和持续化.

先说持续化, 对于我们人类而言, 我们有像LLM, 或者更广义的机器来说, 的等待用户激活或者开关机的行为吗? 没有, 即使是睡觉也只是人体以一种较为静止的模式生存的方式. 这里需要澄清一下概念, 对于“机械生命”的持续化, 指的是将生物生死二元化之后的生的一面, 换句话说, 就是长期连续的运行状态. 即在有足够能源下持续运行并能获取能源的东西.

更重要的一点是记忆, 或者说基于思维的记忆. 作为任何稍微高等的动物来说, 都有存储记忆的功能, 这是一种在生存中积累知识和能力的重要功能. 目前, 很多ai模型都有内置的或者外置的记忆系统, 比如RNN和LSTM等本身的设计核心就在记忆上, 以及ChatGPT在系统和prompt上的记忆等. 但我所设想的“机械生命”所具有的记忆模式有所不同. 他可以自我探索规律, 并且可以实现智能动态控制存储大小, 选择性强调和遗忘记忆, 从记忆中寻找规律. (或许可以通过语言模型实现)

现在介绍我的一个不完善的一个具体构想:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
// 单次记忆, 可为 传感器输入/思考内容/错误记录等

// uuid包含时间戳
id: UUID
// 重要性值, 若无其他调整会随时间流逝被AI智能降级或最终删除, 或在开发时设置为-1作为固定记忆
level: Int
// 分类, 可用于更准确识别记忆类型, 知识/短期记忆内容/计划
category: String
// 记忆正文
content:
// 文字
Text: String
// 图像
Image: Path
// 待补充...
//待补充...
1
2
3
4
5
while (1) {
读取和上一步错误记录和传感器, 存入最新记忆
调用模型生成下一时刻命令, 包括对外操作和记忆操作 (遵循MCP或相关协议)
使硬件执行操作, 收集可能产生的错误指令 (为具体协议可操作的工具链)
}

在这里面, 记忆结构文件会创造一个列表, 存储所有记忆, 而AI会持续维护记忆列表, 进行智能增删改查, 并控制长度 (避免超过自身上下文长度), 或者单独创建知识库.

在这样一个结构中, “机械生命”怎么做到自己持续运转呢?

答: 通过前期微调+预设记忆+自我学习

在前期微调中, 我们可以先把MCP协议使用方法和其他特化环境中一般需要的能力通过微调使其记忆在模型中

在预设记忆中, 我们可以将一些具体信息以高等级记忆写入记忆文件, 或者以知识库形式, 如初始充电桩或者一些具体知识, 就像现在的已经实现的知识库一样

最重要的部分便是自我学习, 这一部分也是这个构想中最重要的一点. 通过在记忆列表和知识库中寻找规律, 可以将有规律的部分或有理论基础的部分进行延伸形成规律, 存储进知识型记忆(category)或者更新知识库. 这么说可能有些玄乎, 我在这里举一个例子.

例子:

我现在的智能体上有 位置传感器模块, 摄像模块, 和温度模块.

在无现有知识的的情况下, 多次进入阴影区域, 记忆记录里多个记录对应了 位置+光照+温度 的对应关系, 在读取这些关系后, 该智能体将这种关系 (在光线弱的地方可能导致温度下降) 作为猜想记录进记忆列表和知识库中的猜想中.

再经过多次验证后可将其计入知识型记忆中, 或者加入自学习知识库. 这样一来, 他就可以在需要降温的时候导航至记忆中温度低的地方, 或者寻找周围环境光中的较暗位置.

在这个例子中, 其实还有更多的内容, 比如说收集暗光区域列表, 更新图像识别特定规律, 还有进一步探索可能促使改规律失效的问题, 后期修改自身知识库或者总结更高层面的降温原理.

以上, 就是我所设想中的一个“机械生命”的初步的、粗浅的例子, 虽然这个“机械生命”看起来呆呆的, 有好像不像所谓“人的思考”一样真实, 但是, whatever, 这其中或许蕴含着一些可能性, 一些我所期望的可能性吧.

一个高二学生痛苦托福备考中瞎写的文字

p.s.: 没准儿等我申请完可以尝试把它搞出来.

p.s.: 不是我一个申请数学专业的搞这干什么 (喂! 不是?)

p.s.: 待会儿可能拿 DS 或者 GPT 改一下 ()

持续化AI Agent的一些想法 © 2025 by Ruotian is licensed under CC BY-NC-SA 4.0

© 2025 by Ruotian is licensed under CC BY-NC-SA 4.0
上一篇
下一篇