新智元报道

  编辑:编辑部

  斯坦福 25 个 AI 智能体「小镇」终于开源了,GitHub 狂揽 1.4k 星,《西部世界》即将走进现实。

  准备好,此前曾轰动整个 AI 社区的斯坦福智能体小镇,现在已经正式开源!

  项目地址:https://github.com/joonspk-research/generative\_agents

  在这个数字化的「西部世界」沙盒虚拟城镇中,有学校、医院、家庭。

  25 个 AI 智能体不仅能在这里上班、闲聊、social、交友,甚至还能谈恋爱,而且每个 Agent 都有自己的个性和背景故事。

  不过,它们对于自己生活在模拟中,可是毫不知情。

  英伟达高级科学家 Jim Fan 评论道——

斯坦福智能体小镇是 2023 年最激动人心的 AI Agent 实验之一。我们常常讨论单个大语言模型的新兴能力,但是现在有了多个 AI 智能体,情况会更复杂、更引人入胜。 一群 AI,可以演绎出整个文明的演化进程。

  现在,首先受到影响的,或许就是游戏领域。

  总之,前方有无限的新可能!

  网友:众游戏厂商们,你们懂我意思吧?

  很多人相信,斯坦福的这篇论文,标志着 AGI 的开始。

  可以想象,各种 RPG 和模拟类游戏都会用上这种技术。

  网友们也非常激动,脑洞大开。

  有想看神奇宝贝的,有想看谋杀探案故事的,还有想看恋爱综艺的……

  「我已经等不及看 AI 智能体之间的三角恋剧情了。」

  「《动物之森》中重复、沉闷的对话,所有村民共有的一维人格系统,都太令人失望了。任天堂赶快学学吧!」

  「可以让《模拟人生》移植一下这个吗?」

  如果能在《神界》这样的经典 RPG 游戏中,看到 AI 在 NPC 上运行,整个游戏体验都会被颠覆!」

  有人还畅想:这项技术在企业空间中也有很多应用场景,比如员工如何和不同的工作环境/流程变化互动。

  当然,也有人表示,你们激动个啥?其实我们一直都生活在这样的模拟中,只不过我们的世界有更多的算力罢了。

  是的,如果我们把这个虚拟世界放大到足够多倍,我们肯定能看到自己。

  Karpathy:AI 智能体,就是下一个前沿

  此前,前特斯拉总监、OpenAI 大牛 Karpathy 就表示,如今 AI 智能体才是未来最前沿的方向。

  OpenAI 的团队最近 5 年把时间花在了别的地方,但现在 Karpathy 相信,「Agent 代表着 AI 的一种未来。」

  如果某篇论文提出训练大语言模型的不同方法,OpenAI 内部的 Slack 群组中就会有人说:「这个办法我两年半前尝试过,没什么用。」

  然而每当有 AI 智能体从论文出现,所有同事都会很感兴趣。

  Karpathy 曾将 AutoGPT 称为快速工程的下一个前沿

  「西部世界」中的 25 个 AI 智能体

  在美剧《西部世界》中,被预设了故事情节的机器人被投放到主题公园,像人类一样行事,然后被重置记忆,在新一天再被投放进自己所在的核心故事情节。

  而在今年 4 月,斯坦福和谷歌的研究者竟然构建出了一个虚拟小镇,让 25 个 AI 智能体在其中生存、从事复杂行为,简直堪称是《西部世界》走进现实。

  论文地址:https://arxiv.org/pdf/2304.03442.pdf

  架构

  为了生成智能体,研究者提出了一种全新架构,它扩展了大语言模型,能够使用自然语言存储 Agent 的经历。

  随着时间的推移,这些记忆会被合成为更高级别的反射,智能体可以动态检索它们,来规划自己的行为。

  最终,用户可以使用自然语言和全镇的 25 个 Agent 都实现交互。

  如上,生成式智能体的架构实现了一个「检索」功能。

  这一功能将智能体的当前情况作为输入,并返回记忆流的一个子集传递给语言模型。

  而检索功能有多种可能的实现方式,具体取决于智能体在决定如何行动时考虑的重要因素。

  生成式智能体架构面临一个核心挑战,就是如何管理大量必须保留的事件和记忆。

  为了解决这个问题,架构的核心是记忆流(memory stream),即一个记录智能体全部经验的数据库。

  智能体可以从记忆流中检索相关记忆,这有助于它规划行动,做出正确反应,并且每次行动都会反馈记录到记忆流中,以便递归地改进未来行动。

  另外,研究还引入了第二种类型的记忆——反思(reflection)。反思是智能体根据最近经历生成的高级抽象思考。

  在这项研究中,反思是周期性触发的过程,只有当智能体判断最近一系列事件的重要性评分,累积超过设定阈值时,才会启动反思机制。

  生成式智能体为了创建合理的规划,它们会自上而下递归生成更多的细节。

  而这些规划最初只是粗略的描述了当日所要做的事情。

  在执行规划的过程中,生成智能体会持续感知周围环境,并将感知到的观察结果存储到记忆流中。

  通过利用观察结果作为提示,让语言模型决定智能体下一步行动:继续执行当前规划,还是做出其他反应。

  在实验评估中,研究人员对这一框架进行了控制评估,以及端到端的评估。

  控制评估是为了了解智能体能否独立产生可信个体行为。而端到端评估,是为了了解智能体的涌现能力以及稳定性。

  比如,Isabella 策划一个情人节 party 邀请大家来。12 个智能体中,7 个人还在考虑中(3 个人有了别的计划,还有 4 个人没有想法)。

  这一环节与人类相处模式很相似。

  像真人一样交互

  在这个名为 Smallville 的沙盒世界小镇中,区域会被标记。根节点描述整个世界,子节点描述区域(房屋、咖啡馆、商店),叶节点描述对象(桌子、书架)。

  智能体会记住一个子图,这个子图反映了他们所看到的世界的各个部分。

  研究者编写了一段自然语言,来描述每个智能体的身份,包括它们的职业、与其他智能体的关系,作为种子记忆。

  比如,智能体 John Lin 的种子记忆就是这样的——

John Lin 是一名药店店主,十分乐于助人,一直在寻找使客户更容易获得药物的方法。 John Lin 的妻子 Mei Lin 是大学教授,儿子 Eddy Lin 正在学习音乐理论,他们住在一起,John Lin 非常爱他的家人。 John Lin 认识隔壁的老夫妇 Sam Moore 和 Jennifer Moore 几年了,John Lin 觉得 Sam Moore 是一个善良的人。 John Lin 和他的邻居山本百合子很熟。John Lin 知道他的邻居 TamaraTaylor 和 Carmen Ortiz,但从未见过他们。 John Lin 和 Tom Moreno 是药店同事,也是朋友,喜欢一起讨论地方政治等等。

  以下就是 John Lin 度过的一天早晨:6 点醒来,开始刷牙、洗澡、吃早餐,在出门工作前,他会见一见自己的妻子 Mei 和儿子 Eddy。

  就这样,当模拟开始时,每个智能体都有属于自己的种子记忆。

  这些智能体相互之间会发生社会行为。当他们注意到彼此时,可能会进行对话。

  随着时间推移,这些智能体会形成新的关系,并且会记住自己与其他智能体的互动。

  一个有趣的故事是,在模拟开始时,一个智能体的初始化设定是自己需要组织一个情人节派对。

  随后发生的一系列事情,都可能存在失败点,智能体可能不会继续坚持这个意图,或者会忘记告诉他人,甚至可能忘了出现。

  幸运的是,在模拟中,情人节派对真实地发生了,许多智能体聚在了一起发生了有趣的互动。

  保姆级教程

  配置环境

  在配置环境之前,首先需要生成一个包含 OpenAI API 密钥的 utils.py 文件,并下载必要的软件包。

  步骤 1. 生成 Utils 文件

  在 reverie/backend\_server 文件夹中(reverie.py 所在的文件夹),新建一个 utils.py 文件,并将下面的内容复制粘贴到文件中:

# Copy and paste your OpenAI API Key
openai_api_key = "<Your OpenAI API>"
# Put your name
key_owner = "<Name>"

maze_assets_loc = "../../environment/frontend_server/static_dirs/assets"
env_matrix = f"{maze_assets_loc}/the_ville/matrix"
env_visuals = f"{maze_assets_loc}/the_ville/visuals"

fs_storage = "../../environment/frontend_server/storage"
fs_temp_storage = "../../environment/frontend_server/temp_storage"

collision_block_id = "32125"

# Verbose 
debug = True

  将替换为你的 OpenAI API 密钥,将替换为你的姓名。

  步骤 2. 安装 requirements.txt

  安装 requirements.txt 文件中列出的所有内容(强烈建议先设置一个虚拟环境)。

  目前,团队已在 Python 3.9.12 上进行了测试。

  运行模拟

  要运行新的模拟,你需要同时启动两个服务器:环境服务器和智能体模拟服务器。

  步骤 1. 启动环境服务器

  由于环境是作为 Django 项目实现的,因此需要启动 Django 服务器。

  为此,首先在命令行中导航到 environment/frontend\_server(manage.py 所在的位置)。然后运行以下命令:

python manage.py runserver

<span>  然后,在你喜欢的浏览器中访问 http://localhost:8000/。</span>

  如果看到「Your environment server is up and running」这个提示,意思就是服务器运行正常。确保环境服务器在运行模拟时持续运行,因此请保持这个命令行标签打开。

  (注意:建议使用 Chrome 或 Safari。Firefox 可能会出现一些前端故障,但应该不会影响实际模拟。)

  步骤 2. 启动模拟服务器

  打开另一个命令行窗口(你在步骤 1 中使用的仍在运行环境服务器,需要保持不动)。导航到 reverie/backend\_server 并运行 reverie.py 来启动模拟服务器:

python reverie.py

<span>  此时,会出现一个命令行提示询问以下内容:「Enter the name of the forked simulation: 」。</span>

  举个例子,现在我们要启动一个包含 Isabella Rodriguez、Maria Lopez 和 Klaus Mueller 这 3 个智能体的模拟,那么就是输入以下内容:

base_the_ville_isabella_maria_klaus

<span>  然后,提示将会询问:「Enter the name of the new simulation: 」。</span>

  这时只需要随意输入一个名称来表示当前的模拟即可(例如「test-simulation」)。

test-simulation

<span>  保持模拟器服务器运行。此阶段,它会显示以下提示:「Enter option」</span>

  步骤 3. 运行和保存模拟

  在浏览器中访问 http://localhost:8000/simulator\_home,并保持标签打开。

  现在你会看到小镇的地图,以及地图上活跃的智能体列表,并且可以使用键盘箭头在地图上移动。

  要运行模拟,需要在提示「Enter option」的模拟服务器中输入以下命令:

run <step-count>

<span>  请注意,需要将上述的替换为一个整数,表示要模拟的游戏步数。</span>

  例如,如果要模拟 100 步游戏,就输入 run 100。其中,一个游戏步骤表示游戏中的 10 秒。

  现在,模拟就会开始运行,你可以在浏览器中看到智能体在地图上移动。

  一旦运行完成,「Enter option」提示会再次出现。此时,你可以通过重新输入 run 命令并指定所需的游戏步数来继续模拟,或者输入 exit 退出但不保存,输入 fin 则是保存并退出。

  下次运行模拟服务器时,只要提供模拟的名称就可以访问已保存的模拟。这样,你就可以从上次离开的位置重新启动模拟。

  Step 4. 重放模拟

  只需运行环境服务器,并在浏览器中访问到以下地址,即可重放已运行的模拟:http://localhost:8000/replay//

  其中,需要将替换为重放的模拟的名称,将替换开始重放的整数时间步。

  Step 5. 演示模拟

  你可能会发现,重放中所有角色的 Sprite 看起来都是一样的。这是因为重放功能主要用于调试,并不优先考虑优化模拟文件夹的大小或视觉效果。

  要正确演示带有角色 Sprite 的模拟,首先需要压缩模拟。为此,请使用文本编辑器打开位于 reverie 目录中的 compress\_sim\_storage.py 文件。然后,执行压缩函数,并将目标模拟的名称作为输入。这样,模拟文件就会被压缩,从而可以进行演示。

  启动演示,请在浏览器中打开以下地址:http://localhost:8000/demo/

  注意,和与上述提到的含义相同。可用于控制演示速度,其中 1 表示最慢,5 表示最快。

  定制模拟

  你有两种可选方式来自定义模拟。

  方法1:编写并加载智能体历史

  第一种是在模拟开始时初始化具有独特历史记录的智能体。

  为此,你需要执行以下操作:1)使用其中一个基本模拟开始,2)编写和加载智能体历史记录。

  步骤 1. 启动基本模拟

  存储库中包含两个基本模拟:base\_the\_ville\_n25(25 个智能体)和 base\_the\_ville\_isabella\_maria\_klaus(3 个智能体)。可以按照上述步骤加载其中一个基本模拟。

  步骤 2. 加载历史文件

  然后,在提示输入「Enter option」时,需要使用以下命令加载智能体历史记录:

call -- load history the_ville/<history_file_name>.csv

<span>  其中,需要将替换为现有历史文件的名称。</span>

  存储库中包含两个示例历史文件:agent\_history\_init\_n25.csv(针对 base\_the\_ville\_n25)和 agent\_history\_init\_n3.csv(针对 base\_the\_ville\_isabella\_maria\_klaus)。这些文件包含了每个智能体的内存记录列表。

  步骤 3. 进一步的定制

  要通过编写自己的历史文件来定制初始化,请将文件放在以下文件夹中:environment/frontend\_server/static\_dirs/assets/the\_ville。

  自定义的历史文件的列格式必须与附带的示例历史文件一致。因此,作者建议通过复制和粘贴存储库中已有的文件来开始该过程。

  方法2:创建新的基本模拟

  如果想要更深度地定制,就需要编写自己的基本模拟文件。

  最直接的方法是复制和粘贴现有的基本模拟文件夹,然后根据自己的要求进行重命名和编辑。

  参考资料:

  https://github.com/joonspk-research/generative\_agents

  https://twitter.com/DrJimFan/status/1689315683958652928

来自: mp.weixin.qq.com

蓝易云是一家专注于香港及国内数据中心服务的提供商,提供高质量的服务器租用和云计算服务、包括免备案香港服务器、香港CN2、美国服务器、海外高防服务器、国内高防服务器、香港VPS等。致力于为用户提供稳定,快速的网络连接和优质的客户体验。
最后修改:2023 年 08 月 12 日
如果觉得我的文章对你有用,请随意赞赏