青稞Talk 12预告!VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架

如何评估多智能体系统在包含空间、因果和时间约束的复杂依赖性中的表现?来自浙江大学朱霖潮团队的研究人员在 ACL 2024 findings 中构建了一个新的基准测试 VillagerBench。VillagerBench 包含了设计用来测试多智能体协作的各个方面的多样化任务,并引入了有向无环图多智能体框架(VillagerAgent),以解决复杂的智能体间依赖性并提高协作效率。

VillagerAgent 包含了四大核心组件:任务分解器、智能体控制器、状态管理器和基础智能体,就像是 AI 的指挥家,将个体行动转化为协作的杰作。

  • VillagerBench:智能体互动和学习的虚拟沙盒 🤹。
  • TaskManager:任务图的策划者,确保任务按计划进行,智能体了解情况 📊。
  • DataManager:知识的守护者,紧握所有数据牌 🗃️。
  • GlobalController:全局监督者,确保每个智能体完美发挥其角色 🎯。

在 VillagerBench 上的实证评估表明,VillagerAgent 在减少幻觉和提高任务分解效率方面,超越了现有的 AgentVerse 模型。同时,在Overcooked-ai 测试中表现优于 ProAgent 模型的表现。VillagerAgent 在推进多智能体协作方面具有潜力,提供了在动态环境中可扩展泛化解决方案。

通过 Mineflayer 强力驱动的 VillagerBench,可以在 Minecraft 里面搭建了房屋搭建、食材烹饪、密室逃脱等多智能体协作任务,用于测试LLM智能体在任务分配、动态适应和同步执行等方面能力。在个人的 Minecraft 服务器中也可以使用 VillagerAgent 多智能体框架就可以自定义专属的私人任务,为个人打造个性化的游戏体验!

1
2
3
Paper:VillagerAgent: A Graph-Based Multi-Agent Framework for Coordinating Complex Task Dependencies in Minecraft
ArXiv:https://arxiv.org/pdf/2406.05720
Code:https://github.com/cnsdqd-dyb/VillagerAgent

6月27日晚7点,青稞社区组织【青稞Talk】第十二期,VillagerAgent一作、浙江大学硕士研究生董玉博,将直播分享 ACL 2024 findings 成果《VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架》。

Talk信息

分享嘉宾

董玉博,2023级浙江大学硕士研究生一年级。

主题

VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架

提纲

1、多智能体的研究概述

2、经典多智能体框架解析

3、基于有向无环图的多智能体框架 VillagerAgent

4、基准测试对比及在多智能体协作应用探讨

直播时间

6月27日(周一)19:00 - 20:00

参与方式

Talk 将在青稞·知识社区上进行,扫码对暗号:"0627",报名进群!