Mobile-Agent:基于多模态Agent架构的手机智能体


青稞Talk 第十四期

7月11日晚7点,青稞Talk第14期,阿里通义实验室高级算法专家徐海洋,将直播分享《Mobile-Agent:基于多模态Agent架构的手机智能体》。

分享嘉宾

徐海洋,阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩。在国际顶级期刊和会议ICML/CVPR/ICCV/ACL/EMNLP/MM/TOIS/IJCAI/AAAI等发表论文30多篇,并担任多个顶级和会议AC/PC/Reviewer。主导参与开源项目mPLUG,X-PLUG,AliceMind,DELTA。

主题提纲

Mobile-Agent:基于多模态Agent架构的手机智能体

1、多模态 Agent 的研究进展
2、基于视觉感知的 Mobile-Agent-V1
3、多 Agent 协作的多模态手机智能体 Mobile-Agent-V2
4、Mobile-Agent 应用实践

成果链接

Abs:
[1]https://arxiv.org/abs/2401.16158
[2]https://arxiv.org/abs/2406.01014
Code:
https://github.com/X-PLUG/MobileAgent

直播时间

7月11日(周四)19:00 - 20:00