标签: 多模态大模型 | 青稞社区

#LLM 25 #AIGC 10 #多模态大模型 10 #视频生成 7 #AI Agent 7 #大模型推理 6 #大模型训练 5 #推理大模型 4 #具身智能 4 #大模型量化 4 #3D生成 3 #SGLang 3 #强化学习 2 #AI Infra 2 #世界模型 2 #大模型评估 2 #VLM 2 #视频编辑 1 #大模型 1 #3DGS 1 #大模型微调 1 #RAG 1 #自动驾驶 1

多模态大模型

2024

VILA^2:视觉语言模型能力的自我提升

VILA^2:视觉语言模型能力的自我提升

2024-11-23

VITA：开源交互式多模态基础大模型

VITA：开源交互式多模态基础大模型

2024-10-14

mPLUG-Owl3：探索长序列模型架构的通用多模态大模型

mPLUG-Owl3：探索长序列模型架构的通用多模态大模型

2024-09-10

InternVL 2.0：通过渐进式策略扩展开源多模态大模型的性能边界

InternVL 2.0：通过渐进式策略扩展开源多模态大模型的性能边界

2024-08-06

SEED-Story：生成长篇图文故事的多模态大型语言模型

SEED-Story：生成长篇图文故事的多模态大型语言模型

2024-07-30

YOLO-World：基于视觉语言模型的实时开放词汇物体检测

YOLO-World：基于视觉语言模型的实时开放词汇物体检测

2024-07-23

MiniCPM-V：端侧可用的GPT-4V级多模态大模型

MiniCPM-V：端侧可用的GPT-4V级多模态大模型

2024-07-15

Mobile-Agent：基于多模态Agent架构的手机智能体

Mobile-Agent：基于多模态Agent架构的手机智能体

2024-07-11

具身多模态大模型的视觉表征预训练研究

具身多模态大模型的视觉表征预训练研究

2024-06-06

Mini-Gemini：挖掘多模态视觉语言大模型的潜力

Mini-Gemini：挖掘多模态视觉语言大模型的潜力

2024-04-24