标签: LLM | 青稞社区

#LLM 35 #大模型 6 #OpenAI 6 #多模态大模型 4 #南开大学 4 #李翔 4 #AIGC 4 #Weekly 4 #VLM 4 #MLLM 3 #浙江大学 3 #张俊林 3 #OpenAI o1 3 #RL 2 #强化学习 2 #减论 2 #5分钟极减阅读 2 #减论系列专栏 2 #《从分布到生成》专题 2 #DeepSeek 2 #莫纳什大学 2 #合成数据 2 #Anwen Hu 2 #大模型微调 2 #赵鉴 1 #推理大模型 1 #yearn 1 #SGLang 1 #旷野 1 #曹宇 1 #图像生成 1 #模型压缩 1 #Dong Zhen 1 #视觉生成模型 1 #阿里Qwen 1 #Transformer 1 #潘梓正 1 #LLAMA-3 1 #Sora 1 #视频生成 1 #文档处理 1 #阿里巴巴 1 #Scaling Law 1 #MOE 1 #Long Context 1 #华为 1 #唐业辉 1 #Q* 1 #GPU 1 #孙鹏飞 1 #RAG 1 #大模型训练 1 #AI 1 #LLaMA 1 #孟繁续 1 #GPT-5 1 #RLHF 1 #Instruct GPT 1 #self-play RL 1 #pretrain 1 #LLM推理 1 #OenAI 1 #多模态啊大模型 1 #模型推理 1 #大模型推理 1 #MLCEngine 1 #模型微调 1 #OpenAI o3 1 #NUS 1 #推理模型 1 #大模型预训练 1 #DeepSeeek 1 #方佳瑞 1 #MiniMax 01 1 #DeepSeek R1 1 #haotian 1 #字节 1 #AI代码生成 1 #豆包 1 #申博 1 #阿里巴巴通义实验室自然语言智能团队 1 #算法实习生 1 #西湖大学 1 #王欢 1 #TAMU 1 #涂正中 1 #Bohan Zhuang 1 #三维视觉 1 #深度估计 1 #位姿估计 1 #AI Agent 1 #李博杰 1 #非AI@公众号 1

LLM

2025

以RLer视角看大模型训练中的强化学习

以RLer视角看大模型训练中的强化学习1

强化学习 LLM

2025-02-14

DeepSeek-V3/R1 的 Hosting 成本预估

DeepSeek-V3/R1 的 Hosting 成本预估2

2025-02-14

Deepseek R1 Zero 复现, 三阶段RL！

Deepseek R1 Zero 复现, 三阶段RL！3

LLM DeepSeek R1

2025-02-05

MiniMax-01技术报告解读

MiniMax-01技术报告解读4

2025-01-16

从DeepSeek MTP，解析MTP技术的前世今生

从DeepSeek MTP，解析MTP技术的前世今生5

2025-01-15

计算DeepSeekV3训练的MFU

计算DeepSeekV3训练的MFU6

LLM DeepSeeek 方佳瑞

2025-01-08

2024

一位大佬的自述 | 从读博到 Google DeepMind，旅程中的心得与感恩

一位大佬的自述 | 从读博到 Google DeepMind，旅程中的心得与感恩7

2024-12-11

ICLR 8分论文：模型自身也可以标注偏好数据

ICLR 8分论文：模型自身也可以标注偏好数据8

2024-12-11

OpenAI o1复现之旅：通过简单蒸馏是超越o1-preview的巨大进步还是苦涩教训？

OpenAI o1复现之旅：通过简单蒸馏是超越o1-preview的巨大进步还是苦涩教训？9

2024-11-28

干货！大模型 LLM 训练基础知识

干货！大模型 LLM 训练基础知识10

LLM 大模型预训练

2024-11-28