加载头像
图片
2024-06-13浙大百人计划教授招收访问学者、研究助理、博士后、硕士和博士生
浙江大学招收访问学者、研究助理、博士后、硕士和博士生 Monash University招收1-2名博士生 ZIP Lab介绍 ZIP Lab 是一个国际性的研究实验室,位于杭州和墨尔本。我们的主要研究重点是为边缘应用开发高效的机器学习系统,特别是在大型语言模型和多模态大模型方面。自2021年成立以来,实验室凭借其才华横溢的成员迅速取得了发展。 有关我们团队成员和论文的更多信息,请访问实验室主页: https://ziplab.github.io/ 我们正在积极招聘浙江大学的访问学者、研究助理、博士后、硕士和博士生。此外,我们还在 Monash University 招收1-2名博士生 ,将由资深教授共同指导。我们期待在学术界影响力和工业界落地都取得突破,欢迎您的加入! PI简介 Bohan Zhuang是ZIP Lab的负责人。他于2018年在阿德莱德大学获得博士学位,并在澳大利亚机器人视觉中心担任高级研究员。从2020年至今,他担任Monash University信息技术学院的长聘助理教授,该校在2025年QS全球排名第37位。2023年,他获得了国家优 ...
详情
图片
2024-09-23加入青稞AI技术交流群,与青年AI研究与员/开发者交流最新AI技术
青稞社区 青年AI研究员idea加油站,AI开发者的新能源充电桩! 青稞AI技术交流群 长案扫码添加青稞小助手 备注:姓名-学校/公司-学历/职位-研究领域(如:青稞-MIT-博士-LLM),即可申请加入青稞LLM/多模态/Agent/具身智能/面试/顶会等技术交流群: 加入青稞AI技术交流群,不仅能与来自MIT、港中文、CMU、UCLA、斯坦福、清华、阿里、腾讯等名校名企AI研究员/开发者一起进行技术交流,同时还有青年AI研究员/开发者的Talk分享、行业前沿资讯、顶会资源、招聘内推等。 社群列表 细分方向技术交流群 青稞|LLM技术交流群 青稞|多模态技术交流群 青稞|具身智能技术交流群 青稞|Agent技术交流群 青稞|Diffusion技术交流群 SGLang技术交流群 顶会投稿开会交流群 ICRA 投稿开会交流群 | 青稞 CVPR 投稿开会交流群 | 青稞 ICASSP 投稿开会交流群 | 青稞 NAACL 投稿开会交流群 | 青稞 ECCV 投稿开会交流群 | 青稞 AIGC/LLM面试交流群 青稞|AIGC&LLM面试招聘交流群 行业资讯群 ...
详情
图片
2024-09-18万字长文推演OpenAI o1 self-play RL 技术路线
作者:曹宇,阿里巴巴集团 · 大模型练习生,AI 系统及算法方向 原文:https://zhuanlan.zhihu.com/p/720106482 OpenAI的self-play RL新模型o1最近交卷,直接引爆了关于对于self-play的讨论。在数理推理领域获得了傲人的成绩,同时提出了train-time compute和test-time compute两个全新的RL scaling law。作为领域博主,在时效性方面肯定卷不过其他营销号了,所以这次准备了大概一万字的内容,彻底深入分析并推演一遍其中的相关技术细节。 o1,而今迈步从头越 首先要说一下,o1是一个多模态模型,很多人包括 Jim Fan 都忽略了这一点: 因此他继续叫做o,作为omni系列是没有任何疑问的。只不过这次发布是过于低调了,很多人都没有注意到这个拉爆了所有其他多模态框架的78.1分。 那么这个o1,说明这个技术路线就是一个全新的模型pipeline弄出来的了。作为一个全新的多模态Self-play RL模型,首秀的成绩还是相当不错的。虽然现在评价该self-play方法是否能够泛化至多模态还 ...
详情
图片
2024-03-21张俊林:技术神秘化的去魅,Sora关键技术逆向工程图解
作者:张俊林,新浪微博新技术研发负责人 声明:本文只做分享,版权归原作者,侵权私信删除 原文链接:https://zhuanlan.zhihu.com/p/687928845 | https://zhuanlan.zhihu.com/p/684089478 Sora生成的视频效果好吗?确实好。Sora算得上AGI发展历程上的里程碑吗?我个人觉得算。我们知道它效果好就行了,有必要知道Sora到底是怎么做的吗?我觉得最好是每个人能有知情的选择权,任何想知道的人都能够知道,这种状态比较好。那我们知道Sora到底是怎么做出来的吗?不知道。 马斯克讽刺OpenAI是CloseAI,为示道不同,转头就把Grok开源了。且不论Grok效果是否足够好,马斯克此举是否有表演成分,能开源出来这行为就值得称赞。OpenAI树大招风,目前被树立成技术封闭的头号代表,想想花了上亿美金做出来的大模型,凭啥要开源?不开源确实也正常。所谓“开源固然可赞,闭源亦可理解”。 但是,我个人一年多来的感觉,OpenAI技术强归强,然而有逐渐把技术神秘化的倾向,如果不信您可以去读一下Altman的各种访谈。在这个AI技术 ...
详情
大模型推理框架,SGLang和vLLM有哪些区别?
我的RL人生哲学:写给Sutton & Barto的图灵奖时
从幻觉到o1-reasoning!万字长文总结多模态大模型后训练
聊聊强化学习发展这十年
字节 DAPO 技术报告有感!大模型 RL 细节为王
以RLer视角看大模型训练中的强化学习
DeepSeek-V3/R1 的 Hosting 成本预估
Deepseek R1 Zero 复现, 三阶段RL!
MiniMax-01技术报告解读
从DeepSeek MTP,解析MTP技术的前世今生
大模型Weekly 05|450美元训练32B推理模型‌,并开源;微软开源Phi-4
Sky-T1-32B-Preview:450美金就可以训练的o1-preview【模型权重与训练细节已完全开源】
计算DeepSeekV3训练的MFU
大模型Weekly04|智谱发布深度推理模型GLM-Zero-Preview;英伟达推出文本音频生成模型TangoFlux
大模型Weekly 03|OpenAI o3发布;DeepSeek-V3上线即开源!
对OpenAI o3模型的看法、思考与反思
大模型Weekly|月之暗面发布Kimi视觉思考模型 k1;谷歌发布最新视频生成模型Veo 2
大模型Weekly|谷歌发布Gemini 2.0;微软推出小模型Phi-4;智谱上线GLM-4V-Flash
一位大佬的自述 | 从读博到 Google DeepMind,旅程中的心得与感恩
ICLR 8分论文:模型自身也可以标注偏好数据
浙大开源ZipAR:自回归图像生成开销降低91%
OpenAI o1复现之旅:通过简单蒸馏是超越o1-preview的巨大进步还是苦涩教训?
多模态视觉token压缩方法
干货!大模型 LLM 训练基础知识
盘点 2024 年的视觉语言模型VLMs
用豆包大模型来编程是什么体验?Marscode食用指南!
干货分享精调视觉语言模型VLM的经验
DPO新作Your Language Model is Secretly a Q-Function解读,与OPENAI Q* 的联系?
DPO,RM,RLHF 傻傻分不清楚
基于 MLCEngine 的低延迟高吞吐量的 LLM 部署研究
浙大百人计划教授魏颖课题组招收2025年博士生、研究助理、实习生
K-Sort Arena:探索高效竞技场算法,根据人类偏好快速评估视觉生成模型
OpenAI o1:AI新范式以及对未来的 10 个启示
探索多模态大模型的最佳技术路线
从O1模型聊聊低延迟LLM推理加速器的设计
多模态大模型的预训练策略探究
万字总结 LLM 推理加速方式
OpenAI o1能否支撑AGI的新Scaling?
万字干货!从零到一进行LLM pretrain的经验
加入青稞AI技术交流群,与青年AI研究与员/开发者交流最新AI技术
Manydepth2 | 基于运动感知自监督单目深度与位姿估计
OpenAI o1的合成数据与推理搜索是怎么实现的
现代LLM基本技术整理
万字长文推演OpenAI o1 self-play RL 技术路线
秋招上岸!AIGC/LLM高薪岗位推荐
如何正确复现 Instruct GPT / RLHF?
更适合 flash attenion 体质的长上下文训练方案
行云集成电路创始人季宇:谈谈 AI 的泡沫
大白话说什么是“MLLM”多模态大语言模型
长上下文 LLM 会导致 RAG 的消亡吗?
如何利用多模态大模型进行视觉自回归图像生成?
如何估计LLM推理和训练所需的GPU内存?
OpenAI 绝密项目「草莓」技术详解
以DeepSeek-VL为例,详解视觉语言模型原理及代码
GPT-5:你需要知道的一切
【8分钟极减专栏:从分布到生成(三)】GAN可以不是对抗?
计算机如何采样出一张服从特定分布的图像(VAE篇)?
5分钟极减阅读CVPR24 best paper《Generative Image Dynamics》
5分钟极减阅读kaiming团队无向量量化的自回归图像生成模型
吴恩达:从 Agent 到 Agentic,超越基础模型的下一代 AI
浙大百人计划教授招收访问学者、研究助理、博士后、硕士和博士生
张俊林:关于Scaling Law、半合成数据、MOE及长文本的看法及未来
视觉语言融合新范式MemVP:基于记忆空间的多模态大模型高效微调方法
LLaMA 3/2/1模型结构总览
阿里出品!3B多模态图表理解大模型TinyChart达到新SOTA
TAMU计算机系招收全额奖学金博士生
张俊林:聊聊对LLAMA-3、大模型开源与闭源以及合成数据的看法
西湖大学助理教授王欢招收PhD/RA/Visiting Students
张俊林:技术神秘化的去魅,Sora关键技术逆向工程图解
阿里出品!7B最强多模态文档理解大模型mPLUG-DocOwl 1.5
聊一聊Transformer中的FFN
生成式 AI 的下一站,应该有趣还是有用?
阿里巴巴通义实验室自然语言智能团队招聘大语言模型算法实习生
2天狂拦2300star,AnimateAnyone到底是什么来头
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體