>><<
扫描二维码也可报名
活动时间:2025年7月24日(周四) 下午 13:30 - 17:30
本次活动聚焦大模型技术前沿突破与产业融合,邀请优秀青年学者、美团基座大模型团队核心骨干、优秀在校学生一起参加。分享前沿技术和实践经验,共同探讨大模型理论与前沿结合、模型推理、多模态、大模型系统等核心议题。
勋梁,美团基座大模型负责人
赵鑫,中国人民大学
中国人民大学高瓴人工智能学院教授,2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文200余篇,谷歌学术引用3万余次,曾主导研发了玉兰系列大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书(高等教育出版社出版)。曾荣获2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖,CCF-IEEE CS青年科学家奖。
报告题目:《大模型深度推理技术探讨》
报告摘要:最近以DeepSeek-R1为代表的大模型慢思考技术受到了较大关注,慢思考模型通过生成更长的思考过程来解决更具挑战性的问题,在多个科学场景和应用领域都取得了重要突破。本次报告将聚焦大模型慢思考的基础技术与实现方法,对于其中可能涉及到的技术路径进行探索和系统性讲解,介绍以强化学习为主线的关键技术,并重点关注推理过程中对于工具的使用,最后总结现阶段推理模型的局限以及未来的技术发展趋势。
桂韬,复旦大学
复旦大学副研究员、博导。研究领域为预训练模型、类人对齐和智能体交互。在高水平国际学术期刊和会议上发表了50余篇论文。曾获钱伟长中文信息处理科学技术奖一等奖、NeurIPS2023大模型对齐 Track最佳论文奖,入选第七届“中国科协青年人才托举工程”、上海市启明星计划。
赵恒爽,香港大学
报告题目:《空间智能视觉基础模型》
报告摘要:随着深度学习模型能力的增强以及海量数据的高效获取和利用,大规模视觉基础模型的构建得到了广泛关注。这些视觉基础模型在处理跨领域的复杂视觉场景任务中表现出强大的泛化能力。然而,它们通常专注于图像和视频的理解,而忽略了对具有关键空间属性的高维视觉场景的理解能力。为了解决这些局限性,我们着重探索在2.5维和3维等更高维度上开发具有空间智能的视觉基础模型。本次报告将介绍我们近期一系列关于赋予视觉基础模型空间智能的研究成果,以及它们在诸多重要下游场景如自动驾驶和具身智能等的应用,并探讨视觉基础模型面临的一些挑战和未来前沿。
金鑫,北京大学
北京大学计算机学院长聘副教授、博士生导师。研究领域为系统软件、计算机网络、云计算。获ACM SIGCOMM Rising Star Award、CCF青年科技奖、阿里巴巴达摩院青橙奖、USENIX FAST最佳论文奖、USENIX NSDI最佳论文奖等奖项。
报告题目:《高性能大模型训练系统:从文本到多模态,从预训练到后训练》
报告摘要:随着大模型技术的快速进步,大模型在各个领域都展现出巨大潜力,成为学术界和工业界都关注的热点方向。大模型参数规模大,其训练需要消耗大量计算、网络和存储资源,高效支持大模型的训练是智算系统的重要问题。本次报告将介绍我们在面向大规模训练的大模型系统方面的近期工作,包括从文本到多模态的不同种类大模型,涵盖从预训练到后训练的不同阶段,优化大规模训练,并对大模型系统的未来发展进行展望。
章明星,清华大学
清华大学副教授,主要从事内存系统研究,开源项目 Mooncake 和 Ktransformers 发起人。相关成果在 OSDI、SOSP、ASPLOS、HPCA、EuroSys 等国际顶级会议和期刊上发表论文三十余篇,包括 FAST 最佳论文,SIGSOFT 杰出论文,和国内高校首篇 OSDI。曾获得 ChinaSys 新星和优博奖,IEEE TCSC 优博,入选中国科协青年人才托举计划,科技部重点研发项目课题负责人。曾任深信服首席算法技术专家,创新研究院院长,相关孵化产品应用于数万家客户。
报告题目:《从同构走向分离的大模型推理系统》
报告摘要:由于在算力和带宽两方面的明显优势,传统大模型推理架构往往以 GPU 为中心进行设计。然而,随着 GPU 利用率逐渐逼近瓶颈,进一步降低推理成本需要开拓新的优化路径。结合不同 GPU 设备乃至 CPU/DRAM 设备在带宽或容量成本上的优势,并充分利用模型本身的前序依赖性与稀疏性特征,设计适配的计算架构成为未来算法、系统与硬件协同创新的重要方向。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...