学术活动
信息工程学院学术讲座:高效LLM加速器开发与模型推理的敏捷设计框架:挑战与实践
2024-12-27
点击次数:时间:2024年12月27日
地点:校本部 新教二楼209教室
主讲人:卓成 浙江大学 教授
主持人:邱柯妮 威尼斯欢乐娱人城1099信息工程学院 教授
主讲人简介:卓成博士,浙江大学求是特聘教授。入选国家高层次人才计划、IEEE电子设计自动化(CEDA)协会杰出讲者和英国工程技术学会会士等。长期从事集成电路设计和设计自动化研究,发表Nature Communications、TCAD、EDL、DAC等期刊/会议论文200余篇,获得领域旗舰会议ICCAD、ASPDAC、DAC等最佳论文奖/提名11次。担任IEEE TCAD等多个EDA国际期刊编委、《计算机辅助设计与图形学学报》领域编委、多个国际会议主席及ACM SIGDA华东分会主席。
主讲内容简介:大语言模型(LLM)的广泛应用对加速器设计提出了前所未有的挑战,包括高算力、高带宽和能效优化的综合需求。传统芯片开发流程难以满足快速迭代和多样化模型推理场景的需求,亟需更敏捷的设计框架。本报告聚焦于高效LLM加速器开发的核心挑战,探讨跨层次分析和多目标优化的设计框架,为构建面向未来的敏捷加速器设计方法提供参考。