超大规模模型训练超算化的趋势及应用 | CNCC2021
CNCC2021将汇聚国内外顶级专业力量、专家资源,为逾万名参会者呈上一场精彩宏大的专业盛宴。别缺席,等你来,欢迎参会报名!
【超大规模模型训练超算化的趋势及应用】技术论坛
【论坛背景介绍】
目前如AlphaFold、GPT-3等超大规模模型规模迅速增长,对算力的需求也急剧增加。10月28日下午4点,NVIDIA携手百度、阿里云和京东的专家在CC203会议室举办《超大规模模型训练超算化的趋势及应用》技术论坛,将为您带来超大规模分布式模型训练的实践,以及深入分析GPT-3训练过程中的存储、计算及通信开销及相应优化策略等精彩演讲。对GPU加速计算、超大规模语言模型训练、分布式训练框架和E级高性能AI计算集群的硬件架构感兴趣的您不容错过。
论坛主席
论坛日程安排
时间 | 主题 | 主讲 嘉宾 | 单位及任职 |
16:00-16:30 | 飞桨分布式框架:深度解析超大模型训练技术 | 吴志华 | 百度深度学习技术平台部主任研发架构师,飞桨分布式技术负责人 |
16:30-17:00 | 阿里云在超大规模分布式模型训练的实践 | 董建波 | 阿里云资深技术专家 |
17:00-17:30 | 算法,算力,算料,算理,四位一体超级深度学习新范式 | 詹忆冰 | 京东科技,京东探索研究院算法科学家 |
17:30-18:00 | 超大规模模型训练的趋势及方案介绍 (DGX SuperPOD) | 路川 | 英伟达工程解决方案技术经理 |
18:00-18:30 | 深入分析GPT-3模型训练的存储、计算和网络资源需求 | 刘宏斌 | 英伟达GPU技术专家 |
刘斌 | 英伟达GPU技术专家 | ||
18:30-19:00 | 超大模型部署实践 | 薛博阳 | 英伟达GPU技术专家 |
讲者介绍