从GPT到DeepSeek:智能时代的新型网络架构、系统与优化 | CCF数图焦点 第50期
DeepSeek的横空出世,在蛇年春节之际再次在全球范围内引爆了人工智能的热点话题。人们不禁好奇:Deepseek这种大模型是如何训练和部署的?在以DeepSeek为代表的训练和推理过程中,其成功的关键在于对包括网络和系统软硬件的全方位优化。随着人工智能的飞速发展,特别是以GPT为代表的大语言模型的崛起,对传统网络架构和系统提出了前所未有的挑战。为应对海量数据处理、高效模型训练和低延迟推理等需求,智能时代呼唤新型网络架构、系统与优化技术的出现。为了探究大语言模型对于网络和系统的需求,引领未来面向大模型信息系统构建技术的发展,本次专题汇集了华为、腾讯、阿里等互联网大厂的大模型训练部署实践,也梳理了大小模型协同、云际部署、DeepSeek系统软件优化等学术界的前沿技术,方便会员集中观看学习。
编委主任:苏金树 CCF会士 军事科学院
本期主编:赵宝康 CCF互联网专委副主任 国防科技大学
本期编委:周 寰 国防科技大学
第50期详细专题可点击链接查看>>从GPT到DeepSeek:智能时代的新型网络架构、系统与优化
<<< 上一篇
CSP满分说 | 吉林大学欧阳承风:备考三要素—
<<< 下一篇 一次性两场,CCF NOI-Pre 2025年首次系列直播