多位院士专家领衔|2024 CCF系统软件技术论坛主旨报告抢鲜看
2024年7月7日,以“智能时代的基础软件”为主题的CCF系统软件技术论坛(CCF-TC-24-180)将在长沙延年世纪酒店举行。本次大会由CCF主办,CCF系统软件专业委员会、国防科技大学承办,openKylin社区和长沙理工大学协办。目前会议注册通道已经开放,火热报名中!
会议简介
智能化时代的发展,伴随着模型结构日益复杂、异构资源不断涌现、算力需求持续增长、以及对数据安全隐私的逐渐重视,对基础软件的设计和实现提出了新的挑战,也带来了新的机遇。
为了促进我国基础软件的产学研协同发展,中国计算机学会系统软件专委会定于2024年7月7日在长沙举办CCF系统软件技术论坛(CCF-TC-24-180),论坛主题为智能时代的基础软件。本次论坛目的是为政府主管部门、学术界和产业界搭建交流平台,共同研讨智能时代基础软件面临的理论难题、技术挑战和发展瓶颈,促进我国基础软件领域的科学发展。
主旨报告
廖湘科
CCF会士、中国工程院院士
《软件定义时代的基础软件》
嘉宾简介:廖湘科,中国工程院院士,现任启元实验室主任,国防科大计算机学院研究员、博士生导师,国务院学位委员会软件工程学科评议组召集人,教育部软件工程专业教学指导委员会副主任。长期从事高性能计算机与通用操作系统的科研工作,参加了多代银河巨型机的研制,主持了天河一号、天河二号的研制,主持了麒麟操作系统的研制,为我国高性能计算机系统研制跻身世界领先行列、为国产基础软件的自主可控发展做出了重要贡献。获国家科技进步特等奖1项、一等奖4项;部委级科技进步一等奖8项;教育部十大科技进展2项。
尼玛扎西
中国工程院院士
《面向国产操作系统的多语言支撑技术》
嘉宾简介:尼玛扎西,中国工程院院士,西藏大学教授、博士生导师,是我国藏文信息系统领域学术带头人,长期从事语言智能和自然语言处理研究与工程实践,开拓我国藏文信息系统研究和应用新领域,为满足我国藏族地区长治久安和高质量发展中的信息化重要需求、促进国家语言文字信息系统技术进步做出了突出贡献。获国家科技进步奖二等奖、中国标准创新贡献奖一等奖、全国创新争先奖状、西藏自治区科学技术奖杰出贡献奖、何梁何利基金科学与技术创新奖等荣誉。
武永卫
CCF会士、理事、清华大学教授
《九源智能基础软件栈的实践》
嘉宾简介:武永卫,清华大学费马科技讲席教授、计算机科学与技术系副系主任,IEEE/AAIA Fellow,入选国家级科技创新领军人才。主要从事并行与分布式系统领域的研究工作。担任或曾担任IEEE Transactions on Sustainable Computing指导委员会委员,ACM Computing Surveys, IEEE Transactions on Cloud Computing等国际期刊编委。在IEEE TC、IEEE TPDS、IEEE TSE等知名国际期刊和SOSP、OSDI、MICRO、HPCA、ATC等重要国际学术会议上发表学术论文200余篇。获国家科技进步二等奖1项,国家技术发明二等奖1项,省部级科技进步特等奖1项、一等奖2项。
报告摘要:九源智能基础软件栈旨在为智能算法开发与应用为智能应用的快速开发、高效运行、落地部署和测试评估提供支撑,推动可持续发展的智能计算系统生态形成。
九源基础软件栈包括低代码开发环境、高效训练/推理平台、智能编译优化系统、大数据处理系统、缓存存储系统、分布式图数据库、统一智能计算架构及软硬件适配验证、开放软件共享社区构建等,支持飞桨、Pytorch等智能编程框架,飞腾、鲲鹏等国产处理器,寒武纪、昇腾、昆仑、天数、沐曦等国产智能芯片和麒麟、欧拉等国产操作系统。
谢涛
CCF会士、北京大学教授
《RISC-V+AI算力系统软件栈建设》
嘉宾简介:谢涛,CCF会士,CCF系统软件专委会主任,北京大学讲席教授,北京大学计算机学院软件科学与工程系主任,高可信软件技术教育部重点实验室副主任。曾任美国UIUC计算机系正教授。当选欧洲科学院外籍院士、ACM/IEEE/AAAS会士。主要研究领域包括软件工程,系统软件,软件安全,可信人工智能,RISC-V基础软件。
报告摘要:近年来,RISC-V 开源指令集架构快速发展,已成为当前国际科技竞争的焦点,同时也成为一个有效抓手来以开源开放凝聚产业发展共识,打造全球算力产业生态。尽管当前英伟达的 GPU 及其之上的 CUDA 软件生态主导着全球 AI 算力市场,但产业界迫切希望建立新的软件生态以突破CUDA生态壁垒。一个已逐渐形成的共识是以RISC-V AI芯片为共性,团结广大相关公司和高校科研院所以开源开放的方式共同制定AI扩展指令集标准,并合作研发其上的开源AI系统软件栈。本报告讨论这个方向及其面临的重大机遇和应对挑战的思路。
胡春明
北京航空航天大学教授
《面向大规模训练的智能计算基础软件》
嘉宾简介:胡春明,北京航空航天大学教授,软件学院院长,复杂关键软件环境全国重点实验室副主任,大数据科学与脑机智能北京市高精尖创新中心副主任。担任中国计算机学会(CCF)系统软件专委会副主任,标准工委技术委员会主任。主要研究方向为计算机软件与理论、分布式系统、数据中心资源管理与调度、图计算查询优化、安全攸关的软件开发方法等。
报告摘要:随着大模型的快速发展,模型规模不断扩大,承载训练任务的大规模分布式计算和网络基础设施面临挑战。报告将汇报大规模模型训练对分布式基础软件提出的新要求,探讨智能计算基础软件的新需求,例如通过硬件感知的自适应训练策略和加速器装卸载实现单机单卡的高效模型训练,通过可靠RDMA网络、多作业协同和弹性调度、快速失效恢复等实现多机多卡的高效互联和智算集群调度,提升大规模训练任务时的资源利用率、运行效率和可靠性。