强化学习：解锁决策大模型新纪元的智慧之钥 | YEF2024

阅读量:10 2024-05-10 收藏本文

扫描报名二维码：

（扫码报名）

强化学习，凭借其独特的试错与优化机制，与智能决策问题的需求天然契合，被视为开启决策大模型新纪元的智慧之钥。然而，随着大语言模型的迅猛发展，其高效的语言理解和生成能力赋予了智能决策系统卓越的信息处理和知识推理能力，使得基于大语言模型的智能决策成为研究焦点。

相比之下，基于强化学习的决策大模型研究尚处于初期探索阶段，面临诸多技术挑战。在复杂场景下，算法的效率与稳定性问题亟待攻克，模型的可解释性不足，决策逻辑难以直观展现，这在一定程度上制约了基于强化学习的决策大模型的发展。

为了深入推动决策智能体研究，探索以强化学习为驱动的决策大模型研究路径，本次论坛将聚焦“强化学习：解锁决策大模型新纪元的智慧之钥”主题，围绕该领域的最新研究成果、技术瓶颈及未来趋势展开深入交流。期望通过嘉宾与听众深入的研讨与思辨，促进强化学习与决策大模型的深度融合，为智能决策领域注入新的创新动力，引领未来技术的发展方向。

论坛安排

顺序	主题	主讲嘉宾	单位
1	机器人系统的高效强化学习研究进展	徐昕	国防科技大学
2	大模型与强化学习融通演进的一些进展	俞扬	南京大学
3	知识增强大模型：垂域落地的最后一公里	王昊奋	同济大学
4	面向智能决策的强化学习与大模型智能体研究	张俊格	中国科学院自动化研究所
5	开放环境智能博弈及大模型思考	彭佩玺	北京大学
	Panel环节	徐昕	国防科技大学
		俞扬	南京大学
		王昊奋	同济大学
		张俊格	中国科学院自动化研究所
		彭佩玺	北京大学

执行主席

魏巍

CCF杰出会员

山西大学教授、计算机与信息技术学院（大数据学院）副院长

担任CCF人工智能与模式识别专委执委、大数据专委执委，曾任YOCSEF太原分论坛2022-2023年度主席。主要从事强化学习、表示学习等方面的研究，先后主持和参与国家重点研发计划项目、国家自然科学基金重点项目、国家自然科学基金面上项目、山西省自然科学基金项目10余项，在《IEEE TKDE》、《Machine Learning》、ICML、AAAI等重要学术期刊会议发表论文40余篇，获国家发明专利3项。

共同执行主席

188体育app官网_188体育投注

强化学习：解锁决策大模型新纪元的智慧之钥 | YEF2024