CNCC | 大语言模型在数学领域的前瞻问题与挑战:理论、方法与应用

CNCC2023将于10月26日至28日在沈阳举行,会议期间将举办129场技术论坛,涵盖人工智能、安全、计算+、软件工程、教育、网络、芯片、云计算等30余个方向。本文特别介绍将于10月28日举办的【大语言模型在数学领域的前瞻问题与挑战:理论、方法与应用】技术论坛。
数学一直被视为人工智能的试金石。当大语言模型突破其“先天性的缺陷”,成功应对数学方面的挑战时,世界人工智能将进入新的纪元。论坛将深入探讨大语言模型推理能力在数学领域的进展和挑战,分析如何提升大模型数学推理能力,展望大语言模型在数学领域的前景和研究方向。
报名及了解更多技术论坛信息请识别下图二维码进入CNCC2023官网。
在生成文本段落、模拟人类对话及解决数学问题表现惊人的大语言模型,是这几年人工智能发展最热门的领域之一。大语言模型实例ChatGPT的横空出世,则为其发展注入了一针强心剂,带来AI研发应用新范式并改变AI生态格局。然而大模型在以数学推理为代表的复杂推理上表现欠佳,难以应对数学领域的研究难题。另一方面,由于大模型在数学概念理解与生成能力、可解释性与透明度、泛化能力、误差与稳定性、个性化与趣味性等方面存在不足,尚难满足基础教育应用要求。
如何提升大模型数学能力,突破语言模型的先天性不足,成为了当下人工智能领域关注的重点。本论坛将从大模型的前世今生出发,结合当下最新研究成果,分析探讨大语言模型推理能力在数学领域的进展和挑战。包括如何准确衡量语言模型的数学推理表现;探讨模型在数学推理中生成结果错误率高的原因,以及可能的解决策略;研讨新方法、新技术,使模型在数学推理时产生更稳定、连贯的解题步骤;研讨如何让模型提升学习体验和效果;面向未来,语言模型在数学推理上的应用将如何改变传统的教学模式。

论坛安排

顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 大模型基座赋能:由通到专的实践和思考 | 吴飞 | 浙江大学 |
2 | 面向教学的大规模多模态预训练模型 | 刘均 | 西安交通大学 |
3 | 大模型让大规模个性化学习真正成为可能 | 田密 | 好未来集团 |
4 | 融合教育心理学的对话大模型:EduChat | 周爱民 | 华东师范大学 |

论坛主席

刘子韬
暨南大学教授、广东智慧教育研究院院长
CCF高级会员、暨南大学广东智慧教育研究院教授,博士生导师,研究院院长。在ICML、NeurIPS等人工智能领域顶级会议和期刊上发表论文80余篇,国内外授权发明专利40余项。担任国际人工智能教育协会执行委员、第25届国际人工智能教育大会(AIED)程序主席。主持和参与国家重点研发计划课题、科技创新2030-新一代人工智能重大项目等多项科研工作。研究成果获得了包含CCTV新闻联播、CCTV正点财经、人民网、新华网等多家新闻媒体和新闻网站报道。
共同主席
王延峰
上海人工智能实验室主任助理
上海交通大学人工智能研究院副院长、未来媒体网络协同创新中心副主任
现任第十六届上海市人大代表。国家科技创新2030——“新一代人工智能”重大项目指南编制专家组成员、国家科技创新2030——“新一代人工智能”重大项目管理专家组成员、国家发改委“互联网+”行动专家咨询委员会成员、国家发改委人工智能产业咨询专家委员会成员。

论坛讲者

吴飞
浙江大学教授、人工智能研究所所长
CCF高级会员、浙江大学求是特聘教授,博士生导师。主要研究领域为人工智能、多媒体分析与检索。浙江大学上海高等研究院常务副院长、浙江大学人工智能研究所所长。国家杰出青年科学基金获得者(2016年),科技部科技创新2030“新一代人工智能”重大项目管理专家组成员和指南编制专家、教育部人工智能科技创新专家组工作组组长(2018.8-2020.12)、中国工程院院刊《Engineering》信息与电子工程学科执行主编,浙江大学第九届永平杰出教学贡献奖获得者。曾获教育部科技进步一等奖(排名第一)和中国电子学会科技进步一等奖(排名第一),著有《人工智能导论:模型与算法》和《走进人工智能》(高等教育出版社),开设国家级首批线上一流课程《人工智能:模型与算法》。
大模型基座赋能:由通到专的实践和思考
本报告介绍大模型训练过程中预训练、有监督微调和人在回路反馈等代表性算法,刻画“预训练模型+提示学习+预测”机器学习范式中数据和模型为大、语言点金的特点。同时介绍以高质量教材级语料打造的面向101计划核心课程《人工智能引论》教学的垂直领域大模型智海三乐以及通过逻辑丰富语料打造的面向智能司法的垂直领域大模型智海-录问。
刘均
西安交通大学计算机学院教授/博导
CCF高级会员,斯坦福大学高级访问学者,陕西省大数据知识工程重点实验室主任,曾入选国家级领军人才。担任IEEE TNNLS 编委以及多个期刊等客座编辑。主要研究方向为自然语言处理、计算机视觉、智慧教育。近年来,承担了国家重点研发计划项目、国家自然科学基金重点项目。在IEEE TPAMI、IJCV、IEEE TKDE等发表论文百余篇,出版专著2部,授权发明专利20项;获国家科技进步二等奖、国家教学成果二等奖、陕西省技术发明一等奖、中国自动化学会科技进步特等奖;获陕西省优博指导教师、王宽诚育才奖等荣誉与奖励。
面向教学的大规模多模态预训练模型
以ChatGPT为代表的大模型大大提升了通用智能与内容生成能力,有望成为教育数字化的人工智能基础设施。然而,现在大模型应用于教学场景还面临一系列挑战:一是生成内容存在幻觉、意识形态、价值观等问题;二是跨媒体教学内容理解能力弱,特别是对于包含示意图的教学资源;三是缺少分而治之的规划与推理能力;四是很难生成符合用户需求、认知水平等的个性化内容。对此,需要构建面向教育的大规模多模态预训练项模型,突破 “临门一脚”关键技术,推动关键环节自主可控。
田密
好未来集团CTO
CCF会员,好未来集团CTO。全面负责好未来的技术研发工作。当前,他聚焦在教育大模型的研发上,带领团队研发了MathGPT大模型和基于大模型的AI Tutor产品。他曾经是阿里巴巴集团的资深技术总监、腾讯集团研发总监。田密拥有北京航空航天大学计算机学院的本科和硕士学位,硕士研究生师从李德毅院士,研究方向是人工智能和数据挖掘。
大模型让大规模个性化学习真正成为可能
因材施教、有教无类,是人类上千年来追求的目标。LLM技术的兴起,让大规模个性化学习有了解决的可能性。LLM的本质是一种更高效的、从数据中学习知识并加以应用的方式。在AI能力的加持下,“学生自学+AI答疑”的新型学习方式将成为广泛的可能。令人遗憾的是,虽然全球已经有很多优秀的LLM,如GPT-4,但是都无法直接用于个性化学习,尤其是数学学习。针对这一难题,学而思推出国内首个数学领域千亿级大模型——MathGPT,创造性将大模型和计算引擎两者能力进行结合,有效解决LLM在数学领域的三大挑战——解对题、讲清步骤、内容有趣生动。本次报告将会从MathGPT的研发逻辑、效果等方面详细阐述MathGPT如何破解数学领域应用难题。
周爱民
华东师范大学计算机科学与技术学院院长
CCF会员,华东师范大学计算机科学与技术学院院长、华东师范大学上海智能教育研究院院长、教育部华东师范大学智能教育实验室副主任、上海市IV高峰学科(智能教育)负责人。主要研究领域包括演化优化与学习、机器学习、智能教育等。发表SCI一区/CCF A类期刊会议学术论文40余篇,相关成果谷歌学术累计引用8400余次。担任期刊Swarm and Evolutionary Computation副编辑、Complex & Intelligent Systems编委以及Chinese Journal of Electronics副编辑。获爱思唯尔2020-2022年度中国高被引学者称号、2022年上海市高等教育优秀教学成果(本科教育)二等奖。
融合教育心理学的对话大模型:EduChat
大模型在通用任务展现出了较好的处理能力,然而在教育垂直领域仍然面临很多问题,如幻觉和知识更新滞后、缺乏启发式引导、缺乏深度情感交互、缺乏个性化等,这些问题严重影响了大模型的落地应用。针对这些问题,团队近期在教育学和心理学等理论指导下,研发了面向教育垂直领域的对话大模型EduChat。本报告将介绍我们在教育大模型方面的一些探索,包括教育功能设计、数据构建、模型训练等细节,以及在数学和心理等方面的应用。
今年恰逢CNCC创办20周年。二十年来,CNCC已逐渐发展到涵盖数十个方向129场技术论坛,700余位国内外讲者积极参与,超过13000人注册的计算领域年度盛会。二十载不断超越,作为国内计算领域参会人员众多,规模大,水平高的年度盛会,CCF将精心筹划,为参会者带来一场前沿碰撞、展望未来的技术盛宴,让每位参会者都能在CNCC这个超大体量专业平台上提升自身的专业价值,获得前行的动能!等你来,马上行动,欢迎参会报名!