CNCC | 向垂域进军:AI大模型引领金融革新

CNCC2023将于10月26日至28日在沈阳举行,会议期间将举办130场技术论坛,涵盖人工智能、安全、计算+、软件工程、教育、网络、芯片、云计算等30余个方向。本文特别介绍将于10月27日举办的【第三届智慧金融论坛—AI大模型驱动的金融创新】技术论坛。
本论坛将探讨AI语言大模型如何助力金融创新,聚焦大模型训练和部署、提示工程、安全性、可靠性等前沿议题,探讨金融大模型的构建与应用,展示研究进展,针对金融领域的大模型应用展开深度探讨与开放交流。
报名及了解更多技术论坛信息请识别下图二维码进入CNCC2023官网。
随着AI语言大模型的崛起,数字化、信息化和智能化技术在金融领域的应用不断拓展。然而,在这个快速发展的领域中,如何更好地利用大模型助推金融创新,同时保障大模型应用的安全性和可靠性,成为重要研究课题。
尽管AI大模型在金融领域具备巨大潜力,但大模型的训练和部署、提示工程以及应用安全等方面均是亟待深入讨论的话题。训练数据的隐私性,提示语的有效性,以及大模型在金融应用中可能带来的潜在风险等问题仍需要解决。
第三届智慧金融技术论坛将聚焦于以下核心议题:大模型技术在金融场景中的应用挑战,语言大模型与其他数据模态、其他机器学习方法的结合,如何防范大模型的普及给金融领域带来的新型风险,大模型是否会给金融领域带来巨大的范式变革等。通过深入探讨这些议题,论坛旨在推动金融科技与人工智能的融合,促进智能金融领域的可持续发展。

论坛安排

顺序 | 主题 | 主讲嘉宾 | 单位 |
1 | 金融大模型的进展和挑战 | 周明 | 北京澜舟科技有限公司 |
2 | 大模型垂直领域落地的路径和技术挑战 | 白硕 | 恒生电子股份有限公司 |
3 | 图数据预训练与提示学习 | 李佳 | 香港科技大学(广州) |
4 | 金融科技背景下系统性风险防范:发展基于社会计算的多模态信息融合监管技术 | 赵琳 | 西南财经大学大数据研究院 |
5 | 知识增强的机器学习在蚂蚁金融场景的应用 | 刘子奇 | 蚂蚁集团 |
Panel嘉宾 | 敖翔 | 中国科学院计算技术研究所 | |
曹政 | 九坤信息科技有限公司 | ||
周明 | 北京澜舟科技有限公司 | ||
白硕 | 恒生电子股份有限公司 | ||
李佳 | 香港科技大学(广州) | ||
赵琳 | 西南财经大学大数据研究院 | ||
刘子奇 | 蚂蚁集团 |

论坛主席

敖翔
中国科学院计算技术研究所副研究员
CCF高级会员,CCF大数据专家委员会执行委员,博士,中国科学院计算技术研究所副研究员,硕士生导师。研究方向为智能金融、数据挖掘与自然语言处理。先后主持国家自然科学基金项目3项,CCF-腾讯犀牛鸟科研基金(获优秀奖)、腾讯广告犀牛鸟专项基金、阿里巴巴AIR计划(获优秀学术合作项目)、蚂蚁金服金融安全专项基金等10余项科研项目,在IEEE TKDE、KDD、WWW、ICDE、SIGIR、ACL、AAAI、IJCAI等国际权威期刊和会议上发表论文70余篇,其中CCF A类40余篇。入选北京市科技新星、中科院青促会、微软亚洲研究院“铸星计划”。担任SIGKDD、WWW、SIGIR、ACL、AAAI、IJCAI等学术会议(高级)程序委员。
共同主席
曹政
九坤信息科技有限公司首席科学家
博士,CCF高性能专委、体系结构专委、区块链专委委员,聚焦金融科技领域的先进技术研发。中国科学院计算机系统结构博士学位,加州大学博士后,共发表论文80余篇,专利60余项(中国专利金奖一项),国家十三五重大专项课题负责人。曾任阿里云灵骏智能计算研发&产品总监,为阿里云开辟了高端智能计算方向。加入阿里云之前,在中国科学院计算技术研究所开展高性能计算和数据中心领域的研究工作,骨干承担了曙光5000~曙光7000的异构计算和高性能网络系统研发,其中曙光6000“星云”系统在2010年位列世界第二。

论坛讲者

周明
CCF会士,CCF副理事长
北京澜舟科技有限公司创始人、CEO
世界 NLP 领域的领军人物,世界上发表 ACL 论文最多的学者之一。曾任国际计算语言学学会主席、微软亚洲研究院副院长。中国人工智能学会会士和五所大学的博士生导师。1991 年在哈工大计算机系获博士学位,研发了中国最早的中-英机器翻译系统 CEMT-I。1991年-1999年在清华大学先后从事博士后研究和任教。1993-1999年在日本领导了著名的中-日机器翻译产品 J-北京的研发。于 1999 年加入微软亚洲研究院并长期领导 NLP 研究。于 2021 年孵化并创立了澜舟科技并荣获北京 HICOOL(2021年)创业大赛最高奖。
金融大模型的进展和挑战
随着通用大模型的不断发展,金融领域也开始逐渐应用大规模建模方法来解决复杂的业务场景。其中,大模型在金融领域的搜索、问答、写作、翻译、信息抽取等技术领域取得显著成果,并且在投研、投顾、风控、客服、推荐、信贷评估、投资组合优化等多个领域孕育着巨大应用潜力。据不完全统计,当前金融领域各类大模型已超过20个,应用于投研决策、数据分析、智能交互等业务方向。然而,由于金融数据难以获取,机构之间数据无法共享,加之金融行业本身具有高度不确定性和复杂性的特点,因此如何构建高效可靠的金融大模型仍然是一个巨大的挑战。在此背景下,澜舟公司推出了一款名为孟子金融大模型的产品,在大模型在金融领域的应用进行了有益的尝试。孟子金融大模型基于孟子通用大模型,利用多渠道搜集、整理的金融领域数据进行预训练和SFT进行训练。为了保证模型的在金融任务的有效性,定义了105种常见金融任务进行优化和评测。目前已经完成了7B、13B和40B的模型,并可以提供使用。本讲座将介绍金融大模型的进展以及孟子金融大模型的实践,归纳目前金融大模型遇到的挑战并探讨未来的发展方向。
白硕
恒生电子股份有限公司副总工程师
北京大学计算机系博士。1992-2000年在中科院计算所工作,历任副研究员、研究员、博士生导师、软件研究室主任,兼任曙光信息产业有限公司副总工程师。2000-2002年任国家计算机网络信息安全管理中心技术组织处处长兼实验室主任,参与了国家信息安全重大专项,规划了信息安全预研课题并参与筹建了国家计算机网络应急协调技术中心(CNCERT/CC)。2002-2016年,在上海证券交易所工作期间,任总工程师、技术中心主任、党委委员,2012年起兼任领导了核心交易系统、监察系统、企业级数据仓库等一大批重要信息系统的升级换代工程和 XBRL 上市公司电子化信息披露项目,领导制定了金桥数据中心建设规划。2003-2016年任中国中文信息学会信息检索与内容安全专委会主任委员,188体育app官网:起任中国计算机学会区块链专委会顾问委员、丹渥智能科技有限公司董事长。2019年起任CCF上海分部主席。2021年起任恒生研究院院长、首席科学家。
大模型垂直领域落地的路径和技术挑战
大型语言模型带来了诸多机遇,对通用领域和金融领域产生了全方位的影响,未来将形成“语控万物”的应用格局。但由于金融行业自主可控和数据安全的因素,决定了实现大型语言模型的有效落地,需要找到一条真正符合国内资产管理行业需求和现状的路径。相比通用领域,行业的优势在于理解模型、数据和应用。本报告将首先从大型模型的应用能力开始,分析大型模型的应用场景,提出大型模型在金融领域的内部赋能研发模式,并将其应用于智能客服、风险控制运营、投资顾问营销等金融业务的典型应用场景。本报告还将深入探讨上述新研发范式的落地路径,解析如何构建金融行业大型模型基础设施的关键问题,包括数据来源和规模、可行的训练部署方式、计算力的部署等,强调行业机构实施大型模型必须至少是垂直领域的精细调整模型,并可以借助大型模型与金融领域已有的专业数据库、专业188体育app官网:等进行接口对接,以赋能金融领域的应用。同时,本报告针对大型语言模型面临的数据安全、内容可控性、业务连续性以及成本等挑战,提出了国产大型模型的替代方案和行业能力中心建设的策略。
李佳
香港科技大学(广州)助理教授
香港科技大学(广州)数据科学与分析学域助理教授,2021年博士毕业于香港中文大学。李佳博士在工业界有多年的图数据挖掘工作经历,曾供职于Google和腾讯(微信支付风控)。其研究目前主要为图数据的大模型,异常检测,图神经网络以及基于图数据的药物发现和医疗健康。他以第一作者或者通讯作者在人工智能与数据挖掘领域顶级会议与期刊发表二十多篇CCF-A论文,如Nature Communications, NeurIPS, SIGKDD, ICML, TPAMI等。他的工作获得2023年SIGKDD Best Research Paper Award,是中国大陆首次获得该荣誉。
图数据预训练与提示学习
大型语言模型的最新进展催生了OpenAI的ChatGPT等高效模型,这些模型的发展主要集中在文本数据的预训练范式和下游提示学习当中。本演讲将涵盖图数据的预训练和提示学习的一些最新进展。首先会介绍图预训练范式中基于对比学习和基于重建范式的路线之争。针对基于重建范式的图数据预训练,重点介绍基于图反卷积的解码模型WGDN。针对图数据提示学习,重点介绍基于子图模式的提示学习,并就如何提升图神经网络多任务学习做重点展开。最后,我们将展望图数据大模型未来发展,并讨论它带来的机遇和挑战。
赵琳
西南财经大学大数据研究院特聘教授/博导
清华大学理学学士、博士,兼任国际管理学顶刊Management Science行为决策领域副主编。长期从事行为决策、风险管理、运营管理等研究工作,获2020年系统科学与系统工程青年科技奖等。
金融科技背景下系统性风险防范:发展基于社会计算的多模态信息融合监管技术
金融科技以信息技术与数据汇聚为基石,正在重塑金融系统的信任与安全主干,赋能各类金融活动更趋便捷与智能,并引发金融系统去中介、去监管、服务下沉的新趋势。与此同时,各类与金融科技相关的新型炒作、操纵、投机、欺诈等问题也接连出现,其高杠杆和高扩散的特点增加了发生系统性风险的可能性。报告提出发展基于社会计算的多模态融合监管技术,探究将来自文本、图像、视频、音频的多模态信息源融合为统一完整的信息集,为防范系统性风险提供更精准的决策支持。
刘子奇
蚂蚁集团高级算法专家
于2017年获得西安交大博士学位,曾在卡内基梅隆大学机器学习系担任访问学者。2017年加入蚂蚁集团主要从事机器学习研究和应用相关工作。目前在蚂蚁集团机器智能部负责大模型、知识增强的机器学习算法工作。常年担任NeurIPS、ICML等顶会审稿人,发表论文50+篇,两次获得WSDM、SDM等best paper相关奖项。
知识增强的机器学习在蚂蚁金融场景的应用
随着AI大模型的突破性发展,引发了人工智能行业对理解、利用AI大模型和知识赋能典型智能化场景的思考。本分享主要围绕AI大模型和188体育app官网:(KG)等知识对工业界场景的价值,从KG增强预训练任务、KG增强LLM和LLM&KG增强的机器学习任务三个角度,及在蚂蚁集团金融场景的应用展开。
今年恰逢CNCC创办20周年。二十年来,CNCC已逐渐发展到涵盖数十个方向130场技术论坛,700余位国内外讲者积极参与,超过13000人注册的计算领域年度盛会。二十载不断超越,作为国内计算领域参会人员众多,规模大,水平高的年度盛会,CCF将精心筹划,为参会者带来一场前沿碰撞、展望未来的技术盛宴,让每位参会者都能在CNCC这个超大体量专业平台上提升自身的专业价值,获得前行的动能!等你来,马上行动,欢迎参会报名!