CCF@U753:卜佳俊、段楠走进西安交通大学
2019年12月20日,CCF走进高校活动来到西安交通大学。CCF杰出会员、CCF常务理事、浙江大学卜佳俊教授,CCF专业会员、微软亚洲研究院段楠博士受邀为西安交通大学的师生带来188体育投注:“人工智能”的专题报告。CCF西安分部秘书长、西安交通大学电信学院钱步月博士与该校教师、研究生和本科生约60余人聆听了本次报告会。报告会由CCF西安交通大学学生分会主席张汉宁主持。
张汉宁主持报告会
张汉宁首先对两位讲者的到来表示热烈的欢迎。然后他向大家介绍了CCF和CCF走进高校活动,并介绍了CCF西安交大学生分会的工作,鼓励大家积极加入CCF。接下来,报告会正式开始。
卜佳俊的报告题目是《人工智能助力盲人信息无障碍》。信息无障碍是指任何人(无论是健全人还是残疾人,无论是年轻人还是老年人)在任何情况下都能平等、方便地理解、交互和利用信息。信息技术的进步在促进时代发展的同时,也给残疾人,尤其是盲人和聋哑人带来了前所未有的机遇和极大的挑战。188体育投注:如何用人工智能技术帮助盲人获取信息,卜佳俊从关键技术、系统平台、标准规范几方面详细讲述了目前的工作进展,为同学们展开了一片人工智能助力残障人士的新天地。
卜佳俊作报告
段楠的报告题目是《跨语言/跨模态预训练模型》。段楠首先介绍了预训练模型发展中遇到的挑战,然后介绍了微软研究院在跨语言/跨模态的预训练模型上所做的工作,并介绍了XLM和Unicoder等跨语言预训练模型的设计思路。他重点介绍了微软研究院目前所在做的Unicoder-VL。这是一个以预训练的方式学习视觉和语言的联合表征的通用编码器。这个模型中视觉和语言内容都会被传入一个多层transformer中,作为跨模态预训练阶段。预训练阶段使用三个任务,包括掩蔽语言建模、掩蔽对象标签预测以及视觉-语言匹配。前两个任务会让模型学习从基于语言和视觉内容输入的联合token学习到内容相关的表征;后一个任务尝试预测一张图像和一段文本描述之间是否相符。在大量的图像-描述对上预训练之后,把Unicoder-VL迁移到了图像-文本检索任务上,只添加了一个额外的输出层,就在MSCOCO和Flicker30K两个数据集上都取得了目前最佳的表现。
段楠作报告
认真聆听
报告结束后,同学们积极地向两位讲者提出问题,两位讲者详细解答了同学们的疑问。同学们纷纷表示获益匪浅。本次活动在热烈的气氛中圆满结束。