术语发布:多领域端到端任务型对话系统 | CCF术语快线
此文收录于CCF计算机术语审定委员会的术语快线话题,本期联合自然语言处理专业委员会推出行业术语热词介绍。
开篇导语: 此文收录于CCF计算机术语审定委员会的术语快线话题,本期联合自然语言处理专业委员会推出行业术语热词介绍。 本期所选术语热词为:多领域端到端任务型对话系统(Multi-domain End-to-end task-oriented Dialogue System)。近几年,端到端任务型对话系统建模开始变得流行,它是指系统能够直接生成回复通过给定的对话历史和相应的知识库。而多领域端到端任务型对话系统指的是能够直接部署到多个领域的对话系统。 作者:覃立波(哈尔滨工业大学)、车万翔(哈尔滨工业大学)。 多领域端到端任务型对话系统(Multi-domain End-to-end task-oriented Dialogue System) InfoBox: 中文名:多领域端到端任务型对话系统 外文名:Multi-domain End-to-end task-oriented Dialogue System 简称:Multi-domain EToDs 学科:自然语言处理 实质:利用序列到序列端到端模型完成多领域功能的任务型对话系统 基本定义: 任务型对话系统可以用来帮助用户完成订购机票、餐厅预订等业务,越来越受到研究者的关注。近几年,端到端任务型对话系统建模开始变得流行,它是指系统能够直接生成回复通过给定的对话历史和相应的知识库。相比传统的流水式任务型对话系统[1],端到端系统具有缓解错误级联的优点。而多领域端到端任务型对话系统指的是能够直接部署到多个领域的对话系统。 背景与动机: 前人的模型虽然已经达到了较好的效果,但端到端的模型依赖于大量的标注数据进行训练,这导致模型在一个新拓展的领域上很难利用。而实际上,对于一个新的领域,总是很难收集足够多的数据,这就体现构建一个多领域端到端任务型对话系统的重要性和必要性,它能够将知识从具有充足标注数据的源领域迁移到一个只有少量标注数据的新领域,从而提高多个领域数据上的效果。 研究概况: 近年来,多领域端到端任务型对话系统可以主要分为三个流派,如图1所示:(1)隐式多领域混合建模;(2)各领域单独建模;(3)领域特征显式建模。 图1:多领域端到端任务型对话系统研究概括。 隐式多领域混合建模(Implicit Multi-domain Modeling) 如图1(a)所示,Eric等人[2][3][4] 将多领域的数据集结合起来进行训练,用以隐含地提取领域共享特征,但该类方法难以有效地捕捉领域特定的知识。 各领域单独建模(Independent Domain Modeling) 如图1(b)所示,Wen等人[5][6]为每个领域单独训练模型,这可以更好地捕捉领域特定的特征。然而,这些方法忽略了不同领域之间的共享知识。 领域特征显式建模(Explicit Multi-domain Modeling) 如图1(c)所示,Qin[7]等人首次在多领域端到端任务型对话系统中探索shared-private框架去同时建模领域共享和领域私有的特征。并且,该文还提出一个动态聚合网络去动态考虑领域之间的细粒度关系,该方法也是第一个在SMD公开数据集上超过人类水平的模型。 多领域端到端任务型对话系统下一阶段的研究任务将关注于:(1)处理对话内部涉及到多领域变换的对话场景;(2)目标领域无任何标注数据的zero-shot多领域迁移场景;(3)在实际应用过程中,如何做好新领域扩充的在线学习。 参考文献:
术语工委及术语平台介绍:
计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。
术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。
新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入188体育app官网:的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。
计算机术语审定工作委员会 主任: 刘挺(哈尔滨工业大学) 副主任: 王昊奋(同济大学) 李国良(清华大学) 主任助理: 李一斌(上海海乂知信息科技有限公司) 执行委员: 丁军(上海海乂知信息科技有限公司) 林俊宇(中国科学院信息工程研究所) 兰艳艳(清华大学) 张伟男(哈尔滨工业大学)