188体育app官网_188体育投注

返回首页

术语发布:多领域端到端任务型对话系统 | CCF术语快线

阅读量:45 2021-08-24 收藏本文

此文收录于CCF计算机术语审定委员会的术语快线话题,本期联合自然语言处理专业委员会推出行业术语热词介绍。



开篇导语:


此文收录于CCF计算机术语审定委员会的术语快线话题,本期联合自然语言处理专业委员会推出行业术语热词介绍。


本期所选术语热词为:多领域端到端任务型对话系统(Multi-domain End-to-end task-oriented Dialogue System)。近几年,端到端任务型对话系统建模开始变得流行,它是指系统能够直接生成回复通过给定的对话历史和相应的知识库。而多领域端到端任务型对话系统指的是能够直接部署到多个领域的对话系统。


作者:覃立波(哈尔滨工业大学)、车万翔(哈尔滨工业大学)。


多领域端到端任务型对话系统(Multi-domain End-to-end task-oriented Dialogue System)


InfoBox:

中文名:多领域端到端任务型对话系统

外文名:Multi-domain End-to-end task-oriented Dialogue System

简称:Multi-domain EToDs

学科:自然语言处理

实质:利用序列到序列端到端模型完成多领域功能的任务型对话系统


基本定义:

任务型对话系统可以用来帮助用户完成订购机票、餐厅预订等业务,越来越受到研究者的关注。近几年,端到端任务型对话系统建模开始变得流行,它是指系统能够直接生成回复通过给定的对话历史和相应的知识库。相比传统的流水式任务型对话系统[1],端到端系统具有缓解错误级联的优点。而多领域端到端任务型对话系统指的是能够直接部署到多个领域的对话系统。


背景与动机:

前人的模型虽然已经达到了较好的效果,但端到端的模型依赖于大量的标注数据进行训练,这导致模型在一个新拓展的领域上很难利用。而实际上,对于一个新的领域,总是很难收集足够多的数据,这就体现构建一个多领域端到端任务型对话系统的重要性和必要性,它能够将知识从具有充足标注数据的源领域迁移到一个只有少量标注数据的新领域,从而提高多个领域数据上的效果。


研究概况:

近年来,多领域端到端任务型对话系统可以主要分为三个流派,如图1所示:(1)隐式多领域混合建模;(2)各领域单独建模;(3)领域特征显式建模。

 

640 (1)

图1:多领域端到端任务型对话系统研究概括。


隐式多领域混合建模(Implicit Multi-domain Modeling)

如图1(a)所示,Eric等人[2][3][4] 将多领域的数据集结合起来进行训练,用以隐含地提取领域共享特征,但该类方法难以有效地捕捉领域特定的知识。


各领域单独建模(Independent Domain Modeling)

如图1(b)所示,Wen等人[5][6]为每个领域单独训练模型,这可以更好地捕捉领域特定的特征。然而,这些方法忽略了不同领域之间的共享知识。


领域特征显式建模(Explicit Multi-domain Modeling)

如图1(c)所示,Qin[7]等人首次在多领域端到端任务型对话系统中探索shared-private框架去同时建模领域共享和领域私有的特征。并且,该文还提出一个动态聚合网络去动态考虑领域之间的细粒度关系,该方法也是第一个在SMD公开数据集上超过人类水平的模型。


多领域端到端任务型对话系统下一阶段的研究任务将关注于:(1)处理对话内部涉及到多领域变换的对话场景;(2)目标领域无任何标注数据的zero-shot多领域迁移场景;(3)在实际应用过程中,如何做好新领域扩充的在线学习。


参考文献:

[1] Steve J. Young, Milica Gasic, Blaise Thomson, and Jason D. Williams. 2013. Pomdp-based statistical spoken dialog systems: A review. Proceedings of the IEEE, 101(5):1160–1179.
[2] Mihail Eric, Lakshmi Krishnan, Francois Charette, and Christopher D. Manning. 2017. Key-value retrieval networks for task-oriented dialogue. In Proceedings of the 18th Annual SIGdial Meeting on Discourse and Dialogue, pages 37–49, Saarbr¨ucken, Germany. Association for Computational Linguistics.
[3] Andrea Madotto, Chien-Sheng Wu, and Pascale Fung. 2018. Mem2Seq: Effectively incorporating knowledge bases into end-to-end task-oriented dialog systems. In Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 1468–1478, Melbourne, Australia. Association for Computational Linguistics.
[4] Chien-Sheng Wu, Richard Socher, and Caiming Xiong. 2019a. Global-to-local memory pointer networks for task-oriented dialogue. In 7th International Conference on Learning Representations, ICLR 2019, New Orleans, LA, USA, May 6-9, 2019.
[5] Haoyang Wen, Yijia Liu, Wanxiang Che, Libo Qin, and Ting Liu. 2018. Sequence-to-sequence learning for task-oriented dialogue with dialogue state representation. In Proceedings of the 27th International Conference on Computational Linguistics, pages 3781-3792,
[6] Libo Qin, Yijia Liu, Wanxiang Che, Haoyang Wen, Yangming Li, and Ting Liu. 2019b. Entityconsistent end-to-end task-oriented dialogue system with KB retriever. In Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLPIJCNLP), pages 133–142
[7] Libo Qin, Xiao Xu, Wanxiang Che, YueZhang, and Ting Liu. Dynamic fusion network for multidomain end-to-end task-oriented dialog. In Proceedings of the 58th Annual Meeting of the Association f for Computational Linguistics, pages 6344–6354, 2020.

术语工委及术语平台介绍:

计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。


术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。


新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入188体育app官网:的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。

微信图片_20230410125847



计算机术语审定工作委员会

主任:

刘挺(哈尔滨工业大学)

副主任:

王昊奋(同济大学)

李国良(清华大学)

主任助理:

李一斌(上海海乂知信息科技有限公司)

执行委员:

丁军(上海海乂知信息科技有限公司)

林俊宇(中国科学院信息工程研究所)

兰艳艳(清华大学)

张伟男(哈尔滨工业大学)

640 (1)