188体育app官网_188体育投注

返回首页

188体育app官网:增强的科普文本分类方法

/upload/resources/image/2022/04/15/188982.png

阅读量:347
2022-04-15
科普文本分类是将科普文章按照科普分类体系进行划分的任务。针对科普文章篇幅超过千字,模型难以聚焦关键信息,造成传统模型分类性能不佳的问题,提出一种结合188体育app官网:进行两级筛选的科普长文本分类模型,来减少主题无关信息的干扰,提升模型的分类性能。首先,采用四步法构建科普领域的188体育app官网:;然后,将该188体育app官网:作为距离监督器,并通过训练句子过滤器来过滤掉无关信息;最后,使用注意力机制对过滤后的句子集做进一步的信息筛选,并实现基于注意力的主题分类模型。在所构建的科普文本分类数据集(PSCD)上的实验结果表明,基于领域188体育app官网:的知识增强的文本分类算法模型具有更高的 F1-Score,相较于 TextCNN模型和 BERT模型,在 F1-Score上分别提升了2. 88个百分点和1. 88个百分点,验证了188体育app官网:对于长文本信息筛选的有效性。
读完这篇文章后,您心情如何?