188体育app官网:增强的科普文本分类方法
/upload/resources/image/2022/04/15/188982.png
科普文本分类是将科普文章按照科普分类体系进行划分的任务。针对科普文章篇幅超过千字,模型难以聚焦关键信息,造成传统模型分类性能不佳的问题,提出一种结合188体育app官网:进行两级筛选的科普长文本分类模型,来减少主题无关信息的干扰,提升模型的分类性能。首先,采用四步法构建科普领域的188体育app官网:;然后,将该188体育app官网:作为距离监督器,并通过训练句子过滤器来过滤掉无关信息;最后,使用注意力机制对过滤后的句子集做进一步的信息筛选,并实现基于注意力的主题分类模型。在所构建的科普文本分类数据集(PSCD)上的实验结果表明,基于领域188体育app官网:的知识增强的文本分类算法模型具有更高的 F1-Score,相较于 TextCNN模型和 BERT模型,在 F1-Score上分别提升了2. 88个百分点和1. 88个百分点,验证了188体育app官网:对于长文本信息筛选的有效性。
<<< 上一篇
事理图谱及其金融应用
<<< 下一篇 融合188体育app官网:和差分隐私的新闻推荐方法
读完这篇文章后,您心情如何?
推荐内容
More >>>- · CCF企智会走进江苏金服——共筑数智生态 共谋
- · 早鸟票正式开启!FCES2025相约长沙,抢占未来
- · 今日CNCC2025启动会在京召开,筹备工作全面展
- · YEF2025大会日程揭晓,早鸟票最后一天倒计时
- · 最后3天!YEF2025早鸟票截止倒计时,现在报名
- · 首届CCF算法能力大赛总决赛开赛!探索教育、
- · 第二届CCF中国数字金融大会(CDFC 2025)优秀
- · 从时代之问到破题之道和未来之约,梅宏院士为
- · YEF2025早鸟票倒计时7天,组团参会更优惠!
- · 第二届CCF中国数字金融大会(CDFC 2025)优秀
- · YEF2025早鸟票倒计时10天,抓紧时间报名参会
所有评论仅代表网友意见