基于对话的中文正面情感风格迁移
2023-10-12分类号:TP391.1
【部门】江西师范大学计算机信息工程学院
【摘要】文本风格迁移旨在保留文本内容的前提下,通过编辑或生成的方法使得目标文本带有某些特殊属性,如礼貌、情感、性别等。现有的情感风格迁移研究主要集中在英文数据集上,在中文数据集上的研究相对较少。该文构建了一个基于对话的中文情感文本数据集,该数据集的部分原始数据源自电视连续剧《家有儿女》中的对白,并对其进行人工标注和循环模型标注。目前该数据集的负面情感文本和正面情感文本句子共30 836个。根据该数据集中大多数情感词是显性的特点,在编辑类的模型上开展了基于对话的中文正面情感风格迁移的研究。实验结果表明:在该数据集上,编辑类的模型可以较好地识别文本的情感属性,并实现文本正面情感风格迁移。
【关键词】自然语言处理 文本生成 情感风格迁移 循环模型 编辑模型 家庭对话
【基金】国家自然科学基金项目(61866018,62266021)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递

