QGAE:用于生成问答对的端到端无答案问题生成模型(英文)
2024-01-15分类号:TP391.1;TP18
【部门】中国科学技术大学网络空间安全学院 中国科学技术大学信息科学技术学院
【摘要】问题生成的目标是生成有意义且流畅的问题,以增加可用数据来解决问答类型标注语料库的缺乏问题。以带有可选答案的未注释文本作为输入内容,问题生成可以根据是否提供答案分为两种类型:有答案型和无答案型。即使在提供答案的情况下,生成问题也是具有挑战性的,更不用说在没有提供答案的情况下,对于人类和机器来说生成高质量的问题更加困难。为了解决这个问题,我们提出了一种名为QGAE的新型端到端模型,它能够通过直接提取候选答案,将无答案的问题生成转化为有答案的问题生成。这种方法有效地利用未标记的数据来生成高质量的问答对,其端到端的设计使其比多阶段方法更加方便,后者需要至少两个预训练模型。此外,我们的模型获得了更好的平均分数和更大的多样性。我们的实验结果表明,QGAE在生成问答对方面取得了显著的进展,成为了一种充满潜力的问题生成方法。
【关键词】深度学习 自然语言处理 无答案问题生成 答案抽取
【基金】supported by the Fundamental Research Funds for Central Universities (WK3480000010, WK3480000008)
【所属期刊栏目】中国科学技术大学学报
文献传递