面向课堂教学内容的知识点标题生成
2023-12-05分类号:G434;TP391.1
【部门】新疆大学软件学院 新疆大学信息科学与工程学院
【摘要】互联网时代信息量庞大,简洁的标题可以提高信息阅读效率。在课堂场景下,知识点标题生成便于用户整理和记忆课堂内容,提高课堂学习效率。该文将标题生成应用于课堂教学领域,制作了课堂知识点文本—标题数据集;提出了一种改进的Text Rank算法——考虑关键字和句子位置的文本排序(textranking considering keywords and sentence positions,TKSP)算法,该算法综合考虑了关键词和句子位置等因素对句子权重的影响,能够更准确地提取文本重点信息。使用以召回率为导向的摘要评价(recall-oriented understudy for gisting evaluation, ROUGE)方法, TKSP算法在ROUGE-1、 ROUGE-2和ROUGE-L指标上的得分率分别为51.20%、 33.42%和50.48%,将TKSP抽取式算法与统一语言模型(unified language model, UniL M)结合,并融合文本主题信息,提出统一语言模型结合考虑关键字和句子位置的文本排序算法的模型(unified language modeling combined textranking considering keywords and sentence positions, UniL M-TK), Uni LM-TK在各指标上的得分率分别为73.29%、 58.12%和72.87%,与UniL M模型相比, UniL M-TK在各指标上分别提高了0.74%、 2.26%和0.87%,证明UniL M-TK模型生成的标题更准确、更有效。
【关键词】课堂教学 标题生成 主题信息 Text Rank UniLM
【基金】国家自然科学基金资助项目(62166041)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递