多语言UGC环境下MOOC课程笔记自动生成
2021-06-23分类号:TP391.1;G434
【部门】华中师范大学信息管理学院
【摘要】[目的/意义]多语言环境下,用户基于MOOC平台生成了大量UGC笔记,为了更好地利用MOOC资源,文章提出多语言UGC课程笔记自动生成模型,有助于促进全球优质教育资源的共享及提升教育公平。[方法/过程]首先抓取多语言环境下的UGC笔记和讲稿并进行预处理,其次将多语言UGC笔记归并为双语笔记,接下来对热门和冷门课程的多语言UGC实现自动化子主题簇融合,在此基础上依据加权规则提取最佳单条笔记并确定时间戳,将其按照时间顺序进行排列,进而形成系统、完整的双语课程笔记。[结果/结论]通过实例验证了模型的有效性,其中对于热门课程,准确率和召回率均达到100%,对于冷门课程,准确率为79%,召回率为83%。
【关键词】多语言 用户生成内容 MOOC 课程笔记 层次聚类
【基金】国家社会科学基金项目“‘互联网+’背景下面向产业链的行业信息服务融合研究”的成果之一,项目编号:16BTQ063
【所属期刊栏目】情报理论与实践
文献传递