文本主题视角下多标签分类技术驱动的网络学术社区答案排序研究
2024-03-05分类号:G353.1
【部门】南京大学信息管理学院 南京农业大学信息管理学院 人文与社会计算江苏省高校哲学社会科学重点研究基地 南京农业大学领域知识关联研究中心
【摘要】[目的/意义]网络学术社区中的用户生成答案质量良莠不齐,难以为用户提供高效的决策支持,筛选高可用性答案能够促进网络学术社区问答知识的高效利用。[方法/过程]从文本主题语义视角出发,提出一种基于深度预训练语言模型和多标签分类技术的问答相关性计算方法,用于实现对网络学术社区用户答案的有用性排序。该方法首先提取问题文本和答案文本的语义向量,然后进一步将其映射到领域化的主题向量空间,从而实现对问题和答案主题相似度的计算。[结果/结论 ]以“小木虫”学术社区论文投稿板块“求助完结”栏目下的所有提问及每条提问下的全部答案为实验数据,以NDCG、Q-Measure为评测指标,将本文方法与Cross-Encoder和Bi-Encoder两种基于语义的常规排序方法进行比较,发现本文方法与常规方法性能相当,但是对标注数据的需求更少。
【关键词】网络学术社区 用户生成内容 主题挖掘 答案排序 问答相关性 多标签分类
【基金】
【所属期刊栏目】图书情报工作
文献传递