基金项目摘要的语步识别系统设计与实现
2022-04-07分类号:G254;TP391.1;TP18
【部门】中国科学院文献情报中心 中国科学院大学经济与管理学院图书情报与档案管理系
【摘要】[目的/意义]设计中文基金项目摘要的语步识别系统,实现基金项目摘要的自动结构化输出。[方法/过程]重点解决语步识别系统建设中的3个关键技术难点:①基于规则和深度学习方法构建基金项目摘要语步识别训练数据集,为系统提供数据支撑;②通过嵌入摘要中句子的位置信息来改进模型输入,实现语步结构的精准识别;③设计开放接口以实现系统的开放调用。[结果/结论]该系统已初步实现基金项目摘要的自动语步识别功能,并部署在多个平台网站上供科研人员试用。[局限]该系统目前只提供了基金项目申请摘要的语步识别服务,未来还将面向结题摘要进行语步分析与建设。
【关键词】语步识别 语步识别系统 基金项目摘要 嵌入位置特征 数据集构建
【基金】中国科学院文献情报能力建设专项子项目“基于科技文献知识的人工智能(AI)引擎建设”的研究成果,项目编号:E0290906
【所属期刊栏目】情报理论与实践
文献传递