中文农业科技文献自动标引系统SDIC/CASDAIS
1995-10-24分类号:G254-39
【部门】中国农业科学院科技文献信息中心
【摘要】本文介绍了一个中文农业文献自动标引系统SDIC/CASDAIS,它集自动主题标引与自动分类标引于一体,采用主题词表、预匹配词表和停用词表相结合的词典法方案,匹配中采取正向增字跳字最长匹配的算法,末二字回溯,制订大量规则以降低错标。该系统可完成主题标引和分类标引,能处理农业文献中常见的缩略语和科技术语不规范现象,具备动态构词功能。SDIC/CASDAIS系统采用特征词析取方法处理不包含在词表中的品种、物质名称和地名等关键词,其自由词判定规则还可以判别标题的部分自由词,通过词频统计可作为更新词表的依据。SDIC/CASDAIS系统的标引速度为3000条标题/小时,平均标引深度略大于4,主题标引精度...
【关键词】CASDAIS SDIC 科技文献 自动标引系统 主题标引 标引深度 分类标引 主题词表 中文信息 跳字
【基金】
【所属期刊栏目】情报学报
文献传递