- 年份
- 2024(5873)
- 2023(8516)
- 2022(7264)
- 2021(6850)
- 2020(5979)
- 2019(13771)
- 2018(13346)
- 2017(25868)
- 2016(13622)
- 2015(15425)
- 2014(14987)
- 2013(14486)
- 2012(13074)
- 2011(11554)
- 2010(11023)
- 2009(9828)
- 2008(9137)
- 2007(7587)
- 2006(6304)
- 2005(5341)
- 学科
- 济(53019)
- 经济(52925)
- 管理(39579)
- 业(36597)
- 企(30795)
- 企业(30795)
- 方法(28573)
- 数学(25724)
- 数学方法(25341)
- 财(14915)
- 农(13365)
- 中国(12823)
- 学(10826)
- 业经(10717)
- 制(10694)
- 贸(9209)
- 贸易(9206)
- 务(9202)
- 财务(9166)
- 财务管理(9141)
- 易(8997)
- 企业财务(8714)
- 农业(8696)
- 地方(8463)
- 技术(8368)
- 理论(7981)
- 和(7727)
- 环境(7629)
- 体(7591)
- 融(7540)
- 机构
- 大学(186436)
- 学院(183729)
- 济(75641)
- 经济(74298)
- 管理(73728)
- 理学(64800)
- 理学院(64134)
- 管理学(62907)
- 管理学院(62572)
- 研究(59354)
- 中国(44191)
- 京(38037)
- 科学(36796)
- 财(34460)
- 农(31617)
- 业大(29551)
- 中心(28585)
- 所(28442)
- 财经(28052)
- 研究所(26188)
- 江(25834)
- 经(25785)
- 农业(25134)
- 经济学(24068)
- 北京(22844)
- 院(22331)
- 范(22321)
- 师范(21973)
- 经济学院(21785)
- 财经大学(21282)
- 基金
- 项目(135700)
- 科学(107828)
- 基金(101494)
- 研究(95878)
- 家(89934)
- 国家(89252)
- 科学基金(77120)
- 社会(62165)
- 社会科(58953)
- 社会科学(58937)
- 基金项目(53801)
- 省(51803)
- 自然(51652)
- 自然科(50500)
- 自然科学(50481)
- 自然科学基金(49576)
- 划(44779)
- 教育(44631)
- 资助(41303)
- 编号(37074)
- 重点(30897)
- 部(30798)
- 创(28968)
- 成果(28536)
- 发(28404)
- 创新(27187)
- 科研(27156)
- 教育部(26642)
- 国家社会(26567)
- 大学(25667)
共检索到255603条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
丁芹
在传统矢量空间检索模式中 ,仅仅依赖孤立的关键词来进行文献的标引 ,而自然语言中充斥着大量的语义关联和多义、歧义问题 ,这样往往使得文本信息的表示和检索结果难以尽如人意。可见 ,尽可能丰富地捕捉存在于上下文中的语义关联 ,对于有效地标引和检索是相当重要的。本文提出了一种利用语义格进行文献的语义表述的方法 ,对标引词的语义格加权算法做了更为合理的解释和推导 ,并引入了一种计算词语之间相似度的方法
关键词:
自动标引 自然语言/语义分析 检索模型
[期刊] 统计与决策
[作者]
孙丽莉 张小刚
Word Net作为一部语义词典,在自然语言处理、词义消歧、信息抽取和机器翻译等很多领域应用广泛。文章从算法利用的角度对基于Word Net的语义相似度计算分别从基于路径距离、基于信息容量和基于属性的角度进行了系统的概括与梳理,并在深入分析和比较的基础上指出今后本领域的研究方向。
[期刊] 情报理论与实践
[作者]
秦春秀 赵捧未 刘怀亮
词语相似度计算是自然语言处理、智能检索、文档聚类、文档分类、自动应答、词义排歧和机器翻译等很多领域的基础研究课题。本文首先讨论了词语相似度计算的应用背景,然后总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,并对这两类策略进行了简单的比较。
关键词:
词语相似度 语义词典 语料库
[期刊] 情报理论与实践
[作者]
白如江 王晓笛 王效岳
科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩写词)以及数字的核心特征词提取策略;然后将科技文献标引问题转化为句子分类问题,结合提出的核心特征词,采用支持向量机分类器对科技文献进行句子级别的语义标引。通过对1168篇糖尿病医学类论文实验,证明本文提出的方法能够有效地学习和标引科技文献中的句子,进而有效地对科技文献关键信息点进行自动标引。
关键词:
自动标引 支持向量机 特征提取 科技文献
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 情报理论与实践
[作者]
沈思 孙豪 王东波
[目的/意义]针对目前医学文本中疾病—基因等实体关联关系在知识发现中结合主题的研究较少,不足以揭示医学领域知识在主题层面的深层语义关联关系,提出了一套结合全文文本和领域知识主题的语义相似度计算方法。[方法/过程]以肿瘤期刊全文本为研究对象,用TWE模型进行词向量和主题向量的词嵌入表示,基于Siamese Network框架结合文本和领域知识主题进行相似度计算。[结果/结论]实验表明,该研究所提出的相似度计算方法在验证集中的预测F值达94%,最后通过对测试集数据进行聚类分析,从高、中、低频以及未进行临床注册实验的角度对疾病和关联基因进行分析,发现当前的热门研究以及未来可能成为研究热点的靶点基因。
[期刊] 情报学报
[作者]
查贵庭 侯汉清
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。
[期刊] 图书情报知识
[作者]
李纲 戴强斌
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。
关键词:
语义相关 词汇链 关键词抽取 自动标引
[期刊] 图书情报工作
[作者]
张均胜 石崇德 徐红姣 高影繁 何彦青
文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
关键词:
短文本 相似度 主观题 自动阅卷
[期刊] 情报理论与实践
[作者]
刘萍 黄纯万
现有的相似度计算方法大都依赖于作者间的直接关联,忽略了间接关联。文章提出一种新的基于SimRank的作者相似度计算方法,充分考虑作者关键词二分图网络的整体结构特性,利用图结构相似度算法挖掘出作者间以及词汇间的潜在关联关系。初步实验表明该方法能够有效地识别作者之间的相似度,相比于传统的关键词耦合,该方法可以明显提高作者相似度计算的准确性。
[期刊] 情报杂志
[作者]
杜秀英
[目的/意义]现有文本自动摘要算法普遍存在处理速度慢、压缩率不足或摘要质量不高等问题,如何高效处理、有效利用海量文本是图书馆信息管理及服务一个重要的研究方向。[方法/过程]提出了一种云计算平台下基于聚类与语义相似分析的多文本自动摘要方法。该方法在文本向量化基础上,通过MapReduce框架对多文本进行聚类、主题抽取、主题词及语义相似词频率统计等处理,然后摘取主题句构造出多文本摘要。[结果/结论]实验结果证实,基于聚类与语义相似分析的MapReduce自动摘要架构在生成大规模多文本摘要时,不但具有较好的时间
[期刊] 情报学报
[作者]
王兰成 冯文杰 田梅
本文阐述一种基于中国档案主题词表的自动标引方法 ,并给予实现。该方法将切分关键词和标引主题词融为一体 ,合理地构造了词典 ,并讨论了其中的一些关键技术问题。文章最后介绍该研究应用于中国档案机读目录计算机处理系统中
[期刊] 数据分析与知识发现
[作者]
翟东升 蔡文浩 张杰 李振飞
【目的】为满足中文商标侵权判定过程中检测语义相似度的需求,提出一种改进的中文商标语义相似度计算方法。【方法】引入新参数改进传统的基于How Net的中文商标语义相似度计算方法,并收集大量商标数据作为相似度检测的支持数据以弥补How Net词库的局限,分别使用传统方法和改进后的方法对样本数据进行相似度检测,并对比准确率验证改进后方法的有效性。【结果】实验结果显示,改进后的方法比传统方法准确率更高、有更好的区分度。【局限】相似度检测支持数据——商标数据库中的数据量可以进一步丰富。【结论】改进后的中文商标语义相
[期刊] 图书情报工作
[作者]
范少萍 安新颖 逯万辉
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以Me SH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用Pub Med中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度
关键词:
语义相似度 MeSH词表 主题语义相似度
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除