- 年份
- 2024(5005)
- 2023(7232)
- 2022(6168)
- 2021(5919)
- 2020(5108)
- 2019(11781)
- 2018(11468)
- 2017(22470)
- 2016(11679)
- 2015(13114)
- 2014(12789)
- 2013(12193)
- 2012(10761)
- 2011(9395)
- 2010(8823)
- 2009(7727)
- 2008(7036)
- 2007(5583)
- 2006(4387)
- 2005(3506)
- 学科
- 济(46135)
- 经济(46055)
- 管理(35132)
- 业(32708)
- 企(27593)
- 企业(27593)
- 方法(26075)
- 数学(23799)
- 数学方法(23457)
- 财(13201)
- 农(11559)
- 中国(10622)
- 业经(9249)
- 制(9052)
- 务(8436)
- 财务(8400)
- 财务管理(8381)
- 企业财务(7989)
- 贸(7923)
- 贸易(7921)
- 易(7754)
- 技术(7513)
- 农业(7458)
- 地方(7163)
- 学(7150)
- 环境(6678)
- 理论(6534)
- 和(6527)
- 体(6464)
- 银(6264)
- 机构
- 大学(153871)
- 学院(152792)
- 管理(65663)
- 济(65432)
- 经济(64379)
- 理学(58309)
- 理学院(57780)
- 管理学(56836)
- 管理学院(56530)
- 研究(43343)
- 中国(32640)
- 财(29865)
- 京(29542)
- 财经(24792)
- 科学(24712)
- 经(22829)
- 中心(22105)
- 业大(21845)
- 经济学(21139)
- 农(20166)
- 江(20074)
- 经济学院(19265)
- 财经大学(18875)
- 所(18533)
- 范(18183)
- 师范(17996)
- 经济管理(17583)
- 商学(17516)
- 商学院(17363)
- 北京(17312)
- 基金
- 项目(114951)
- 科学(92913)
- 基金(87049)
- 研究(84561)
- 家(74967)
- 国家(74395)
- 科学基金(66133)
- 社会(56342)
- 社会科(53537)
- 社会科学(53526)
- 基金项目(46773)
- 省(43659)
- 自然(42856)
- 自然科(41923)
- 自然科学(41913)
- 自然科学基金(41155)
- 教育(39540)
- 划(36995)
- 资助(34521)
- 编号(33270)
- 部(26609)
- 重点(25571)
- 成果(24903)
- 创(24897)
- 国家社会(24169)
- 发(23759)
- 教育部(23685)
- 制(23440)
- 创新(23303)
- 人文(23260)
共检索到201499条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
刘萍 黄纯万
现有的相似度计算方法大都依赖于作者间的直接关联,忽略了间接关联。文章提出一种新的基于SimRank的作者相似度计算方法,充分考虑作者关键词二分图网络的整体结构特性,利用图结构相似度算法挖掘出作者间以及词汇间的潜在关联关系。初步实验表明该方法能够有效地识别作者之间的相似度,相比于传统的关键词耦合,该方法可以明显提高作者相似度计算的准确性。
[期刊] 统计与决策
[作者]
孙丽莉 张小刚
Word Net作为一部语义词典,在自然语言处理、词义消歧、信息抽取和机器翻译等很多领域应用广泛。文章从算法利用的角度对基于Word Net的语义相似度计算分别从基于路径距离、基于信息容量和基于属性的角度进行了系统的概括与梳理,并在深入分析和比较的基础上指出今后本领域的研究方向。
[期刊] 情报理论与实践
[作者]
秦春秀 赵捧未 刘怀亮
词语相似度计算是自然语言处理、智能检索、文档聚类、文档分类、自动应答、词义排歧和机器翻译等很多领域的基础研究课题。本文首先讨论了词语相似度计算的应用背景,然后总结了词语相似度计算的两类策略,包括每类策略的思想、依赖的工具和主要的方法,并对这两类策略进行了简单的比较。
关键词:
词语相似度 语义词典 语料库
[期刊] 图书情报工作
[作者]
赵登鹏 熊回香 田丰收 李昕然
[目的/意义]针对序列比对算法在文本相似度中的应用,改进全局比对算法并提高该算法的准确性,同时,应用局部比对算法有效解决内容差异或长短差异较大的两文本进行比对的问题。[方法/过程]首先,利用HanLP中的CRF模型对在线学术资源中文文本数据集进行规范化处理,构成中文序列集;然后,使用最新的中文维基百科语料训练Word2Vec模型来构建语词对打分矩阵;最后,基于打分矩阵和改进的打分规则,对进行全局比对/局部比对的两中文序列进行比对并获得比对的最优解,回溯该最优解,获取最优解的比对路径,计算两中文序列的相似度。[结果/结论]实验结果表明,相较于目前全局比对算法的相关研究,本文基于词性标注的结果与Word2Vec构建的语词对打分矩阵进一步提升了全局比对算法计算文本相似度的准确性,同时,应用于文本相似度计算的局部比对算法能够有效解决内容差异或长短差异较大的两文本进行比对的问题。
[期刊] 情报学报
[作者]
楼雯 王慧 鞠源
异构本体的存在带来了知识检索的冗余,基于异构本体的知识融合是十分必要的。大量的语义相似度计算容量与复杂的计算过程使得知识融合变得困难,本文提出二值相似度计算的异构本体融合方法,将语义相似度的计算提前至原始本体的构建过程,融合时只进行概念和关系的二值匹配,从而简化融合过程再次计算语义相似度的过程。文章从实体图书元数据、小样本本体和大样本本体三个角度组织了三个实验,利用武汉大学图书馆书目数据的实验一显示本文方法可以完成本体融合的过程,实验二和实验三显示本文方法可以提高本体融合的准确性,并显著提高运行反馈时间,综合反映本体融合效果良好,但需要在召回率上进行改进。本文方法有望在扩展专家本体、减少本体构建开销等方面体现应用价值。
[期刊] 情报理论与实践
[作者]
徐健 肖卓
在分析基于搜索引擎的术语相似度算法基础上,设计并实现了基于领域限定网络检索的术语相似度算法,通过将语义上下文和领域上下文引入检索式构造过程,有效提升了特定领域术语相似度计算效果。
关键词:
术语相似度 领域限定 网络挖掘
[期刊] 情报学报
[作者]
韩青 周晓英
文献相似度计算是文献检索、文献分析等应用的基础性工作,计算结果将直接影响相关应用的最终效果。文献共被引信息是其区别于普通文本的重要特征,它能有效显示文本之间的关联特征,可以充分利用该特征信息来提高文献相似度计算的有效性与可靠性。本文将文献语义特征与共被引特征引入文献相似度计算过程,在向量空间模型的基础上,提出了一种旨在优化文献相似度计算的混合模型。通过对高校图书馆、网络舆情、信息质量等七个情报学细分领域文献进行计算验证,结果显示本文提出的模型能充分利用文献特有的共被引特征,弥补向量空间模型特征量不足的问题,改善文献相似度计算的整体性能。
[期刊] 统计与决策
[作者]
向小东 邱梓咸
slope-one算法是个性化推荐系统中最简洁的协同过滤推荐算法,常用于评分预测来进行矩阵填充从而降低原始数据的稀疏性。由于传统slope-one算法在计算偏差时考虑了所有评分项目,而将不相关的项目纳入偏差计算反而会降低预测的准确性,文章针对该问题提出一种改进的slope-one算法,先通过项目相似度筛选出待预测评分项目的近邻用户集S,在用户集S上计算项目间的偏差值dev时引入用户相似度,从而有效地提高了评分预测的可靠性。在Movielens-1M数据集上对本文算法和slope-one算法(SO)以及以用户相似度为权重的slope-one算法(BUW-SO)作五折交叉实验,结果表明,改进的算法不仅能减少时间和空间复杂度,还能提高预测的准确性,使推荐系统有更好的推荐效果。
关键词:
slope-one算法 协同过滤 相似度
[期刊] 情报理论与实践
[作者]
丁芹
在传统矢量空间检索模式中 ,仅仅依赖孤立的关键词来进行文献的标引 ,而自然语言中充斥着大量的语义关联和多义、歧义问题 ,这样往往使得文本信息的表示和检索结果难以尽如人意。可见 ,尽可能丰富地捕捉存在于上下文中的语义关联 ,对于有效地标引和检索是相当重要的。本文提出了一种利用语义格进行文献的语义表述的方法 ,对标引词的语义格加权算法做了更为合理的解释和推导 ,并引入了一种计算词语之间相似度的方法
关键词:
自动标引 自然语言/语义分析 检索模型
[期刊] 地方财政研究
[作者]
王志刚 谢恺 朱慧
近年来,根据国务院的相关部署,我国各地开启了降成本工作,本文基于初步构建的文本数据库和文本相似度计算原理,对中央和省级层面"降成本"政策的文本进行梳理和分析,从政策文本角度较全面的展示了"降成本"工作的进展和效果。分析发现,现有"降成本"政策偏重于降低制度性交易成本和降低税费负担,中央政策重"减税"、地方政策重"降费"。各类降制度性交易成本的制度文件产生了切实的效果,制度改革力度大的地方,减少行政审批时间效果显著。此外,本文还就中央和省级政策文本相似度进行分析,为地方政府政策执行力度和因地制宜程度提供了一个新的观察角度。
关键词:
降成本 政府政策 文本相似度
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 南京农业大学学报
[作者]
梁敬东 崔丙剑 姜海燕 沈毅 谢元澄
[目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。
[期刊] 图书情报工作
[作者]
张均胜 石崇德 徐红姣 高影繁 何彦青
文本主观题自动阅卷的关键是提高考生答案文本和试题标准答案文本之间相似度计算结果的准确率。参考文本试题人工阅卷方法,提出一种结合人工制定文本相似标准、词语集合及词语次序和同义词的短文本相似度计算方法,设计并实现相应文本主观题阅卷系统。建立试题人工评分标准库,并在387道银行培训领域真实考题数据集上进行自动阅卷与人工阅卷结果对比实验。结果显示,文本试题自动阅卷结果与人工阅卷结果相比,完全相同的达到58%,准确率达到80%左右。
关键词:
短文本 相似度 主观题 自动阅卷
[期刊] 情报理论与实践
[作者]
沈思 孙豪 王东波
[目的/意义]针对目前医学文本中疾病—基因等实体关联关系在知识发现中结合主题的研究较少,不足以揭示医学领域知识在主题层面的深层语义关联关系,提出了一套结合全文文本和领域知识主题的语义相似度计算方法。[方法/过程]以肿瘤期刊全文本为研究对象,用TWE模型进行词向量和主题向量的词嵌入表示,基于Siamese Network框架结合文本和领域知识主题进行相似度计算。[结果/结论]实验表明,该研究所提出的相似度计算方法在验证集中的预测F值达94%,最后通过对测试集数据进行聚类分析,从高、中、低频以及未进行临床注册实验的角度对疾病和关联基因进行分析,发现当前的热门研究以及未来可能成为研究热点的靶点基因。
[期刊] 清华大学学报(自然科学版)
[作者]
苗壮 袁野 乔百友 王一舒 马玉亮 王国仁
顶点相似度计算在现实生活中具有广泛的应用。当前对相似性计算的研究工作主要集中于静态图上,并且大多相似性计算模型是基于SimRank算法提出的。而现实中的许多场景,需采用时序图进行建模。当前针对静态图的大量SimRank的计算方法无法在时序图中实现,因此该文对大规模时序图中的SimRank计算开展详细研究,并提出一种时序关联的SimRank计算方法(temporal-aware SimRank,TaSimRank)。TaSimRank根据图的拓扑结构和时间约束通过高效的迭代方法计算SimRank。同时,该文提出一种近似算法,通过随机游走方法建立树形索引,使用Monte Carlo方法近似计算顶点的相似度,取得时间和效率的平衡。最后,通过大量真实实验验证了提出算法的有效性和可扩展性。
关键词:
时序图 相似度 随机游走
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除