- 年份
- 2024(5343)
- 2023(7730)
- 2022(6660)
- 2021(6333)
- 2020(5457)
- 2019(12651)
- 2018(12371)
- 2017(24085)
- 2016(12576)
- 2015(14152)
- 2014(13881)
- 2013(13387)
- 2012(11859)
- 2011(10545)
- 2010(10000)
- 2009(8831)
- 2008(8206)
- 2007(6692)
- 2006(5419)
- 2005(4458)
- 学科
- 济(50530)
- 经济(50439)
- 管理(37475)
- 业(34919)
- 企(29632)
- 企业(29632)
- 方法(28681)
- 数学(25853)
- 数学方法(25414)
- 财(14058)
- 农(12088)
- 中国(11481)
- 业经(9875)
- 学(9634)
- 制(9633)
- 务(9068)
- 财务(9028)
- 财务管理(9006)
- 企业财务(8590)
- 贸(8286)
- 贸易(8283)
- 和(8125)
- 易(8097)
- 技术(7957)
- 农业(7838)
- 地方(7685)
- 理论(7557)
- 环境(7220)
- 体(6868)
- 银(6776)
- 机构
- 大学(171105)
- 学院(168573)
- 管理(71495)
- 济(70536)
- 经济(69314)
- 理学(63190)
- 理学院(62592)
- 管理学(61419)
- 管理学院(61090)
- 研究(49288)
- 中国(37395)
- 京(33697)
- 财(32345)
- 科学(29029)
- 财经(26769)
- 中心(24853)
- 业大(24652)
- 经(24558)
- 农(23117)
- 经济学(22654)
- 江(22643)
- 所(21948)
- 经济学院(20607)
- 范(20423)
- 财经大学(20262)
- 师范(20218)
- 研究所(20178)
- 北京(20079)
- 经济管理(18812)
- 院(18696)
- 基金
- 项目(124839)
- 科学(100494)
- 基金(94296)
- 研究(90826)
- 家(81680)
- 国家(81063)
- 科学基金(71621)
- 社会(59913)
- 社会科(56944)
- 社会科学(56930)
- 基金项目(50231)
- 省(47088)
- 自然(46839)
- 自然科(45829)
- 自然科学(45817)
- 自然科学基金(44981)
- 教育(42266)
- 划(40214)
- 资助(38117)
- 编号(35877)
- 部(28694)
- 重点(27787)
- 成果(27456)
- 创(26571)
- 国家社会(25699)
- 发(25550)
- 教育部(25288)
- 创新(24903)
- 科研(24783)
- 人文(24748)
共检索到227163条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
马凤
文章提出了一种新的专业文献检索方法。该方法挖掘词汇的隐含语义相关性,自适应地实现文献的语义检索。首先基于专业期刊文献的关键词词频统计和共现分析,构建学科主题专业词汇表。然后以学科专业期刊为文献来源,通过隐语义相似度分析模型,挖掘文献间的相似度,从而检索得到最为相关的专业文献。以科学计量学为例作实证分析,构建科学计量学的专业词汇表,采用隐语义相似度模型从77种WoS期刊中检索得到科学计量学的相关文献。
[期刊] 情报理论与实践
[作者]
郭红梅 沈哲思 曾建勋
[目的/意义]科技文献中蕴含丰富的语义知识,随着科学的发展科技文献数量的激增,用户很难快速准确找到他们真正需要的知识和文献,如何按照一定的知识关系对科技文献进行组织和聚类来探测主题和学科结构的动态演化规律一直是科学界关注的重点。文献间的引用关系和内容相似性关系分别揭示文献之间的内在和外在关联,它们在文献主题关联分析中起着不可替代的作用,文章探索在文献主题聚类过程中两种关系混合是否优于单一关系。[方法/过程]以TREC 2005 genomics track为实验数据集,选取专家判定为与所在主题内容相关或部分相关的3098篇文献,分别从PubMed和WoS数据库中获取每篇文献的内容和引文数据,选用两种较常用的文本内容相似性和引用关系相似性计算方法PMRA和文献引用耦合关系,采用社团划分的聚类方法,将混合聚类结果与基于单一关系聚类结果进行对比。[结果/结论]实验结果说明文献引用耦合关系和文献内容相似性关系在主题聚类过程中可以相互补充,基于混合关系的聚类效果整体上优于单一关系。
[期刊] 情报学报
[作者]
韩青 周晓英
文献相似度计算是文献检索、文献分析等应用的基础性工作,计算结果将直接影响相关应用的最终效果。文献共被引信息是其区别于普通文本的重要特征,它能有效显示文本之间的关联特征,可以充分利用该特征信息来提高文献相似度计算的有效性与可靠性。本文将文献语义特征与共被引特征引入文献相似度计算过程,在向量空间模型的基础上,提出了一种旨在优化文献相似度计算的混合模型。通过对高校图书馆、网络舆情、信息质量等七个情报学细分领域文献进行计算验证,结果显示本文提出的模型能充分利用文献特有的共被引特征,弥补向量空间模型特征量不足的问题,改善文献相似度计算的整体性能。
[期刊] 图书情报工作
[作者]
范少萍 安新颖 逯万辉
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以Me SH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用Pub Med中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度
关键词:
语义相似度 MeSH词表 主题语义相似度
[期刊] 图书情报工作
[作者]
宋雯斐 王洋 双林平
利用分类主题一体化的主题词表构建领域本体,并通过概念间的关系定义及语义相似度公式,引入调整因子,确定概念相似度算法,再通过余弦系数法进一步得到文献间的相似度。对于本算法的结果,与领域专家预测的相似度进行比较,结果证实该算法有效。
关键词:
领域本体 文献相似度 概念相似度
[期刊] 情报理论与实践
[作者]
杜薇薇
科技文献抄袭现象伴随着科学技术的发展时有发生,这严重损害了文献原作者,也对科技文献的严肃性提出了挑战。本文利用分词技术提取文献特征向量,并结合动态规划算法对文献的相似度给出具体评价,针对不同抄袭的现象,发现其中存在的规律,具体问题具体分析。最后给出实际实验结果,为文献评审提供参考。
关键词:
特征向量 相似度 中文文献 自动分词
[期刊] 图书情报工作
[作者]
白如江 王晓笛 王效岳
针对中文文献抄袭检测提出了一种基于汉语词频的文本数字指纹,通过对具有参考性的语料库进行词频和字频统计形成一个hash词表,然后基于最大熵原理为任意长度的文本生成一个基于词频特征的文本数字指纹,对于任意两篇文献可以通过计算对应的两个数字指纹的Hamming距离来得到一个相似度的估计。通过使用维基百科zhwiki-20121129-all-titles语料库构建hash词表,对情报学领域4种核心期刊进行实验,结果表明这种数字指纹对常见的抄袭情况都能很好地识别和检测,具有很强的鲁棒性。
关键词:
数字指纹 抄袭检验 最大熵原理
[期刊] 图书情报工作
[作者]
王晓笛 祝娜 白如江 王效岳
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。
关键词:
语义角色标注 科技文献 相似度检测
[期刊] 图书情报工作
[作者]
雷兵 刘小 钟镇
[目的/意义]针对领域学术文献,基于题录信息构建按照"研究内容"与"研究方法"的双标签分类模型,为学术文献的细粒度分类提供方法借鉴。[方法/过程]以深度学习中卷积神经网络为基础模型,将题名、摘要、关键词、刊名、作者、机构等题录信息分为显性特征和隐性特征,通过显性特征提取、隐性特征映射等步骤,形成特征词数组,在此基础上生成词向量矩阵,经过卷积层、池化层与Softmax层处理,完成分类任务。[结果/结论]以电子商务领域文献为例进行实验验证,结果显示,该模型按"研究内容"与"研究方法"双标签分类的宏F_1值分别为0.74、0.81,不仅明显优于传统机器学习方法,也比仅使用显性特征的深度学习分类方法高。
[期刊] 情报学报
[作者]
何浩 杨海棠
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。
[期刊] 图书馆论坛
[作者]
安波
文章研究学术文献分类中的长尾现象和新分类问题,提出基于提示学习的小样本文献分类方法,旨在实现低资源场景下的文献自动分类。借助大规模预训练语言模型的文本表示与生成能力,在提示学习框架下分析不同的提示模板、文献字段、文献类别表示、样本数等信息对低资源文献分类的影响。实验结果表明:通过合理的设计提示模板、文献类别表示、文献字段等信息,模型能高效实现低资源场景下的文献分类(50-shot的分类F1值约85%),是传统文献分类算法的重要补充;但在处理细粒度文献分类时存在分类错误问题,需要完善。
[期刊] 情报理论与实践
[作者]
庆斌 真溱 汤珊红
Dlib杂志2014年第11期刊登了开放大学知识媒体学院研究员Petr Knoth和他的学生Drahomira Herrmannova撰写的一篇文章,提出一种基于语义相似度评价科研出版物"贡献"(Contribution)的计量方法,该方法不同于文献计量、网络计量、补充计量,通过计算引文网络(由某论文的参考文献及引用该文的论文共同组成)的语义相似度,结合评价公式
[期刊] 情报理论与实践
[作者]
王秀红 袁艳 赵志程 李洁玉 刘海军 杨国立
文章除了考虑专利文献的名称、摘要、权利要求书和说明书4要素之外,还结合考虑主分类号和引文信息,构建6要素的专利文献结构树:依据专利文献各要素的特点,建立结构树的根节点、父子节点和叶子节点的关系。实验结果表明:将该结构树结构应用于专利文献相似度计算,与不考虑主分类号和引文的4要素加权方法相比,精准率、召回率和F1指标分别提高了22.31%、14.53%和20.30%;与将专利文献作为一个整体向量直接进行相似计算方法相比,精准率、召回率和F1指标分别提高了79.26%、51.93%和72.63%,大大提高了专利相似度计算的效果。
关键词:
专利文献 相似度 信息检索 专利检索
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除