- 年份
- 2024(9128)
- 2023(13252)
- 2022(11642)
- 2021(11082)
- 2020(9296)
- 2019(21651)
- 2018(21283)
- 2017(41579)
- 2016(22282)
- 2015(25238)
- 2014(25114)
- 2013(24387)
- 2012(21884)
- 2011(19582)
- 2010(19173)
- 2009(17275)
- 2008(16473)
- 2007(13937)
- 2006(11815)
- 2005(9915)
- 学科
- 济(85665)
- 经济(85541)
- 管理(65145)
- 业(61037)
- 企(51892)
- 企业(51892)
- 方法(44058)
- 数学(38644)
- 数学方法(38039)
- 财(22571)
- 农(22410)
- 中国(21081)
- 业经(18994)
- 学(18321)
- 地方(16186)
- 制(15720)
- 理论(14853)
- 农业(14805)
- 务(14608)
- 贸(14597)
- 贸易(14590)
- 财务(14533)
- 财务管理(14502)
- 易(14177)
- 和(14103)
- 技术(13989)
- 企业财务(13754)
- 环境(13400)
- 划(12242)
- 银(11930)
- 机构
- 大学(308987)
- 学院(306436)
- 管理(127326)
- 济(119164)
- 经济(116624)
- 理学(112027)
- 理学院(110858)
- 管理学(108770)
- 管理学院(108211)
- 研究(95242)
- 中国(69396)
- 京(64005)
- 科学(59936)
- 财(53970)
- 业大(46569)
- 农(45756)
- 所(45415)
- 财经(44398)
- 中心(44278)
- 研究所(41837)
- 江(41638)
- 经(40598)
- 范(40175)
- 师范(39800)
- 北京(39635)
- 农业(35810)
- 经济学(35704)
- 院(35413)
- 州(34322)
- 财经大学(33434)
- 基金
- 项目(221764)
- 科学(175082)
- 研究(162122)
- 基金(162117)
- 家(140503)
- 国家(139366)
- 科学基金(121212)
- 社会(101973)
- 社会科(96561)
- 社会科学(96536)
- 基金项目(86786)
- 省(85935)
- 自然(79983)
- 自然科(78127)
- 自然科学(78109)
- 自然科学基金(76669)
- 教育(75016)
- 划(72560)
- 资助(66494)
- 编号(66466)
- 成果(52439)
- 部(49046)
- 重点(49000)
- 创(46290)
- 发(45950)
- 课题(44498)
- 创新(43146)
- 科研(42729)
- 教育部(42480)
- 大学(41964)
- 期刊
- 济(120988)
- 经济(120988)
- 研究(84771)
- 中国(51424)
- 学报(47661)
- 管理(45010)
- 科学(44045)
- 财(40769)
- 农(40500)
- 大学(36955)
- 学学(34741)
- 教育(33392)
- 农业(28471)
- 技术(27537)
- 融(21662)
- 金融(21662)
- 财经(20863)
- 业经(20588)
- 经济研究(18910)
- 经(17680)
- 图书(16516)
- 问题(15939)
- 理论(15125)
- 科技(14977)
- 技术经济(14381)
- 版(14116)
- 实践(14068)
- 践(14068)
- 业(13961)
- 资源(13342)
共检索到420802条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
王子璇 乐小虬 何远标
【目的】自动甄别科技论文中描述研究主题的关键语句。【方法】以论文小节为单位组织句子集,通过训练领域词向量计算句子间WMD距离得到相应语义相似度,优化Text Rank算法迭代过程,利用外部特征对所得权值进行调整,按句子权值降序选取关键主题句。【结果】以气候变化领域科技论文作为实验数据,以人工标注的结果为基准对本文的算法和传统的Text Rank算法进行对比实验,初步结果表明该方法的识别效果(F值)比传统Text Rank算法提升约5%。【局限】句子特征提取有待提高,词向量训练及方法中的相关参数需要做进一步
[期刊] 情报杂志
[作者]
吴菲菲 陈肖微 黄鲁成 李睿毓 米兰
[目的/意义]基于技术演化路径识别方法研究的现状,提出一种基于语义相似度的有向有权网络技术多主题演化路径识别方法,有助于企业依据自身优势和目标定位,选择研发方向和实现路径。[方法/过程]利用文本挖掘中的主题模型将专利文本向量化,计算具有引用关系专利之间的主题相似度,构造有向有权网络,并利用JAVA编写的遍历算法识别出涵盖特定技术领域的多主题演化路径,供企业把握领域内技术主题的发展变化。[结果/结论]以太阳能电池板为例的研究结果表明,该方法可以有效的识别出太阳能电池板技术围绕五个主题在不断演进的路径。与传统
[期刊] 图书馆理论与实践
[作者]
艾金勇
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。
关键词:
藏文网页 语义信息 主题句 抽取
[期刊] 情报学报
[作者]
王卫军 宁致远 董昊 乔子越 杜一 周园春
识别不同学科间共有的研究内容是学科交叉知识发现的一种研究思路。学科间具有相似语义的研究内容,能够更好地体现学科之间知识的融合、交流现象。针对从科技文献数据中获取语义相似学科交叉研究主题的问题,本文提出了一种基于无监督对比学习的科技文献及关键词语义相似关系表示学习方法,构建了一种语义相似学科交叉主题识别模型。该模型将Spearman相关系数作为评价学科交叉主题的指标,解决了现有研究缺少学科交叉研究数据集的问题。研究结果表明,本文模型较好地获取了科技文献及其关键词之间的语义相似关系,能够较好地反映两个学科之间的交叉态势。
[期刊] 情报理论与实践
[作者]
沈思 孙豪 王东波
[目的/意义]针对目前医学文本中疾病—基因等实体关联关系在知识发现中结合主题的研究较少,不足以揭示医学领域知识在主题层面的深层语义关联关系,提出了一套结合全文文本和领域知识主题的语义相似度计算方法。[方法/过程]以肿瘤期刊全文本为研究对象,用TWE模型进行词向量和主题向量的词嵌入表示,基于Siamese Network框架结合文本和领域知识主题进行相似度计算。[结果/结论]实验表明,该研究所提出的相似度计算方法在验证集中的预测F值达94%,最后通过对测试集数据进行聚类分析,从高、中、低频以及未进行临床注册实验的角度对疾病和关联基因进行分析,发现当前的热门研究以及未来可能成为研究热点的靶点基因。
[期刊] 图书情报工作
[作者]
王泽贤
对Lucene内部的相似度评分算法进行研究分析,指出其在书目搜索中,未考虑图书的受欢迎度这一因素对搜索结果排序的影响。提出一种改进的算法并予以实现。实验结果证明,改进的算法能将较受读者欢迎的图书排列在前,提升读者的书目搜索体验。
关键词:
Lucene 书目搜索 相似度
[期刊] 情报理论与实践
[作者]
余凡 程虹 楼雯
针对目前文本等级关系提取结果与本体层次模型的标准不符的现状,利用《测绘学叙词表》构建初始本体层次模型,利用绝对词频和GF/GL值对相邻词汇的领域相关度筛选,利用余弦算法计算相似度,利用平均值方法计算等级关系筛选阈值。结果表明改进的相似度算法能够提高文本等级关系提取的有效性,提取的等级关系能够应用到本体层次模型的构建中。
关键词:
本体 等级关系提取 叙词表 相似度
[期刊] 图书情报工作
[作者]
祝娜 王效岳 杨京 白如江
[目的 /意义]由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法 /过程]提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果 /结论]通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。
[期刊] 图书情报工作
[作者]
范少萍 安新颖 逯万辉
[目的/意义]针对目前医学领域基于主题的语义相似度计算研究较少,尚不足以揭示主题间在语义层面的关系,提出一套用于主题间语义相似度计算的方法,进而从语义角度判断主题间关系,为主题新颖性判断、主题关联研究等提供参考。[方法/过程]以Me SH词表为语义计算的基础,剖析词表结构与现有研究成果,从入口词、语义距离、注释3个维度综合测度主题间的语义相似度,利用Pub Med中2011-2014年干细胞领域的文献进行实证研究。[结果/结论]利用通用验证主题词对,验证了本文所提3个测度维度的有效性。通过主题间语义相似度
关键词:
语义相似度 MeSH词表 主题语义相似度
[期刊] 数据分析与知识发现
[作者]
翟东升 蔡文浩 张杰 李振飞
【目的】为满足中文商标侵权判定过程中检测语义相似度的需求,提出一种改进的中文商标语义相似度计算方法。【方法】引入新参数改进传统的基于How Net的中文商标语义相似度计算方法,并收集大量商标数据作为相似度检测的支持数据以弥补How Net词库的局限,分别使用传统方法和改进后的方法对样本数据进行相似度检测,并对比准确率验证改进后方法的有效性。【结果】实验结果显示,改进后的方法比传统方法准确率更高、有更好的区分度。【局限】相似度检测支持数据——商标数据库中的数据量可以进一步丰富。【结论】改进后的中文商标语义相
[期刊] 情报理论与实践
[作者]
李贺 谷莹 刘嘉宇
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,本文提出了数据驱动下产品需求识别的方法。[方法/过程]利用word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。本研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。
[期刊] 情报理论与实践
[作者]
李贺 谷莹 刘嘉宇
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,本文提出了数据驱动下产品需求识别的方法。[方法/过程]利用word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。本研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。
[期刊] 数据分析与知识发现
[作者]
白如江 冷伏海 廖君华
【目的】利用文本语义组块特征提升Cosine文本相似度计算性能。【方法】获取NSF资助的关于碳纳米管研究领域的项目数据,进行词干还原、词性标注等预处理;利用条件随机场模型实现文本内容的语义组块标注;在此基础上实现基于语义组块特征的改进Cosine文本相似度计算,并与未标注的数据进行相似度计算比较,分析实验结果。【结果】实验证明基于语义组块特征的改进Cosine相似度计算结果比原始文本Cosine相似度计算结果相似度均有不同程度的提升,在实验数据中最高的相似度提升了26%。【局限】依赖于语义组块标注性能。【
关键词:
文本相似度 语义组块 向量空间模型 本体
[期刊] 图书情报工作
[作者]
王晓笛 祝娜 白如江 王效岳
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。
关键词:
语义角色标注 科技文献 相似度检测
[期刊] 图书情报工作
[作者]
王建雄
在传统PageRank算法的基础上进行一些优化与改进,提出一种新的主题敏感的PageRank算法,通过计算超链接与领域向量的相似度来区分超链接对网页的贡献度,从而有效抑制主题漂移;同时为PageRank算法加入时间因子来防止PageRank偏重旧网页的问题,加入站内外区分因子来防止针对PageRank算法作弊的行为。改进算法弥补了原算法的不足,提高了主题搜索的效率。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除