- 年份
- 2024(8710)
- 2023(12684)
- 2022(11174)
- 2021(10562)
- 2020(8832)
- 2019(20551)
- 2018(20296)
- 2017(39564)
- 2016(21149)
- 2015(23810)
- 2014(23526)
- 2013(22859)
- 2012(20655)
- 2011(18298)
- 2010(17716)
- 2009(15783)
- 2008(14807)
- 2007(12358)
- 2006(10333)
- 2005(8399)
- 学科
- 济(81359)
- 经济(81274)
- 管理(60490)
- 业(57291)
- 企(48207)
- 企业(48207)
- 方法(42634)
- 数学(37651)
- 数学方法(37119)
- 农(21001)
- 财(20352)
- 中国(19841)
- 业经(17916)
- 学(17284)
- 地方(15838)
- 农业(14169)
- 理论(13969)
- 贸(13920)
- 贸易(13915)
- 务(13658)
- 财务(13588)
- 财务管理(13561)
- 易(13497)
- 技术(13496)
- 和(13228)
- 环境(12981)
- 企业财务(12842)
- 制(12199)
- 划(11427)
- 银(10237)
- 机构
- 大学(288668)
- 学院(286766)
- 管理(120637)
- 济(111323)
- 经济(109000)
- 理学(106668)
- 理学院(105566)
- 管理学(103556)
- 管理学院(103041)
- 研究(88807)
- 中国(63483)
- 京(59684)
- 科学(56697)
- 财(48361)
- 业大(44314)
- 农(43293)
- 所(42091)
- 中心(41103)
- 财经(40546)
- 研究所(39032)
- 江(38464)
- 范(37521)
- 经(37169)
- 师范(37165)
- 北京(36595)
- 农业(33987)
- 院(33142)
- 经济学(33042)
- 州(31697)
- 经济管理(31041)
- 基金
- 项目(211616)
- 科学(167329)
- 基金(154772)
- 研究(154100)
- 家(134360)
- 国家(133277)
- 科学基金(116209)
- 社会(96794)
- 社会科(91821)
- 社会科学(91796)
- 基金项目(83229)
- 省(82614)
- 自然(77091)
- 自然科(75338)
- 自然科学(75321)
- 自然科学基金(73915)
- 教育(71322)
- 划(69390)
- 资助(63285)
- 编号(63161)
- 成果(48898)
- 重点(46688)
- 部(46574)
- 创(44405)
- 发(44174)
- 课题(41999)
- 创新(41359)
- 科研(40898)
- 教育部(40312)
- 大学(39988)
- 期刊
- 济(110143)
- 经济(110143)
- 研究(78263)
- 中国(45929)
- 学报(45433)
- 管理(42027)
- 科学(41613)
- 农(38124)
- 财(35823)
- 大学(35051)
- 学学(32858)
- 教育(31213)
- 农业(27199)
- 技术(26266)
- 业经(19178)
- 财经(18516)
- 融(18318)
- 金融(18318)
- 经济研究(17559)
- 图书(16308)
- 经(15703)
- 科技(14462)
- 问题(14450)
- 理论(14248)
- 技术经济(13740)
- 业(13420)
- 实践(13328)
- 践(13328)
- 版(13242)
- 情报(12721)
共检索到387073条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
张颖怡 章成志 陈果
文本聚类是一种无监督且高效的文本类别划分方法。从文本中抽取的关键词代表了文本主旨内容,基于关键词的文本聚类是当下主流方式之一。在学术文本聚类研究中,主要使用单一的聚类方法。目前,一部分提升聚类性能的方法被提出,聚类集成是其中之一。因此,根据聚类集成思想,本文开展了基于关键词的学术文本聚类研究。为分析聚类集成在学术文本聚类中的有效性,本文比较了非集成聚类算法与聚类集成算法的性能。同时,为分析关键词对聚类集成性能的影响,本文分析了不同关键词抽取方法和不同关键词个数下学术文本的聚类结果。实验结果表明,聚类集成算法能够提升学术文本聚类的性能。其中,当使用TextRank作为关键词抽取方法时,学术文本聚类结果较佳;随着关键词个数的增加,学术文本类别划分性能随之提升。
关键词:
抽取 文本聚类 主题划分 聚类集成
[期刊] 图书情报工作
[作者]
刘勘 周丽红 陈譞
描述一种基于改进TF-IDF特征词加权算法的科技文献聚类方法:首先提取科技文献的特征词;然后根据特征词的词频、所在位置和词性为特征词加权,建立科技文献的向量空间模型;接着使用基于密度的聚类算法对科技文献向量空间模型数据进行聚类分析;最后使用主成分分析法对科技文献聚类的结果进行标识,利用F-measure方法对聚类结果进行评价。实验表明,用提出的科技文献聚类方法能够从所检索的科技文献中发现热点研究领域,并能识别具有学科融合性质的研究方向。
关键词:
科技文献 文本挖掘 聚类
[期刊] 图书馆杂志
[作者]
刘翔 黄晨
中国工程科技专家库经过四年多的建设,汇聚了总共约1.2亿条学术资源,在对这些海量的资源进行数据分析的过程中,对78 292 409篇中文论文的关键词数据进行了系统提取及分析。本次公开的数据集为2014-2018年18 789 626篇中文学术论文中提取的18 912 786关键词对,可以用于学术热点分析、共词分析及跨学科研究趋势探测。
关键词:
中文论文 关键词 中国工程科技专家库
[期刊] 情报学报
[作者]
李海林 万校基 林春培
鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺序提供论文关键词,计算关键词在每个文献中的重要程度,构建主要关键词之间的相似性矩阵,结合能够反馈最优簇成员代表性结果的近邻传播聚类实现核心主题的提取与分析。本研究对图书情报类某刊物2012-2016年期间的文献关键词进行数据挖掘,使用新方法实现了基于重要性度量的主要关键词聚类,分析和研究了主要关键词和核心主题的演化趋势。提出的方法不仅能够考虑关键词重要性和自动识别核心主题,还可以为文献主题分析提供新的数据挖掘方法,也能有效提高期刊和学科等相关领域的主题识别效果。
[期刊] 图书馆建设
[作者]
吴健 李子运 王洪梅
以CNKI中127篇关于深阅读的有效文献为数据来源,利用BICOMB和SPSS软件对其关键词进行共现分析和聚类分析,可发现:我国目前研究深阅读的3个主要领域是图书馆界、出版界和教育界;其热点主要聚焦于"新媒体环境下的语文教学""全民阅读的策略研究""浅阅读是非之争及图书馆应对策略""大学生深阅读的实证研究""学术期刊应对浅阅读的措施",但存在缺乏针对深阅读的系统研究、针对大学生深阅读的研究较少等不足。我国应利用技术优势促进深阅读、提高深阅读实证研究的科学性,研究焦点应转向促进人们深阅读的具体方法,从而更加科学化地进行深阅读研究。
关键词:
深阅读 关键词共现 聚类分析 研究热点
[期刊] 情报学报
[作者]
熊回香 李晓敏 杜瑾
学术数据的激增出现信息过载现象,对科研用户造成一定的负担,研究学者推荐能够提高科研效率,便于顺利开展科学研究。本文构建了一种基于组合相似度计算的个性化学者推荐模型,组合相似度计算包括基于学者特征词相似度计算和基于学者共被引相似度计算。前者考虑的是学者基于研究内容的相似性,而后者考虑的是学者基于共被引关系的相似性。同时,以CSSCI (Chinese Social Sciences Citation Index)数据库和CNKI (China National Knowledge Infrastructure)中的数据进行模型验证,并且利用精确率、召回率和F值进行推荐效果评测。实验结果表明,本文提出的推荐模型取得了较好的结果,即能为目标学者推荐研究兴趣相似的学者,促进学术沟通。
[期刊] 数据分析与知识发现
[作者]
夏天
【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;Top
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 情报科学
[作者]
李锋
【目的/意义】反思共词分析中存在的问题,提出核心关键词人工聚类分析的研究方法。【方法/过程】梳理了共词分析的一般方法和存在的问题,并以图书情报界阅读研究文献为例证实了共词聚类效果确实不是很理想。提出了在计算机统计关键词频次之后,选择具备一定频次的表意性较强的核心关键词进行人工聚类分析的研究方法。【结果/结论】实践证明这种研究方法能避免共词分析的弱点,有效揭示研究领域的主题结构。
[期刊] 图书情报工作
[作者]
海沫 郭树行
为提高多关键词查询的效率并减少多关键词查询的开销,提出一种基于语义聚类的多关键词查询算法——MKQBSC。该算法使得语义相似的节点聚为一类,节点加入、退出或节点的语义改变时,聚类将相应改变。查询请求在相邻的语义聚类之间转发,直至到达语义相似的聚类。仿真实验结果表明:与传统的基于对倒排表求交集的多关键词查询算法相比,MKQBSC算法所需的路由跳数和所产生的消息数更少。
关键词:
多关键词查询 语义聚类 路由跳数 消息数
[期刊] 管理评论
[作者]
张玲玲 张笑 崔怡雯
旅游业作为各国非贸易外汇收入的主要来源之一,其客流量的预测是营销和运营的重要环节。但统计局公布数据的滞后性使得以往预测方法难以捕捉旅游市场的最新变化趋势。本文基于网络搜索数据及历史客流量数据构建模型,并探索其对旅游市场客流量的预测作用。通过聚类方法筛选关键词,选取与预测变量的波动趋势具有相关性的关键词合成关键词指数,使得搜索指数与旅游市场发展趋势之间的有效信息进行进一步的互补,再结合历史数据进行修正建立自回归滞后模型,相对于单一使用历史数据或搜索指数进行预测的方法,预测准确度有很大提升,可以为相关旅游企业部门提供客流量预测的新方法。
[期刊] 图书情报工作
[作者]
钟伟金
主题词和关键词是共词聚类分析法中最常用的分析对象,但在相同的条件下,两者是否有相近的聚类效果?针对同一文献标本,采用同样的常规处理过程,对关键词和主题词的聚类效果进行对比统计分析,结果显示在高频词、类团成员及聚类质量上,存在较大差别。表明在共词聚类分析法的具体应用中,选择不同的对象时,不能简单套用相同的数据处理过程。最后,就共词聚类分析法的应用、处理规范等方面提出一些意见和建议。
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 图书馆论坛
[作者]
刘智锋 李信 程齐凯 陆伟
文章制定信息计量学领域关键词语义功能分类框架,并基于该分类框架构建信息计量学领域关键词语义功能标注数据集,为学术文本语义分析与理解相关研究提供理论基础和数据支撑,同时对数据集进行分析,为该数据集的应用作初步的探索。阐述了学术文本关键词语义功能及其相关的研究进展,在此基础之上构建信息计量学领域关键词语义功能分类框架;选取Journal of Informetrics (JOI)作为标注数据源,构建语义功能标注数据集;对标注数据集进行描述性分析,并从不同的语义功能角度出发,对信息计量学领域的研究现状进行分析。结果表明,文章构建了一个包含693篇论文,3312个关键词的关键词语义功能标注数据集;经分析可知,其中占比最大的语义功能为研究主题,其次为研究方法;此外,从不同的语义功能角度出发,能够细粒度地分析信息计量学领域的研究现状。
[期刊] 情报理论与实践
[作者]
王林 冷伏海
文章设计了用于文献不同特征交叉共现关系的分析算法,并将这种方法应用于关键词与引文的交叉共现关系研究。实验以计量研究为实证领域,通过微观的交叉共现对、宏观的可视共现网络这两个层次,对关键词与引文的交叉共现结果进行分析与解释,发现关键词与引文的交叉共现分析可用于发现领域的研究方向、识别论文的研究主题、查找某一研究方向的经典文献等。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除