- 年份
- 2024(7071)
- 2023(10254)
- 2022(8163)
- 2021(7607)
- 2020(6347)
- 2019(14301)
- 2018(14267)
- 2017(27950)
- 2016(14680)
- 2015(16444)
- 2014(16261)
- 2013(15495)
- 2012(13562)
- 2011(11656)
- 2010(11123)
- 2009(9915)
- 2008(9285)
- 2007(7947)
- 2006(6644)
- 2005(5393)
- 学科
- 济(61244)
- 经济(61077)
- 管理(41413)
- 业(39882)
- 企(33686)
- 企业(33686)
- 方法(31362)
- 数学(26559)
- 数学方法(26126)
- 农(17306)
- 中国(17094)
- 业经(15166)
- 财(15030)
- 农业(11268)
- 理论(10880)
- 地方(10821)
- 学(10705)
- 和(10497)
- 务(9842)
- 制(9808)
- 财务(9797)
- 财务管理(9776)
- 企业财务(9328)
- 技术(9175)
- 贸(8881)
- 贸易(8876)
- 易(8644)
- 环境(8349)
- 发(7832)
- 划(7784)
- 机构
- 大学(196921)
- 学院(196451)
- 济(81013)
- 管理(80741)
- 经济(79474)
- 理学(71103)
- 理学院(70409)
- 管理学(68999)
- 管理学院(68630)
- 研究(59638)
- 中国(44021)
- 京(39561)
- 财(35999)
- 科学(35807)
- 财经(29929)
- 中心(29089)
- 业大(28461)
- 农(28446)
- 经(27432)
- 江(27426)
- 所(27088)
- 经济学(25698)
- 范(25301)
- 师范(25061)
- 研究所(24869)
- 北京(23673)
- 经济学院(23263)
- 财经大学(22578)
- 院(22003)
- 农业(22001)
- 基金
- 项目(143432)
- 科学(115591)
- 基金(107137)
- 研究(105414)
- 家(92549)
- 国家(91806)
- 科学基金(81220)
- 社会(71128)
- 社会科(66539)
- 社会科学(66517)
- 基金项目(56801)
- 省(55339)
- 自然(52017)
- 自然科(50924)
- 自然科学(50915)
- 自然科学基金(49983)
- 教育(49219)
- 划(46501)
- 资助(42529)
- 编号(42381)
- 成果(32651)
- 部(32262)
- 重点(31982)
- 发(30224)
- 创(30204)
- 国家社会(30006)
- 教育部(28404)
- 创新(28213)
- 科研(27948)
- 人文(27936)
共检索到270216条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
余本功 李婷 杨颖
[目的/意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法/过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF?IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 工业工程与管理
[作者]
卢啸岩 郑宇 昝欣
制造企业现有的内部知识管理系统大多通过人工选取产品研发文档标签,效率低下,应用自然语言处理技术抽取文档关键词作为文档标签有助于制造企业知识管理系统智能化。针对产品研发文档关键词提取问题,提出了BERT-BiLSTM-TFIDF关键词自动抽取方法,基于BERT-BiLSTM设计句权重模型以计算各词语所在句子的句权重,同时添加词性权重以及外部语料库,以改进TFIDF算法,改善了现有关键词自动提取方法没有合理利用词语的语义信息、上下文关系的缺点,经过实验证实具有较好的效果。
[期刊] 统计研究
[作者]
杨宏进
统计数据中属性指标的质量控制是一个非常棘手的问题,也鲜有这方面的研究。本文通过总结多年的统计工作经验,并借鉴人工智能领域中语义识别技术,提出了一套基于关键词检查属性指标合理性的方法。该方法不仅有效地控制了属性指标的质量,也大大提高了数据审核的效率。
关键词:
统计数据 属性指标 关键词 检查方法
[期刊] 图书情报工作
[作者]
奉国和 孔泳欣 肖洁琼
[目的/意义]为克服关键词绝对词频分析的局限性,以关键词多因素加权及得分排名实现领域热点与趋势探索。[方法/过程]构建年度-关键词频次矩阵,用水平加权和垂直加权处理关键词词频,设计相对词频模型,计算关键词加权综合分值,以获得更有效的关键词排序。[结果/结论]基于关键词加权排序,可以识别量高质优型、量低质优型和突变型关键词,有利于挖掘研究热点和分析趋势。
关键词:
词频分析 加权关键词 热点研究 趋势分析
[期刊] 情报学报
[作者]
奉国和 孔泳欣
基于生命周期理论和词频分析方法,对学科领域发展过程进行客观合理的动态跟踪与分析。构建时间—关键词频次矩阵,结合相对词频、词频变化率,引入逻辑斯谛(Logistic)函数赋予词频按时间递减的权重,设计时间加权关键词词频分析模型,计算关键词综合值,揭示学科研究热点及变化趋势;并以CNKI和CSSCI收录的18种图情领域核心期刊2013—2017年所刊载的文献关键词作为实验对象,从高频词、中频词、低频词三个方面验证模型的有效性和准确性。模型计算结果显示,上升型高频词排名上浮,下降型高频词排名下沉,可快速识别上升型高频词;同时排名靠前的低频词具有发展潜能,为学者把握未来研究趋势提供科学判断依据。
[期刊] 图书情报工作
[作者]
陈翀 罗鹏程 汪十红
提出一种利用引用信息提取关键词的新方法,将候选词项与引用文献之间的关系抽象为二部图,使用Co-HITS方法迭代计算词项重要性得分至收敛,选出得分最高的词项作为关键词。用ACM数据库中主分类为"信息系统"的论文摘要作为数据集进行评测,结果显示本文所提出的方法优于同类基于图模型计算词项重要度的方法,适用于科学文献和其他具有链接关系的文本集合。在考虑引用信息的情况下,所提取的关键词不但概括原文还能体现原文受到外界关注的内容要点。
关键词:
关键词提取 引用文本 Co-HITS
[期刊] 图书情报知识
[作者]
李纲 戴强斌
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。
关键词:
语义相关 词汇链 关键词抽取 自动标引
[期刊] 情报理论与实践
[作者]
李有梅
In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.
[期刊] 情报理论与实践
[作者]
李秀霞 胡凡刚 袁林 张洪孟
突发关键词监测是发现相对增长率突然增加的关键词,目的是为了探测主题领域中的潜在热点因素。文章提出了加权中值相关和半阈值策略的突发关键词监测方法,并将其应用于"虚拟教育社区"研究主题的突发关键词监测;最后利用统计检验法和平均准确率、满意度验证了该监测方法的有效性。
关键词:
监测 加权中值相关 半阈值策略
[期刊] 数据分析与知识发现
[作者]
夏天
【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;Top
[期刊] 图书馆学研究
[作者]
艾金勇
文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法。该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算法得到基础词集,然后根据词向量特征进行基础词的语义扩展构建候选关键词集,最后利用候选关键词之间的语义相关度值,确立藏文网页的关键词。藏文网页的实验测试结果表明该方法提取的藏文网页关键词具有较高的准确率。
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
[期刊] 情报理论与实践
[作者]
孙佳佳
[目的/意义]已有研究大多是通过频次研究关键词的热点程度和分布,较少有研究综合考虑多个维度的属性,对关键词的重要性进行考量。从词汇或词组集合中识别出重要关键词,有助于研究者把握学科领域的重点内容,为科研选题、确定研究内容等提供决策支持。[方法/过程]首先,通过理论分析,引入RFM模型,提出关键词重要性概念模型和指标体系;其次,构建特征数据集,参考Glo Ve词向量模型的思想,通过共现矩阵提取关键词的特征向量;再次,使用关键词重要性概念模型提取分类标签,对数据进行自动化标注;最后,通过人工智能相关算法进行模型训练和验证,证明提出的识别方法的可行性。[结果/结论]模型训练和评估,SVC算法的F1值达到0.79,Bi LSTM模型的F1值达到0.87,具有较好的拟合效果,说明提出的重要关键词识别方法具有可行性。[创新/局限]研究的创新点在于提出了具有多维度属性的关键词重要性概念模型和指标体系,并在深度学习模型上得到较好的评估结果;局限之处在于需要进一步扩大数据量,选择更多学科领域的数据对关键词概念模型进行验证,这是进一步研究的重点。
[期刊] 情报理论与实践
[作者]
徐文海 温有奎
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
关键词:
关键词抽取 向量空间模型 算法
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除