- 年份
- 2024(8160)
- 2023(11939)
- 2022(10387)
- 2021(9724)
- 2020(8137)
- 2019(18895)
- 2018(18557)
- 2017(36098)
- 2016(19186)
- 2015(21797)
- 2014(21637)
- 2013(21400)
- 2012(19469)
- 2011(17403)
- 2010(17576)
- 2009(16333)
- 2008(14874)
- 2007(12857)
- 2006(11337)
- 2005(9877)
- 学科
- 济(74219)
- 经济(74141)
- 管理(56115)
- 业(54366)
- 企(47156)
- 企业(47156)
- 方法(36278)
- 数学(31176)
- 数学方法(30688)
- 融(26445)
- 金融(26443)
- 中国(24685)
- 银(24417)
- 银行(24373)
- 行(23528)
- 财(19987)
- 农(18436)
- 业经(17633)
- 学(17395)
- 地方(17275)
- 制(15931)
- 理论(14477)
- 务(14161)
- 财务(14096)
- 财务管理(14073)
- 企业财务(13447)
- 技术(13017)
- 农业(12841)
- 和(12742)
- 贸(12675)
- 机构
- 大学(269562)
- 学院(267196)
- 管理(109462)
- 济(102283)
- 经济(99833)
- 理学(95167)
- 理学院(94162)
- 管理学(92375)
- 管理学院(91919)
- 研究(85973)
- 中国(69463)
- 京(57314)
- 科学(54570)
- 财(46974)
- 所(42494)
- 中心(41106)
- 农(40852)
- 业大(40078)
- 研究所(39015)
- 财经(38375)
- 江(37320)
- 北京(36301)
- 经(34788)
- 范(34734)
- 师范(34424)
- 农业(31913)
- 州(31833)
- 院(31360)
- 经济学(30257)
- 财经大学(28751)
- 基金
- 项目(187910)
- 科学(147189)
- 研究(137088)
- 基金(136038)
- 家(118080)
- 国家(117086)
- 科学基金(101210)
- 社会(84674)
- 社会科(80413)
- 社会科学(80390)
- 省(73567)
- 基金项目(72693)
- 自然(66820)
- 自然科(65294)
- 自然科学(65282)
- 自然科学基金(64067)
- 教育(62217)
- 划(61696)
- 资助(56739)
- 编号(56432)
- 成果(45618)
- 重点(41509)
- 部(40626)
- 发(39487)
- 创(39281)
- 课题(38032)
- 创新(36590)
- 科研(36021)
- 项目编号(35717)
- 大学(35080)
- 期刊
- 济(106017)
- 经济(106017)
- 研究(77318)
- 中国(48324)
- 学报(42627)
- 管理(39264)
- 科学(38804)
- 农(36302)
- 融(34917)
- 金融(34917)
- 财(34378)
- 大学(32077)
- 学学(30001)
- 教育(28761)
- 农业(25025)
- 技术(23239)
- 财经(17851)
- 图书(17542)
- 业经(17009)
- 经济研究(16521)
- 理论(15147)
- 经(15039)
- 实践(14218)
- 践(14218)
- 科技(13686)
- 问题(13305)
- 技术经济(13103)
- 情报(12666)
- 业(12390)
- 现代(12007)
共检索到386489条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆学研究
[作者]
艾金勇
文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法。该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算法得到基础词集,然后根据词向量特征进行基础词的语义扩展构建候选关键词集,最后利用候选关键词之间的语义相关度值,确立藏文网页的关键词。藏文网页的实验测试结果表明该方法提取的藏文网页关键词具有较高的准确率。
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
[期刊] 图书馆理论与实践
[作者]
艾金勇
通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上,提出了结合语义信息的藏文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行自动分词后,利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小排序并确定了文本的主题句。
关键词:
藏文网页 语义信息 主题句 抽取
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 情报理论与实践
[作者]
孙佳佳
[目的/意义]已有研究大多是通过频次研究关键词的热点程度和分布,较少有研究综合考虑多个维度的属性,对关键词的重要性进行考量。从词汇或词组集合中识别出重要关键词,有助于研究者把握学科领域的重点内容,为科研选题、确定研究内容等提供决策支持。[方法/过程]首先,通过理论分析,引入RFM模型,提出关键词重要性概念模型和指标体系;其次,构建特征数据集,参考Glo Ve词向量模型的思想,通过共现矩阵提取关键词的特征向量;再次,使用关键词重要性概念模型提取分类标签,对数据进行自动化标注;最后,通过人工智能相关算法进行模型训练和验证,证明提出的识别方法的可行性。[结果/结论]模型训练和评估,SVC算法的F1值达到0.79,Bi LSTM模型的F1值达到0.87,具有较好的拟合效果,说明提出的重要关键词识别方法具有可行性。[创新/局限]研究的创新点在于提出了具有多维度属性的关键词重要性概念模型和指标体系,并在深度学习模型上得到较好的评估结果;局限之处在于需要进一步扩大数据量,选择更多学科领域的数据对关键词概念模型进行验证,这是进一步研究的重点。
[期刊] 情报杂志
[作者]
李航 唐超兰 杨贤 沈婉婷
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模
[期刊] 图书情报知识
[作者]
吕鹏辉 邵建芳 杨善林
本文对学科语义知识网络的发展历程进行了详细回顾,从最初的雏形概念网络到目前的基于语义层面的大型数据仓库的构建,再到叙词表或者本体网络的构建。这些都与时代背景下的大数据与可视化技术离不开关系,目前卓有成效的叙词表是医学领域和化学领域的机标词库和叙词表。论文还介绍了学科语义知识网络的基础理论、诞生背景和构建方法,学科语义知识网络的诞生和发展与科学知识网络整序、大数据技术的诞生、可视化手段的成熟有着千丝万缕的联系。本文选择医学信息学进行语义网络的实证研究并展示了其语义网络演化过程。
[期刊] 情报理论与实践
[作者]
钱爱兵 江岚
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。
关键词:
词频 逆文档频率 新闻网页 关键词抽取
[期刊] 情报理论与实践
[作者]
巴志超 杨子江 朱世伟 王蕾
有效揭示领域中主题的浮现机理及发展轨迹,对学科、领域未来发展态势进行预测和战略决策具有重要意义。文章提出一种基于关键词语义网络的领域主题演化分析方法。首先,通过引入浅层神经网络语言模型word2vec对领域文献的题名、摘要进行建模学习,将关键词表示成语义级别的词向量结构;其次,在建模基础上,结合equivalence共现系数进行关键词语义相似度计算并构建关键词语义网络;最后采用社会网络分析方法从合著网络、共现网络等角度对领域主题进行演化特征分析。实验表明:该方法能够有效地识别领域的热点主题及发展趋势。
[期刊] 工业工程与管理
[作者]
卢啸岩 郑宇 昝欣
制造企业现有的内部知识管理系统大多通过人工选取产品研发文档标签,效率低下,应用自然语言处理技术抽取文档关键词作为文档标签有助于制造企业知识管理系统智能化。针对产品研发文档关键词提取问题,提出了BERT-BiLSTM-TFIDF关键词自动抽取方法,基于BERT-BiLSTM设计句权重模型以计算各词语所在句子的句权重,同时添加词性权重以及外部语料库,以改进TFIDF算法,改善了现有关键词自动提取方法没有合理利用词语的语义信息、上下文关系的缺点,经过实验证实具有较好的效果。
[期刊] 图书情报工作
[作者]
余本功 李婷 杨颖
[目的/意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法/过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF?IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。
[期刊] 图书情报工作
[作者]
陈翀 罗鹏程 汪十红
提出一种利用引用信息提取关键词的新方法,将候选词项与引用文献之间的关系抽象为二部图,使用Co-HITS方法迭代计算词项重要性得分至收敛,选出得分最高的词项作为关键词。用ACM数据库中主分类为"信息系统"的论文摘要作为数据集进行评测,结果显示本文所提出的方法优于同类基于图模型计算词项重要度的方法,适用于科学文献和其他具有链接关系的文本集合。在考虑引用信息的情况下,所提取的关键词不但概括原文还能体现原文受到外界关注的内容要点。
关键词:
关键词提取 引用文本 Co-HITS
[期刊] 情报理论与实践
[作者]
李有梅
In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.
[期刊] 情报理论与实践
[作者]
李国垒 陈先来
文章通过构建关键词—叙词矩阵,利用潜在语义分析技术,实现了关键词与叙词的自动对照。在此系统中,当用户输入关键词后,该系统能够自动提示出与之相关的叙词,辅助标引人员和检索用户根据实际情况进行选择。实验结果表明,该方法取得了良好的效果。
关键词:
潜在语义分析 叙词 关键词
[期刊] 图书情报工作
[作者]
刘萍 王哲
阐述作者关键词耦合和形式概念分析的基本原理,详细讨论在作者关键词耦合的基础上生成概念格的具体方法以及知识结构的建构过程。通过对该方法在某一科研组织中的应用举例,阐明该方法能够较好地揭示组织知识结构。与传统的共词分析方法相比,基于形式概念分析的作者关键词耦合分析方法层次化效果更清晰、人工干预程度更低。
关键词:
作者关键词耦合 形式概念分析 知识结构
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除