- 年份
- 2024(9416)
- 2023(13592)
- 2022(11345)
- 2021(10384)
- 2020(8446)
- 2019(19448)
- 2018(19014)
- 2017(35794)
- 2016(18957)
- 2015(21112)
- 2014(20928)
- 2013(20076)
- 2012(18551)
- 2011(16660)
- 2010(16429)
- 2009(14516)
- 2008(13735)
- 2007(12054)
- 2006(10420)
- 2005(9159)
- 学科
- 济(83945)
- 经济(83872)
- 管理(54763)
- 业(53929)
- 企(43114)
- 企业(43114)
- 方法(35046)
- 数学(30987)
- 数学方法(30492)
- 中国(24707)
- 农(22958)
- 地方(22241)
- 业经(19502)
- 技术(18580)
- 财(17998)
- 农业(16001)
- 学(14205)
- 贸(13905)
- 贸易(13893)
- 环境(13674)
- 易(13429)
- 制(12822)
- 发(12544)
- 和(12501)
- 银(12354)
- 银行(12331)
- 融(12247)
- 金融(12246)
- 地方经济(12185)
- 理论(11904)
- 机构
- 学院(261041)
- 大学(258667)
- 济(108570)
- 经济(106413)
- 管理(104007)
- 理学(89493)
- 理学院(88561)
- 研究(88148)
- 管理学(86960)
- 管理学院(86470)
- 中国(66201)
- 京(54926)
- 科学(53903)
- 财(47572)
- 所(42627)
- 中心(41999)
- 农(41485)
- 江(39068)
- 研究所(38752)
- 业大(38118)
- 财经(37953)
- 范(35418)
- 师范(35073)
- 经(34640)
- 北京(34406)
- 经济学(32751)
- 院(32605)
- 农业(32030)
- 州(31454)
- 技术(29925)
- 基金
- 项目(181517)
- 科学(144363)
- 研究(135111)
- 基金(130515)
- 家(113293)
- 国家(112322)
- 科学基金(97625)
- 社会(86706)
- 社会科(82431)
- 社会科学(82408)
- 省(72710)
- 基金项目(68778)
- 教育(62203)
- 自然(61618)
- 划(60522)
- 自然科(60248)
- 自然科学(60237)
- 自然科学基金(59092)
- 编号(55209)
- 资助(52780)
- 发(43962)
- 成果(43307)
- 重点(41018)
- 部(39775)
- 创(39080)
- 课题(37878)
- 创新(36574)
- 国家社会(36224)
- 发展(34983)
- 科研(34641)
- 期刊
- 济(118480)
- 经济(118480)
- 研究(75403)
- 中国(54803)
- 管理(39466)
- 农(37787)
- 学报(37418)
- 科学(36576)
- 财(36287)
- 教育(32354)
- 大学(29711)
- 技术(28907)
- 学学(27744)
- 农业(26766)
- 融(22779)
- 金融(22779)
- 业经(20944)
- 经济研究(18845)
- 财经(18204)
- 经(15752)
- 问题(15272)
- 技术经济(15083)
- 业(14590)
- 科技(14058)
- 图书(14038)
- 统计(13354)
- 策(12516)
- 理论(11946)
- 资源(11942)
- 坛(11936)
共检索到390768条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报杂志
[作者]
韩雷 邱均平 杨思洛
[目的/意义]科学评价过程指标体系非常庞杂,研究中需要完成如何处理数据的问题,面对处理繁琐复杂的数据,往往需要花费大量时间,影响了评价的效率。[方法/过程]提出多目标优化编程思想,基于计算机算法理论中的分治策略,采用递归树方法,建立数据抽取模型。[结果/结论]用最简洁、科学的方式完成数据的搜集、整理与处理工作,提高科学评价工作的效率。
[期刊] 图书情报工作
[作者]
俞琰 鞠鹏 尚明杰
[目的/意义]针对目前专利关键词抽取算法评价中主要采用抽取的关键词与专家人工标注关键词进行匹配存在的问题,提出一种基于信息增益与相似度的专利关键词抽取算法评价模型。[方法/过程]提出的评价模型从内部和外部两个层面评估专利关键词抽取算法的准确性。其中,内部评价模型度量待评价算法抽取的每个关键词的信息增益,以评估被抽取的关键词的新颖性与创造性;外部评价模型使用待评价算法抽取的关键词集表示专利,计算相关专利的相似度,衡量算法抽取的关键词描述专利主题的有效性。[结果/结论]通过评价模型有效性验证实验与评价模型应用实证研究,结果表明提出的基于信息增益与相似度的评价模型具有可行性与有效性。
关键词:
专利 关键词抽取 评价 信息增益 相似度
[期刊] 情报理论与实践
[作者]
白如江 杨振瑜 王效岳
文章利用KeyGraph算法来对搜索引擎中的长句查询进行处理,抽取其中的关键主题,然后再在KL-divergency、BM25、TFIDF三种不同的检索模型上分别进行实验。研究发现经过KeyGraph关键词抽取技术处理过的长句查询检索效果得到了明显提高,并且在KL-divergency语言模型上的检索效果最好,有效地提高了长句查询的准确率和相关文档的排序。
关键词:
长句查询 检索模型 关键词
[期刊] 情报理论与实践
[作者]
宋宇 真溱
文章把关键词自动抽取拆分为3个阶段的问题:如何进行文本预处理;怎样获得关键词候选词集;该采用什么方法从候选词集中筛选出关键词。首先针对不同阶段的问题,详细地介绍现有的典型方法。然后介绍了关键词自动抽取技术最新的研究进展,并分析了关键词自动抽取技术的发展趋势。最后指出了目前关键词自动抽取技术研究的不足之处。
关键词:
关键词 自动抽取 研究进展 综述
[期刊] 情报理论与实践
[作者]
徐文海 温有奎
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
关键词:
关键词抽取 向量空间模型 算法
[期刊] 情报理论与实践
[作者]
李有梅
In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报学报
[作者]
王晓宇 王芳
鉴于关键词对大规模文献检索和文本内容分析的基础作用,本文提出了一种基于语义文本图的无监督关键词抽取算法,重点对传统基于图(graph-based)方法中的文本图构建和词加权方式进行改进。为了使文本图保留更多的语义和结构信息,算法根据单词在句子中的语义依存关系,生成由概念连接、等价隶属、功能属性和修饰限定四种属性边构成的语义文本图,省去传统图生成方法中所需要的窗口长度参数设定。在此基础上,本文提出融合关键词位置信息、概念层级和连接强度的词权重计算方法,并对词语的重要性排序,最终选择高得分节点构成摘要文本的关键词集合。在四个开放语料上的实验结果显示,本文提出的方法抽词效果优于其他三个同类baseline算法,F1值最高为0.570。
关键词:
文本图 关键词抽取 词加权 句法解析
[期刊] 情报理论与实践
[作者]
王志宏 过弋
[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%~13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 情报学报
[作者]
俞琰 尚明杰 赵乃瑄
由于目前专利关键词抽取主要依据通用文本关键词抽取方法,没有充分考虑专利特征的问题,本文提出基于专利权利要求特征驱动的专利关键词抽取方法。该方法主要包括预处理、基于最长公共子串的候选关键词选取、基于信息增益比的冗余候选关键词去除和融入特指度的候选关键词权重等四个主要步骤。真实专利数据实验结果表明,本文提出的权利要求特征驱动的专利关键词抽取方法具有可行性与有效性。
关键词:
抽取 权利要求特征 TF-IDF
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 情报杂志
[作者]
李航 唐超兰 杨贤 沈婉婷
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模
[期刊] 数据分析与知识发现
[作者]
夏天
【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;Top
[期刊] 图书情报工作
[作者]
王东波 胡昊天 周鑫 朱丹浩
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除