- 年份
- 2024(4562)
- 2023(6599)
- 2022(5584)
- 2021(5383)
- 2020(4542)
- 2019(10461)
- 2018(10232)
- 2017(20139)
- 2016(10301)
- 2015(11534)
- 2014(11019)
- 2013(10511)
- 2012(9231)
- 2011(7894)
- 2010(7293)
- 2009(6178)
- 2008(5365)
- 2007(4043)
- 2006(2875)
- 2005(1998)
- 学科
- 济(40972)
- 经济(40936)
- 管理(30175)
- 业(28941)
- 方法(24517)
- 企(24370)
- 企业(24370)
- 数学(22567)
- 数学方法(22209)
- 财(10989)
- 农(9901)
- 中国(9076)
- 业经(8160)
- 务(7572)
- 财务(7539)
- 财务管理(7523)
- 企业财务(7177)
- 贸(7030)
- 贸易(7029)
- 技术(6985)
- 易(6875)
- 农业(6671)
- 地方(6449)
- 和(6108)
- 环境(6048)
- 学(5794)
- 理论(5735)
- 制(5492)
- 划(5459)
- 融(4662)
- 机构
- 大学(131592)
- 学院(131121)
- 管理(58784)
- 济(56372)
- 经济(55525)
- 理学(52658)
- 理学院(52217)
- 管理学(51323)
- 管理学院(51060)
- 研究(35713)
- 中国(26485)
- 京(24962)
- 财(23904)
- 科学(20638)
- 财经(20574)
- 业大(19124)
- 经(19096)
- 中心(18631)
- 经济学(17955)
- 农(16918)
- 江(16591)
- 经济学院(16440)
- 经济管理(15879)
- 财经大学(15873)
- 商学(15393)
- 范(15269)
- 商学院(15259)
- 师范(15114)
- 所(14468)
- 北京(14242)
- 基金
- 项目(102898)
- 科学(83796)
- 基金(78466)
- 研究(75291)
- 家(67510)
- 国家(67009)
- 科学基金(60333)
- 社会(50367)
- 社会科(48017)
- 社会科学(48006)
- 基金项目(42229)
- 自然(39531)
- 省(39351)
- 自然科(38718)
- 自然科学(38710)
- 自然科学基金(38006)
- 教育(35305)
- 划(33089)
- 资助(31119)
- 编号(29739)
- 部(23581)
- 重点(22666)
- 创(22531)
- 国家社会(21857)
- 成果(21537)
- 发(21401)
- 教育部(21090)
- 创新(21058)
- 人文(20861)
- 科研(20555)
共检索到166740条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
王晓宇 王芳
鉴于关键词对大规模文献检索和文本内容分析的基础作用,本文提出了一种基于语义文本图的无监督关键词抽取算法,重点对传统基于图(graph-based)方法中的文本图构建和词加权方式进行改进。为了使文本图保留更多的语义和结构信息,算法根据单词在句子中的语义依存关系,生成由概念连接、等价隶属、功能属性和修饰限定四种属性边构成的语义文本图,省去传统图生成方法中所需要的窗口长度参数设定。在此基础上,本文提出融合关键词位置信息、概念层级和连接强度的词权重计算方法,并对词语的重要性排序,最终选择高得分节点构成摘要文本的关键词集合。在四个开放语料上的实验结果显示,本文提出的方法抽词效果优于其他三个同类baseline算法,F1值最高为0.570。
关键词:
文本图 关键词抽取 词加权 句法解析
[期刊] 情报理论与实践
[作者]
徐文海 温有奎
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
关键词:
关键词抽取 向量空间模型 算法
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 图书情报工作
[作者]
俞琰 鞠鹏 尚明杰
[目的/意义]针对目前专利关键词抽取算法评价中主要采用抽取的关键词与专家人工标注关键词进行匹配存在的问题,提出一种基于信息增益与相似度的专利关键词抽取算法评价模型。[方法/过程]提出的评价模型从内部和外部两个层面评估专利关键词抽取算法的准确性。其中,内部评价模型度量待评价算法抽取的每个关键词的信息增益,以评估被抽取的关键词的新颖性与创造性;外部评价模型使用待评价算法抽取的关键词集表示专利,计算相关专利的相似度,衡量算法抽取的关键词描述专利主题的有效性。[结果/结论]通过评价模型有效性验证实验与评价模型应用实证研究,结果表明提出的基于信息增益与相似度的评价模型具有可行性与有效性。
关键词:
专利 关键词抽取 评价 信息增益 相似度
[期刊] 情报学报
[作者]
刘家益 李鲡瑶 张智雄 邹益民
科技论文的关键词和被引次数与论文主题具有高相关性,是发现论文重要内容的有力线索。但这两个特征尚未应用于当前面向科技论文的多文档自动摘要方法中,其对科技论文自动摘要效果的影响还有待探索。本文通过设计对比算法和实验,定量分析研究了科技论文的关键词、被引次数两个特征对科技论文自动摘要效果的影响。结果表明:引入关键词因子和被引次数因子能显著提高摘要的效果。其中,同时使用两个因子,对摘要效果的积极影响最为显著;单独使用被引次数因子对摘要效果的积极影响也较为显著,但弱于同时使用两个因子;单独使用关键词因子对摘要效果影
关键词:
被引次数 科技论文 多文档自动摘要
[期刊] 情报理论与实践
[作者]
李有梅
In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
[期刊] 情报理论与实践
[作者]
王志宏 过弋
[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%~13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。
[期刊] 图书情报工作
[作者]
宋东桓 李晨英 刘子瑜 韩明杰
[目的/意义]论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程]假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论]结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。
[期刊] 数据分析与知识发现
[作者]
夏天
【目的】将维基百科蕴涵的世界知识以词向量方式融入TextRank模型,改进单文档关键词抽取效果。【方法】利用Word2Vec模型基于维基百科中文数据,生成词向量模型,对TextRank词图节点的词向量进行聚类以调整簇内节点的投票重要性,结合节点的覆盖和位置因素,计算节点之间的随机跳转概率,生成转移矩阵,最终通过迭代计算获得节点的重要性得分,选取前TopN个词语生成关键词。【结果】当TopN≤7时,词向量聚类加权方法均优于对比方法;TopN=3时,F值取得最大值,比先前最优结果增量提升了3.374%;Top
[期刊] 情报理论与实践
[作者]
白如江 杨振瑜 王效岳
文章利用KeyGraph算法来对搜索引擎中的长句查询进行处理,抽取其中的关键主题,然后再在KL-divergency、BM25、TFIDF三种不同的检索模型上分别进行实验。研究发现经过KeyGraph关键词抽取技术处理过的长句查询检索效果得到了明显提高,并且在KL-divergency语言模型上的检索效果最好,有效地提高了长句查询的准确率和相关文档的排序。
关键词:
长句查询 检索模型 关键词
[期刊] 情报学报
[作者]
刘挺 吴岩 王开铸
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织,生成连贯的段落
关键词:
自动文摘,信息抽取,文本生成
[期刊] 情报学报
[作者]
俞琰 尚明杰 赵乃瑄
由于目前专利关键词抽取主要依据通用文本关键词抽取方法,没有充分考虑专利特征的问题,本文提出基于专利权利要求特征驱动的专利关键词抽取方法。该方法主要包括预处理、基于最长公共子串的候选关键词选取、基于信息增益比的冗余候选关键词去除和融入特指度的候选关键词权重等四个主要步骤。真实专利数据实验结果表明,本文提出的权利要求特征驱动的专利关键词抽取方法具有可行性与有效性。
关键词:
抽取 权利要求特征 TF-IDF
[期刊] 情报理论与实践
[作者]
宋宇 真溱
文章把关键词自动抽取拆分为3个阶段的问题:如何进行文本预处理;怎样获得关键词候选词集;该采用什么方法从候选词集中筛选出关键词。首先针对不同阶段的问题,详细地介绍现有的典型方法。然后介绍了关键词自动抽取技术最新的研究进展,并分析了关键词自动抽取技术的发展趋势。最后指出了目前关键词自动抽取技术研究的不足之处。
关键词:
关键词 自动抽取 研究进展 综述
[期刊] 情报杂志
[作者]
李航 唐超兰 杨贤 沈婉婷
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除