- 年份
- 2024(8572)
- 2023(12543)
- 2022(10894)
- 2021(10116)
- 2020(8497)
- 2019(19583)
- 2018(19299)
- 2017(37340)
- 2016(19960)
- 2015(22653)
- 2014(22390)
- 2013(22030)
- 2012(20054)
- 2011(17837)
- 2010(18015)
- 2009(16701)
- 2008(15218)
- 2007(13172)
- 2006(11522)
- 2005(10052)
- 学科
- 济(75627)
- 经济(75544)
- 管理(55665)
- 业(54707)
- 企(46823)
- 企业(46823)
- 方法(36568)
- 数学(31754)
- 数学方法(31248)
- 融(26646)
- 金融(26645)
- 中国(25232)
- 银(24765)
- 银行(24723)
- 行(23873)
- 财(20803)
- 农(19322)
- 学(18234)
- 业经(17691)
- 地方(17659)
- 制(16464)
- 务(14616)
- 财务(14551)
- 财务管理(14528)
- 理论(14217)
- 企业财务(13882)
- 农业(13358)
- 贸(12974)
- 贸易(12960)
- 易(12594)
- 机构
- 大学(276991)
- 学院(275176)
- 管理(110679)
- 济(104791)
- 经济(102262)
- 理学(96202)
- 理学院(95146)
- 管理学(93259)
- 管理学院(92795)
- 研究(90671)
- 中国(73305)
- 京(58995)
- 科学(58368)
- 财(48655)
- 所(45292)
- 农(43744)
- 中心(43406)
- 业大(42086)
- 研究所(41685)
- 财经(39638)
- 江(38724)
- 北京(37435)
- 经(36007)
- 范(35995)
- 师范(35644)
- 农业(34318)
- 院(33434)
- 州(32694)
- 经济学(31076)
- 财经大学(29743)
- 基金
- 项目(195143)
- 科学(152832)
- 基金(141409)
- 研究(140822)
- 家(123624)
- 国家(122614)
- 科学基金(105506)
- 社会(86672)
- 社会科(82247)
- 社会科学(82223)
- 省(76459)
- 基金项目(75676)
- 自然(70503)
- 自然科(68868)
- 自然科学(68855)
- 自然科学基金(67565)
- 划(64499)
- 教育(63939)
- 资助(58852)
- 编号(57542)
- 成果(46051)
- 重点(43833)
- 部(42069)
- 发(41265)
- 创(40421)
- 课题(39284)
- 科研(37920)
- 创新(37702)
- 大学(36219)
- 项目编号(35995)
- 期刊
- 济(108496)
- 经济(108496)
- 研究(79950)
- 中国(49844)
- 学报(45139)
- 科学(41186)
- 管理(39318)
- 农(38708)
- 融(35571)
- 金融(35571)
- 财(35404)
- 大学(33840)
- 学学(31922)
- 教育(29230)
- 农业(26589)
- 技术(23331)
- 财经(18257)
- 业经(17391)
- 经济研究(17048)
- 经(15347)
- 图书(15265)
- 理论(14970)
- 实践(14011)
- 践(14011)
- 科技(13793)
- 问题(13607)
- 业(13296)
- 技术经济(12936)
- 资源(12404)
- 版(12385)
共检索到397550条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆
[作者]
张孝飞
文章通过分析传统关键词提取方法的特点及不足,提出了融合多元特征的中文网页关键词提取方法。该方法既综合了中文网页文档词语的词频、词性、词长以及词位置等特征,又考虑了文档中出现的同义词、组合词现象的关键词评分,有效提高了传统关键词提取算法的精度。实验结果表明该算法优于传统方法,在网络情报监测中具有较大应用价值。
关键词:
提取 多元特征 同义词 组合词
[期刊] 图书馆学研究
[作者]
艾金勇
文章归纳整理了藏文网页的结构特征,在借鉴中英文关键词抽取方法的基础上,设计实现了融合语义知识的藏文网页关键词抽取算法。该算法利用藏文文本特征实现了网页内容模块的智能识别,在对识别的文本块进行自动分词后,采用改进的TF-IDF算法得到基础词集,然后根据词向量特征进行基础词的语义扩展构建候选关键词集,最后利用候选关键词之间的语义相关度值,确立藏文网页的关键词。藏文网页的实验测试结果表明该方法提取的藏文网页关键词具有较高的准确率。
[期刊] 情报理论与实践
[作者]
张建娥
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法在不同测试集上与传统方法相比关键词提取的平均召回率均得到明显提升。
关键词:
中文文档 特征融合 关键词
[期刊] 情报理论与实践
[作者]
钱爱兵 江岚
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候选关键词评分加权公式;对SharpICTCLAS分词进行改进,增加位置标注;选择评分较高的词作为候选关键词,利用词的位置标注进行关键词抽取优化操作,将"切碎"的候选关键词进行组配,形成正式抽取的关键词。实验结果表明:该方法明显优于基准方法,能够抽取到令人满意的关键词。
关键词:
词频 逆文档频率 新闻网页 关键词抽取
[期刊] 情报杂志
[作者]
李航 唐超兰 杨贤 沈婉婷
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模
[期刊] 情报理论与实践
[作者]
孙佳佳
[目的/意义]已有研究大多是通过频次研究关键词的热点程度和分布,较少有研究综合考虑多个维度的属性,对关键词的重要性进行考量。从词汇或词组集合中识别出重要关键词,有助于研究者把握学科领域的重点内容,为科研选题、确定研究内容等提供决策支持。[方法/过程]首先,通过理论分析,引入RFM模型,提出关键词重要性概念模型和指标体系;其次,构建特征数据集,参考Glo Ve词向量模型的思想,通过共现矩阵提取关键词的特征向量;再次,使用关键词重要性概念模型提取分类标签,对数据进行自动化标注;最后,通过人工智能相关算法进行模型训练和验证,证明提出的识别方法的可行性。[结果/结论]模型训练和评估,SVC算法的F1值达到0.79,Bi LSTM模型的F1值达到0.87,具有较好的拟合效果,说明提出的重要关键词识别方法具有可行性。[创新/局限]研究的创新点在于提出了具有多维度属性的关键词重要性概念模型和指标体系,并在深度学习模型上得到较好的评估结果;局限之处在于需要进一步扩大数据量,选择更多学科领域的数据对关键词概念模型进行验证,这是进一步研究的重点。
[期刊] 情报学报
[作者]
俞琰 尚明杰 赵乃瑄
由于目前专利关键词抽取主要依据通用文本关键词抽取方法,没有充分考虑专利特征的问题,本文提出基于专利权利要求特征驱动的专利关键词抽取方法。该方法主要包括预处理、基于最长公共子串的候选关键词选取、基于信息增益比的冗余候选关键词去除和融入特指度的候选关键词权重等四个主要步骤。真实专利数据实验结果表明,本文提出的权利要求特征驱动的专利关键词抽取方法具有可行性与有效性。
关键词:
抽取 权利要求特征 TF-IDF
[期刊] 情报理论与实践
[作者]
吴思竹 张智雄
本文通过对网页结构和内容特征的深入分析和识别,对噪音网页的过滤方法进行研究和实验。首先利用阈值过滤具有明显特征的噪音网页,而后建立网页特征向量,利用SVM对网页进行分类。采用采集自Web的网页数据进行实验分析,最后得出研究结论,并展望下一步工作。
关键词:
网络资源 噪音网页 过滤方法
[期刊] 情报理论与实践
[作者]
张海潮 王昊 唐慧慧 薛蔚
[目的/意义]探讨中文社会科学领域题名关键词最佳抽取模型,用以获取引文题名关键词,完成附加关键词的抽取。[方法/过程]文章以2014年CSSCI全部文献的题名为语料,运用条件随机场(CRFs),通过探究不同特征(或集合)和参数对关键词识别的影响,构建字角色标注的题名关键词标引模型,最终迁移应用到引文题名。[结果/结论]通过实验,获得最佳题名关键词标引模型,F1值可达到52.03%,每篇原文可获得附加关键词9个左右。在恰当的特征组合与参数下,构建的标引模型可以有效完成附加关键词的获取工作。[局限]语料中的每个关键词平均出现两次可能会影响机器学习的效果,原文与引文题名的差异可能影响模型的适用性,此外模型得到的附加关键词尚需进一步斟酌选择。
[期刊] 情报理论与实践
[作者]
徐文海 温有奎
本文在海量智能分词基础之上,提出了一种基于向量空间模型和TFIDF方法的中文关键词抽取算法。该算法在对文本进行自动分词后,用TFIDF方法对文献空间中的每个词进行权重计算,然后根据计算结果抽取出科技文献的关键词。通过自编软件进行的实验测试表明该算法对中文科技文献的关键词自动抽取成效显著。
关键词:
关键词抽取 向量空间模型 算法
[期刊] 图书馆论坛
[作者]
邹永利 林智昊
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性。研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持。
关键词:
网络文献 学术文献 网页特征 信息检索
[期刊] 工业工程与管理
[作者]
卢啸岩 郑宇 昝欣
制造企业现有的内部知识管理系统大多通过人工选取产品研发文档标签,效率低下,应用自然语言处理技术抽取文档关键词作为文档标签有助于制造企业知识管理系统智能化。针对产品研发文档关键词提取问题,提出了BERT-BiLSTM-TFIDF关键词自动抽取方法,基于BERT-BiLSTM设计句权重模型以计算各词语所在句子的句权重,同时添加词性权重以及外部语料库,以改进TFIDF算法,改善了现有关键词自动提取方法没有合理利用词语的语义信息、上下文关系的缺点,经过实验证实具有较好的效果。
[期刊] 图书情报工作
[作者]
余本功 李婷 杨颖
[目的/意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法/过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF?IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。
[期刊] 中国图书馆学报
[作者]
邓三鸿 王昊 秦嘉杭 苏新宁
中文书目机器自动标引是数字图书馆建设中亟待解决的关键问题之一。本文试图将条件随机场(CRFs)序列标注机器学习算法引入到关键词抽取中,建立面向图书内容、基于字角色标注的中文书目关键词标引模型。将图书内容转化为字序列,进而提出构建关键词角色空间模型和综合利用字序列上下文特征的设计思路。通过实验,从题名和内容提要中分别自动抽取关键词,论证该模型的合理性和实用性。
[期刊] 图书情报工作
[作者]
陈翀 罗鹏程 汪十红
提出一种利用引用信息提取关键词的新方法,将候选词项与引用文献之间的关系抽象为二部图,使用Co-HITS方法迭代计算词项重要性得分至收敛,选出得分最高的词项作为关键词。用ACM数据库中主分类为"信息系统"的论文摘要作为数据集进行评测,结果显示本文所提出的方法优于同类基于图模型计算词项重要度的方法,适用于科学文献和其他具有链接关系的文本集合。在考虑引用信息的情况下,所提取的关键词不但概括原文还能体现原文受到外界关注的内容要点。
关键词:
关键词提取 引用文本 Co-HITS
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除