- 年份
- 2024(8638)
- 2023(12522)
- 2022(11135)
- 2021(10499)
- 2020(8767)
- 2019(20562)
- 2018(20295)
- 2017(39629)
- 2016(21188)
- 2015(23962)
- 2014(23708)
- 2013(23103)
- 2012(20837)
- 2011(18549)
- 2010(18042)
- 2009(16090)
- 2008(15211)
- 2007(12762)
- 2006(10753)
- 2005(8799)
- 学科
- 济(82510)
- 经济(82419)
- 管理(60923)
- 业(57479)
- 企(48606)
- 企业(48606)
- 方法(43809)
- 数学(38540)
- 数学方法(37954)
- 农(20875)
- 财(20691)
- 中国(19669)
- 学(18187)
- 业经(17793)
- 地方(15575)
- 理论(14322)
- 农业(14103)
- 和(14013)
- 务(14000)
- 贸(13932)
- 财务(13930)
- 贸易(13927)
- 财务管理(13899)
- 技术(13527)
- 易(13521)
- 企业财务(13166)
- 环境(12968)
- 制(12282)
- 划(11503)
- 教育(10385)
- 机构
- 大学(292825)
- 学院(289978)
- 管理(121802)
- 济(111991)
- 经济(109608)
- 理学(107505)
- 理学院(106399)
- 管理学(104330)
- 管理学院(103819)
- 研究(89380)
- 中国(64420)
- 京(60835)
- 科学(57192)
- 财(48918)
- 业大(44812)
- 农(43486)
- 所(42604)
- 中心(41549)
- 财经(41033)
- 研究所(39426)
- 江(39106)
- 范(38023)
- 师范(37679)
- 经(37565)
- 北京(37514)
- 农业(34138)
- 院(33296)
- 经济学(33214)
- 州(32313)
- 经济管理(31135)
- 基金
- 项目(212203)
- 科学(167653)
- 基金(155253)
- 研究(154418)
- 家(134672)
- 国家(133595)
- 科学基金(116451)
- 社会(96779)
- 社会科(91808)
- 社会科学(91784)
- 基金项目(83210)
- 省(82464)
- 自然(77341)
- 自然科(75591)
- 自然科学(75573)
- 自然科学基金(74173)
- 教育(71490)
- 划(69472)
- 资助(64001)
- 编号(63380)
- 成果(49399)
- 部(46759)
- 重点(46662)
- 创(44210)
- 发(43970)
- 课题(42098)
- 创新(41187)
- 科研(41141)
- 教育部(40444)
- 大学(40107)
- 期刊
- 济(110990)
- 经济(110990)
- 研究(79078)
- 学报(46470)
- 中国(46350)
- 管理(42242)
- 科学(41893)
- 农(37944)
- 财(36306)
- 大学(35788)
- 学学(33095)
- 教育(31320)
- 农业(27107)
- 技术(26822)
- 图书(19229)
- 业经(18988)
- 财经(18682)
- 融(18464)
- 金融(18464)
- 经济研究(17663)
- 经(15820)
- 理论(14533)
- 问题(14453)
- 科技(14444)
- 技术经济(14229)
- 实践(13618)
- 践(13618)
- 情报(13511)
- 版(13412)
- 统计(13246)
共检索到394213条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
王星 刘伟
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。
[期刊] 情报学报
[作者]
王永成 顾晓明 王丽霞
本文介绍了上海交通大学电脑应用技术研究所开发的中文文献主题自动标引系统CSAIS2.1的主要思路、基本算法及其基本结构
关键词:
自动标引,中文文献,主题词
[期刊] 情报理论与实践
[作者]
高影繁 徐红姣 王惠临
文章提出一种基于多重过滤策略的科技文献自动标引方法,该方法不依赖于大规模训练语料,很容易作为处理模块嵌入到其他文本处理环节中,实验结果验证了方法的可行性。另外,还提出了一种基于二次文献的标引词评价方法。该方法虽然严重依赖于二次文献中给出的摘要和关键词的质量,但在人力和物力资源不足以支持建立一个高质量测试集的条件下是有价值的,制定更加合理有效的评测方案势在必行。
关键词:
多重过滤 科技文献 自动标引
[期刊] 情报学报
[作者]
牛凯
本文针对目前国内外各种计算机自动标引的理论和方法在知识表达方式、词典结构、词的切分和组配、歧义处理等方面所存在的不足,提出了词典基于静态知识表达的网状结构,较好地解决了词典的完备性与存储空间的矛盾;同时使知识的表达更为简洁实用,为切分歧义难点的根本解决提供了方法论。
[期刊] 图书情报工作
[作者]
邹永利 冯文炬
学术文献具有鲜明的文体特征,且部分特征能够用于PDF格式网络中文学术文献的自动识别与检索。提取学术文献在特有表述、句子平均长度、中西文比例等方面存在的特征,用来识别PDF格式的中文学术文献,对Google通用搜索引擎的搜索结果进行重新排序。结果显示文体特征的运用能够在一定程度上提高网络PDF学术文献的检准率。
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报学报
[作者]
杨建林
本文提出了几个可以改善中文自动文摘系统的文摘效果的措施 :1 将字频统计方法和词频统计方法有机结合起来 ;2 进一步研究人工文摘中理解性文摘句的形成机理 ,完善仿人算法 ;3 将自动聚类的方法引入自动文摘研究。
关键词:
自动文摘 字频统计 词频统计 自动聚类
[期刊] 情报学报
[作者]
王永成 张坤
本文对作者开发的两个中文文献自动分类系统的工作原理、方法、数学模型和实现技术进行了比较全面的介绍。
[期刊] 图书馆论坛
[作者]
邹永利 林智昊
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性。研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持。
关键词:
网络文献 学术文献 网页特征 信息检索
[期刊] 图书情报工作
[作者]
雷声伟 陈海华 黄永 陆伟
[目的 /意义]引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法 /过程]梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果 /结论]实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。
[期刊] 情报学报
[作者]
王继华 王怀惠 吴泽宜
本文介绍了一个中文农业文献自动标引系统SDIC/CASDAIS,它集自动主题标引与自动分类标引于一体,采用主题词表、预匹配词表和停用词表相结合的词典法方案,匹配中采取正向增字跳字最长匹配的算法,末二字回溯,制订大量规则以降低错标。该系统可完成主题标引和分类标引,能处理农业文献中常见的缩略语和科技术语不规范现象,具备动态构词功能。SDIC/CASDAIS系统采用特征词析取方法处理不包含在词表中的品种、物质名称和地名等关键词,其自由词判定规则还可以判别标题的部分自由词,通过词频统计可作为更新词表的依据。SDIC/CASDAIS系统的标引速度为3000条标题/小时,平均标引深度略大于4,主题标引精度...
[期刊] 情报理论与实践
[作者]
白如江 王晓笛 王效岳
科技文献通常包括研究目的、方法、结果和结论等信息,如何将科技文献标引上这些信息,帮助科研人员在数量巨大的文献中快速发现符合研究需要的内容显得尤为重要。文章在研究分析科技文献写作特点基础上,提出了基于词、英文(专有名词、缩写词)以及数字的核心特征词提取策略;然后将科技文献标引问题转化为句子分类问题,结合提出的核心特征词,采用支持向量机分类器对科技文献进行句子级别的语义标引。通过对1168篇糖尿病医学类论文实验,证明本文提出的方法能够有效地学习和标引科技文献中的句子,进而有效地对科技文献关键信息点进行自动标引。
关键词:
自动标引 支持向量机 特征提取 科技文献
[期刊] 情报学报
[作者]
何浩 杨海棠
本文介绍一种基于n gram技术的、与语言无关的文献分类方法K meansaxiales (KMA) ,及其在中文文献自动分类中的应用。这种方法将文献转换成由n gram(n个连续的字符 )频次构成的向量。为压缩存储空间、提高处理速度 ,我们运用哈希函数将n gram映射为哈希码 ,对文献的分析实际上以哈希码频次为基础运行。采用KMA算法 ,我们对一个中文数据库进行了自动分类的实验研究 ,在比较实验结果的基础上 ,我们对KMA算法初始参数的选择进行了初步探讨。
[期刊] 情报学报
[作者]
叶新明
本文通过对现有中文自动分词算法的分析,提出了适于中文文献自动分类的自动分词算法。该算法通过建立机读词表,以《中图法》作为分类标准,对中文文献实现了自动分类。通过对财政金融类文献的测试,其准确率可达79%。
[期刊] 图书馆杂志
[作者]
沈立力 姜鹏 王静
Google AI团队发布的BERT模型在多项自然语言处理任务中取得了研究成果,但在中文文献自动分类领域尚有待探索。本文旨在探索BERT_(base)中文基础模型在中文社科、科技期刊文献分类上的实际分类效果,指出模型在实际应用中存在的问题并提出解决方法。本文选取R大类(医药、卫生)、TG大类(金属学与金属工艺)、F大类(经济)、J大类(艺术)共1 745 000条数据作为训练语料,并以另外9 610条数据作为测试样本,利用BERT模型分别对社科、科技期刊文献进行分类研究。测试结果表明BERT模型在社科文献中的四级准确率为76.95%,科技文献为68.55%。之后引入惩罚策略,为实际工作中免检数据阈值的设定提供参考。BERT_(base)模型在《全国报刊索引》实际分类标引工作中有一定可行性,基本满足当前网络环境下中文文献自动分类的需求。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除