- 年份
- 2024(6427)
- 2023(9486)
- 2022(8555)
- 2021(8189)
- 2020(6908)
- 2019(16162)
- 2018(16226)
- 2017(31296)
- 2016(17139)
- 2015(19580)
- 2014(19509)
- 2013(19195)
- 2012(17439)
- 2011(15596)
- 2010(15423)
- 2009(13908)
- 2008(13380)
- 2007(11587)
- 2006(9971)
- 2005(8443)
- 学科
- 济(64658)
- 经济(64586)
- 管理(49007)
- 业(45234)
- 企(38799)
- 企业(38799)
- 方法(33147)
- 数学(28401)
- 数学方法(27946)
- 农(16068)
- 中国(15955)
- 学(15835)
- 财(15687)
- 业经(14198)
- 地方(12867)
- 理论(12454)
- 和(11709)
- 贸(10974)
- 贸易(10969)
- 农业(10699)
- 易(10629)
- 技术(10601)
- 务(10500)
- 环境(10440)
- 财务(10438)
- 财务管理(10415)
- 制(10239)
- 教育(9878)
- 企业财务(9844)
- 划(9409)
- 机构
- 大学(238793)
- 学院(236837)
- 管理(98404)
- 济(87264)
- 理学(86080)
- 经济(85171)
- 理学院(85144)
- 管理学(83490)
- 管理学院(83082)
- 研究(75041)
- 中国(54125)
- 京(51089)
- 科学(49247)
- 财(38957)
- 所(37147)
- 业大(36860)
- 农(36052)
- 研究所(34221)
- 中心(34015)
- 江(32655)
- 北京(32196)
- 财经(32070)
- 范(31704)
- 师范(31442)
- 经(29093)
- 农业(28341)
- 院(27689)
- 州(27376)
- 技术(26110)
- 师范大学(25383)
- 基金
- 项目(169007)
- 科学(132207)
- 研究(123866)
- 基金(121434)
- 家(105234)
- 国家(104350)
- 科学基金(90083)
- 社会(75156)
- 社会科(71146)
- 社会科学(71124)
- 省(66535)
- 基金项目(65140)
- 自然(60012)
- 自然科(58597)
- 自然科学(58587)
- 自然科学基金(57487)
- 教育(57105)
- 划(56006)
- 编号(51901)
- 资助(50611)
- 成果(42012)
- 重点(37074)
- 部(36525)
- 课题(35183)
- 创(34919)
- 发(34799)
- 项目编号(32535)
- 科研(32445)
- 创新(32407)
- 大学(31526)
共检索到330559条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
化柏林 刘一宁 郑彦宁
学术定义是学术研究中一种基础性的知识。科技文献中蕴含着丰富的定义,对定义进行自动抽取是知识抽取的一种应用。这些定义具有一定的特征与规律,利用这些特征与规律形成规则对定义进行抽取是常见的方法。定义抽取中最重要的工作是规则构建。文章通过对定义语句的结构方式和分类进行研究,提出了一种基于多重规则的学术定义抽取规则构建方案。该方案通过构建模式规则、句法规则以及加权词规则,构建学术定义抽取所需要的多重规则。
关键词:
学术定义 知识抽取 规则构建
[期刊] 情报理论与实践
[作者]
刘一宁 郑彦宁 化柏林
设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。
关键词:
学术定义 知识抽取 自然语言处理 分析
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
[期刊] 情报理论与实践
[作者]
丁君军 郑彦宁 化柏林
学术文献作为科研成果的结晶,蕴含着丰富的知识,属性抽取作为知识抽取的一种应用,是把不同学术文献中对于某一学术概念的属性描述集中起来,用来构建属性描述知识库。本文通过人工构建规则的方法,形成了属性抽取的九大类描述规则,并对属性描述进行了数量关系和情感信息方面的分析,然后对学术概念属性抽取系统进行设计和实现,并对《情报学报》2007年和2008年的文章进行抽取实验,对系统抽取的结果和人工标记的结果进行了测评,并进行了实验结果的分析。
关键词:
知识抽取 规则构建 学术定义 概念
[期刊] 图书与情报
[作者]
赵蓉英 张心源
从资源角度来看,智库是一个拥有大量知识资源的知识库。知识经济时代,知识层面成为继载体层面后的知识资源管理与计量的新视角,知识元概念的提出为实现知识资源直接管理和计量提供了可能。中文文本的分类、挖掘、标引等研究基础为我国智库成果的知识元抽取提供了技术保障,将抽取出的知识元归类、进一步归纳出对应的描述规则有利于实现知识层面的中文智库成果管理与评价。文章基于构建主题词表进行文本抽取的方法,选择中国国际问题研究中心2015年全部可获得的智库研究成果为样本,进行成果知识元的抽取,经过人工选择、精炼抽取结果后归纳总结
关键词:
智库 知识元 中文智库成果 描述规则
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 图书情报工作
[作者]
卓可秋 沈思 王东波
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。
[期刊] 图书情报工作
[作者]
蒋婷 孙建军
[目的 /意义]概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法 /过程]首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果...
关键词:
本体构建 非等级关系抽取 关系抽取
[期刊] 情报学报
[作者]
蒋婷 孙建军
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学
关键词:
本体构建 等级关系抽取 术语抽取
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
[期刊] 情报理论与实践
[作者]
李有梅
In the field of automatic information processing,how to precisely describe the text's content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text.
[期刊] 情报理论与实践
[作者]
耿焕同 宋庆席 何宏强
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词:
网络 信息抽取 视觉分块
[期刊] 图书馆杂志
[作者]
鲍宸洋 任明
实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键。目前深度学习在家谱文本信息抽取方面取得了良好的效果,但是对标注数据的依赖始终是其发展瓶颈之一。本文面向家谱的世系小传,研究基于小规模标注数据进行家谱人物和关系的抽取方法。具体来说:基于Bootstrapping的思想,以少量的标注数据作为初始种子集,使用深度学习BiLSTM-CRF模型为待标注样本自动预测标签序列,并筛选高置信分数的样本加入标注集中,从而迭代地扩展标注集,最后训练得到的模型用于命名实体识别和关系抽取。基于真实数据集的实验表明,使用Bootstrapping改进的BiLSTM-CRF模型能够基于小规模标注数据实现家谱信息抽取,使基于深度学习的家谱信息抽取更加高效。在种子集规模为250条时取得的预测效果与训练集规模为1800条的BiLSTM-CRF模型的预测效果接近。
[期刊] 情报理论与实践
[作者]
宋宇 罗准辰 真溱
科技文献间的引用关系把关系密切、具有相似主题的文献联系在一起。通过引用关系可以获得文献的引用背景信息。引用背景信息有助于对科技文献内容的理解。文章提出了一种基于引用关系构造引用背景信息,用来改进关键词自动抽取效果的方法,并通过实验验证了方法的有效性。
关键词:
自动抽取 关键词 科技文献 引用
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除