- 年份
- 2024(7950)
- 2023(11709)
- 2022(10485)
- 2021(9940)
- 2020(8330)
- 2019(19170)
- 2018(19248)
- 2017(37323)
- 2016(20213)
- 2015(22514)
- 2014(22151)
- 2013(21827)
- 2012(19596)
- 2011(17503)
- 2010(17348)
- 2009(16088)
- 2008(15108)
- 2007(12949)
- 2006(11258)
- 2005(9626)
- 学科
- 济(78464)
- 经济(78377)
- 管理(57882)
- 业(54115)
- 企(45656)
- 企业(45656)
- 方法(38062)
- 数学(32670)
- 数学方法(32311)
- 农(20345)
- 中国(19777)
- 财(19072)
- 学(18208)
- 业经(17273)
- 地方(16229)
- 贸(14362)
- 贸易(14355)
- 理论(14180)
- 农业(13903)
- 易(13884)
- 和(13243)
- 技术(12925)
- 制(12393)
- 务(12152)
- 财务(12088)
- 财务管理(12072)
- 环境(11851)
- 企业财务(11355)
- 教育(11065)
- 划(11017)
- 机构
- 大学(277022)
- 学院(275622)
- 管理(112556)
- 济(106038)
- 经济(103686)
- 理学(98425)
- 理学院(97354)
- 管理学(95574)
- 管理学院(95105)
- 研究(88673)
- 中国(63728)
- 京(58386)
- 科学(56398)
- 财(47479)
- 所(43777)
- 农(41416)
- 业大(41169)
- 研究所(40142)
- 中心(39738)
- 财经(38806)
- 江(38548)
- 范(37406)
- 师范(37109)
- 北京(36417)
- 经(35259)
- 农业(32416)
- 院(32349)
- 州(31989)
- 经济学(30901)
- 师范大学(29993)
- 基金
- 项目(193951)
- 科学(152531)
- 研究(143207)
- 基金(140264)
- 家(121413)
- 国家(120395)
- 科学基金(103963)
- 社会(89063)
- 社会科(84295)
- 社会科学(84276)
- 省(75930)
- 基金项目(75147)
- 自然(67990)
- 自然科(66408)
- 自然科学(66394)
- 教育(65921)
- 自然科学基金(65196)
- 划(63700)
- 编号(59786)
- 资助(57398)
- 成果(48224)
- 重点(42812)
- 部(42222)
- 发(40829)
- 创(40670)
- 课题(40076)
- 创新(37745)
- 项目编号(37580)
- 科研(37056)
- 教育部(36476)
- 期刊
- 济(113428)
- 经济(113428)
- 研究(80065)
- 中国(47762)
- 学报(43166)
- 管理(40139)
- 科学(39903)
- 农(37295)
- 财(34945)
- 教育(32974)
- 大学(32401)
- 学学(30147)
- 农业(26521)
- 技术(23578)
- 业经(19725)
- 融(19052)
- 金融(19052)
- 经济研究(18726)
- 财经(17820)
- 图书(17481)
- 经(15130)
- 问题(14290)
- 理论(14098)
- 科技(13925)
- 技术经济(13216)
- 业(13120)
- 实践(13093)
- 践(13093)
- 情报(12862)
- 商业(12637)
共检索到389065条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
卓可秋 沈思 王东波
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。
[期刊] 清华大学学报(自然科学版)
[作者]
周炫余 刘林 卢笑 李璇 张思敏
关键词抽取是指能自动抽取反映文本主题的词或者短语,被广泛应用于文本检索、文本摘要等领域中。目前关键词抽取任务主要依赖于预训练语言模型来获取文本表示,这类语言模型主要基于单一模态的通用文本语料进行训练,存在无法根据下游任务特性进行领域适配和语义表征能力有限的问题。该文提出一种多模态信息增强表示的中文关键词抽取方法MIEnhance-KPE,首先引入Adapter层将偏旁和部首信息集成到预训练语言模型层中,得到领域自适应的文本表示;其次利用卷积神经网络提取汉字的图像特征,同时使用交叉注意力机制融合汉字图像特征和文本特征,实现文本语义表示增强;最后利用CRF(conditional random field)模型进行序列标注任务,并计算词语的位置词频权重对其进行排序获得关键词。与目前十分先进的关键词抽取方法KIEMP相比, MIEnhance-KPE在公开的中文科学文献数据集和自构建的中文教育关键词抽取数据集上的F值分别提升了15.71%和3.40%;消融实验结果表明,所提出的领域自适应模块和视觉语义增强表示模块均能有效提高关键词抽取的准确性。MIEnhance-KPE的提出有助于教育研究者精准了解教育发展趋势,促进教育理论和实践的创新。
[期刊] 图书情报工作
[作者]
蒋婷 孙建军
[目的 /意义]概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法 /过程]首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果...
关键词:
本体构建 非等级关系抽取 关系抽取
[期刊] 情报学报
[作者]
蒋婷 孙建军
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学
关键词:
本体构建 等级关系抽取 术语抽取
[期刊] 情报学报
[作者]
程为 郑德俊 朱梦蝶 丛天时 王燕红
知识元逻辑关系抽取关注上下文的句法结构与语法特征,通过上下文功能语义依赖定义触发词规则实现上下文范围内的关系抽取。为摆脱上下文的结构限制,本文提出一种知识元逻辑关系抽取的新方法。首先,面向领域文献资料,通过知识元抽取构建知识元集合;其次,基于领域知识特征构建知识元属性描述框架,对知识元进行全方位、细粒度的统一描述,基于知识元属性抽取构建知识元属性集合;最后,结合实际需求定义逻辑关系类型,采用逻辑关联实例分析与属性对比关联分析,以属性值的共现、包含、相关等基本关系为线索,通过特征分析与归纳总结构建逻辑关系规则库,通过规则匹配实现知识元逻辑关系抽取。以南海维权证据知识元为例,选取部分不同文本来源的证据,定义了证据间逻辑关系类型及其抽取规则,在证据知识元及其属性抽取的基础上,基于规则匹配实现南海维权证据间并列、承接、反驳与补强4种逻辑关系的抽取,构建了南海维权证据逻辑关联图谱。实证研究验证了本文方法的可行性,能够为知识元逻辑关系抽取的相关研究提供可参考的新思路。
[期刊] 情报理论与实践
[作者]
化柏林 刘一宁 郑彦宁
学术定义是学术研究中一种基础性的知识。科技文献中蕴含着丰富的定义,对定义进行自动抽取是知识抽取的一种应用。这些定义具有一定的特征与规律,利用这些特征与规律形成规则对定义进行抽取是常见的方法。定义抽取中最重要的工作是规则构建。文章通过对定义语句的结构方式和分类进行研究,提出了一种基于多重规则的学术定义抽取规则构建方案。该方案通过构建模式规则、句法规则以及加权词规则,构建学术定义抽取所需要的多重规则。
关键词:
学术定义 知识抽取 规则构建
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 情报学报
[作者]
胡昊天 邓三鸿 孔玲 闫晓慧 杨文霞 王东波 沈思
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法 (generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报学报
[作者]
赵一鸣 尹嘉颖
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。
[期刊] 图书情报工作
[作者]
张卫 王昊 李晓敏 Song Min
[目的/意义]古典诗歌意象善于运用物象(源域)隐喻人物或氛围情感(目标域),然而物象与情感知识目前广泛分布在多源异构的非结构化古诗文本内,尚未组织成具有知识解释体系的文化图式。[方法/过程]针对古诗意象提出一套基于知识本体的文化图式构建模式与技术实现方法。首先,定义基于序列标注的物象术语抽取和基于关系分类的物象与情感关系抽取任务。其次,在无学习语料下,搭建中文领域物象术语知识体系,用于文本内物象术语的自动标注;设计基于结构层面的规则模板与内容层面的概念共现约束,用于文本内意象关系的自动生成,进而通过深度学习实现物象术语与意象知识抽取。[结果/结论]基于古诗鉴赏文本开展实验,利用由5个一级类、12个二级类构成的物象知识体系标注29 765个物象术语,通过触发词与共现频率约束可获得8 977条结构和内容层面的意象关系。基于BE RT-BiLSTM-CNN-CRF的物象术语抽取F1值多在95%以上,基于BERT-SE-FC的物象与情感关系抽取准确率均在94%以上,并泛化出大量新物象术语与新意象关系。将意象知识存储形成知识图谱并展开知识关联可知:“喜爱”类专有意象包括等,构建古诗中将喜爱之情诉诸春日物象的文化图式;“长安”“女子”“明月”等通用物象则能构建多种文化图式来隐喻古诗中的不同情感。
[期刊] 数据分析与知识发现
[作者]
王东波 吴毅 叶文豪 刘睿伦
【目的】从大规模食品安全事件当中抽取食品安全事件实体。【方法】基于已发生的食品安全事件,结合情报学数据获取、标注和组织的方法,融合食品安全事件实体的多种分布特征知识,通过条件随机场模型,构建食品安全事件语料并从中抽取相应的实体。【局限】在食品安全事件实体抽取过程中所制定的特征模板在领域化迁移上具有一定的局限性。【结果】在已有1 500万字经过标注的食品安全事件语料的规模上,通过统计食品安全事件实体的内部和外部特征,基于条件随机场机器学习模型,构建了食品安全实体的抽取模型,该模型最高的F值达到91.94%。
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
[期刊] 图书馆杂志
[作者]
鲍宸洋 任明
实现家谱文本信息的自动抽取是家谱资源深度开发利用的关键。目前深度学习在家谱文本信息抽取方面取得了良好的效果,但是对标注数据的依赖始终是其发展瓶颈之一。本文面向家谱的世系小传,研究基于小规模标注数据进行家谱人物和关系的抽取方法。具体来说:基于Bootstrapping的思想,以少量的标注数据作为初始种子集,使用深度学习BiLSTM-CRF模型为待标注样本自动预测标签序列,并筛选高置信分数的样本加入标注集中,从而迭代地扩展标注集,最后训练得到的模型用于命名实体识别和关系抽取。基于真实数据集的实验表明,使用Bootstrapping改进的BiLSTM-CRF模型能够基于小规模标注数据实现家谱信息抽取,使基于深度学习的家谱信息抽取更加高效。在种子集规模为250条时取得的预测效果与训练集规模为1800条的BiLSTM-CRF模型的预测效果接近。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除