标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10042)
2023(14465)
2022(12644)
2021(11909)
2020(9930)
2019(23038)
2018(23004)
2017(44249)
2016(24033)
2015(27082)
2014(27127)
2013(26222)
2012(23774)
2011(21176)
2010(20800)
2009(18689)
2008(17763)
2007(15168)
2006(12871)
2005(10757)
作者
(67308)
(55978)
(55416)
(52773)
(35440)
(26732)
(25311)
(22288)
(21370)
(19670)
(19108)
(18617)
(17686)
(17376)
(17246)
(16928)
(16785)
(16686)
(15914)
(15846)
(13766)
(13618)
(13536)
(12860)
(12532)
(12255)
(12236)
(12207)
(11202)
(11075)
学科
(90983)
经济(90872)
管理(68702)
(63490)
(53558)
企业(53558)
方法(45658)
数学(39875)
数学方法(39286)
(24026)
(23713)
中国(23066)
(20871)
业经(19913)
地方(17855)
理论(17146)
(16669)
农业(15897)
(15636)
贸易(15631)
(15185)
(15122)
财务(15105)
财务管理(15071)
(14844)
技术(14795)
企业财务(14267)
环境(14200)
(13174)
银行(13127)
机构
大学(330501)
学院(328218)
管理(132743)
(125211)
经济(122411)
理学(116486)
理学院(115159)
管理学(112860)
管理学院(112279)
研究(105984)
中国(76420)
(69495)
科学(67653)
(56687)
(53059)
(51809)
业大(51191)
中心(48619)
研究所(47786)
财经(46455)
(46114)
(44460)
师范(43987)
北京(42991)
(42469)
农业(41683)
(39505)
(37462)
经济学(36968)
技术(36119)
基金
项目(236858)
科学(186350)
研究(172580)
基金(171673)
(149832)
国家(148605)
科学基金(128191)
社会(107125)
社会科(101353)
社会科学(101326)
(92779)
基金项目(91668)
自然(84894)
自然科(82932)
自然科学(82910)
自然科学基金(81398)
教育(80752)
(78513)
编号(70916)
资助(70457)
成果(56477)
重点(52811)
(52129)
(49419)
(49370)
课题(48708)
创新(45969)
科研(45741)
教育部(44754)
大学(44431)
期刊
(128663)
经济(128663)
研究(91347)
中国(59559)
学报(54147)
科学(48806)
管理(47243)
(46950)
(42913)
大学(41341)
教育(40910)
学学(38905)
农业(32725)
技术(29924)
(23018)
金融(23018)
业经(22267)
财经(21769)
经济研究(20532)
(18519)
图书(17622)
问题(16739)
科技(16232)
(16231)
(15758)
理论(15489)
技术经济(14981)
实践(14337)
(14337)
商业(14235)
共检索到458394条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 情报科学  [作者] 李枫林  柯佳  
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识
[期刊] 图书情报工作  [作者] 韩普  顾亮  
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
[期刊] 图书情报工作  [作者] 王东波  胡昊天  周鑫  朱丹浩  
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
[期刊] 实验技术与管理  [作者] 唐贤伦   丁河长   唐瑜泽   谢涛   罗洪平  
关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方法:使用异构图将关系信息作为先验知识融入词表示,增强词表示的表示能力,使得模型能有效地处理单词实体重叠问题;使用语义融合模块将不同层次特征融合在一起作为关系分类模型的输入,使得模型能够有效地处理实体对重叠问题。所提方法在NYT和WebNLG数据集上取得了最好的效果,详细的实验也表明所提方法可以处理复杂的场景。
[期刊] 图书情报工作  [作者] 陈德鑫  占袁圆  杨兵  谢亚霓  
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报理论与实践  [作者] 赵文娟  刘忠宝  
文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介绍,对流程中使用的技术和方法进行了描述。最后通过"空难"框架下的"德国之翼坠机事件"为例对方法的有效性进行了验证。
[期刊] 数据分析与知识发现  [作者] 张琴  郭红梅  张智雄  
【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
[期刊] 情报学报  [作者] 赵洪  王芳  
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
[期刊] 图书馆建设  [作者] 白华  
针对用户标注的弱点,在标签的基础上构建本体框架并赋予标签丰富的语义,有助于进一步改善知识组织系统的性能。在大量标签数据的支持下,提取知识框架是一种建立本体框架的有效方法,提取方法主要采用特征或属性概括法,即针对一类标签集合的共同特征抽取它们的上位概念,并根据这些上位概念的关系建立知识框架。对基于两种系统的语义分析而构建的可以整合标签和概念本体的兼容本体进行分析可知,它吸取了用户标注的灵活、多元、表达性强大的特征,提高了知识组织系统的组织能力和标引功能;同时,也改进了用户标注系统的语义能力,使之具有丰富的结构和语义表达功能。
[期刊] 情报理论与实践  [作者] 邓擘  郑彦宁  樊孝忠  
在基于Bootstrap的信息抽取技术中,为提高实体关系抽取模式的质量,需要对抽取模式的可信度进行评估。本文提出了根据模式的历史匹配记录来对其进行可信度评估的简单方法,并以此为基础对模式进行了优化合并。经过可信度评估的模式在对句子进行实体关系标注时,有效提高了标注的准确率。这说明该方法能够提高抽取模式的质量,对信息抽取系统的性能提高有一定价值。
[期刊] 中国图书馆学报  [作者] 吴超  郑彦宁  化柏林  
通过对数值信息抽取文献的调研,先从文献类型、学科领域、高频关键词三个方面进行定量分析,从抽取数据源、抽取对象、抽取方法与技术、结果评价和应用等方面对当前数值信息抽取研究进行了梳理和总结。研究发现当前对于数值信息抽取的研究具有五个特点:抽取数据源以新闻语料、Web网页为主,抽取对象以基数类数值信息和数量类数值信息为主,抽取方法以基于规则的方法为主,抽取结果评价指标比较单一,但应用领域较为广泛。图4。表3。参考文献56。
[期刊] 情报理论与实践  [作者] 范涛  王昊  张宝隆  
[目的/意义]对非物质文化遗产(以下简称非遗)文本展开属性抽取研究,有利于非遗的知识图谱建设和非遗文化传播。[方法/过程]首先,基于非遗属性表,借助远程监督方法,构建大规模非遗文本属性标注语料。其次,基于深度学习方法构建CNN-BiLSTM-Att-CRF模型,对标注的非遗属性语料库中的属性值进行抽取,并同相关基线模型进行比较。[结果/结论]通过对标注语料库进行抽样检测,发现基于远程监督的非遗属性抽取标注语料库质量较高;本文提出的模型在多个非遗属性中属性抽取表现最优,同时平均的非遗属性抽取性能最佳。
[期刊] 情报学报  [作者] 唐琳  郭崇慧  陈静锋  孙磊磊  
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报理论与实践  [作者] 朱红灿  邹凯  
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。
[期刊] 南京农业大学学报  [作者] 沈利言  姜海燕  胡滨  谢元澄  
[目的]水稻病虫草害与药剂之间实体和关系的自动抽取,是构建作物系统领域知识图谱的重要基础。本文针对病虫草害防治文本中含有大量实体没有明确边界以及药剂与病虫草害实体之间存在大量多关系的技术问题,设计了一种基于新标注模式的双长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)网络与注意力机制结合的水稻病虫草害与药剂的实体关系联合抽取算法 (Joint Entity Recongnition And Relation Extraction For Rice Diseases,Pests,Weeds ,JE-DPW)。[方法]该方法在解码层利用BiLSTM网络的前向传播和反向传播,增强了算法对病虫草害防治文本中复杂语义特征的提取;再通过softmax分类器获取字符的类别标签实现实体识别的同时,利用注意力机制判断当前字符与之前字符之间存在的关联关系,实现了实体与多关系的联合抽取。[结果] 利用包含7 380个实体,8 605个关系的病虫草害防治文本数据集训练模型,使用测试集测试后发现:JE-DPW算法在病虫草害与药剂的实体抽取和关系分类任务中的准确率分别为91.3%和76.8%,对无边界实体识别的准确率为88.1%。与BiLSTM实现实体抽取方法相比,准确率高出8.1%。与利用RNN (Recurrent Neural Network)和LSTM(Long Short-Term Memory)分别实现关系分类的方法比较,准确率分别高出了22.6%和19.7%;随着关系数量的增加,JE-DPW算法在关系抽取上的F1值可保持17.4%~20.1%的优势。[结论]本文提出的算法可以有效提升水稻病虫草害防治文本中实体关系联合抽取的准确度,提高作物系统领域知识库的构建速度。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除