标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(8699)
2023(12495)
2022(10505)
2021(9727)
2020(8248)
2019(18856)
2018(18392)
2017(35271)
2016(18650)
2015(21031)
2014(20665)
2013(19928)
2012(18035)
2011(16014)
2010(15803)
2009(14662)
2008(12931)
2007(11111)
2006(9451)
2005(8081)
作者
(52467)
(43592)
(43246)
(41119)
(27423)
(20865)
(19757)
(17135)
(16983)
(15365)
(14827)
(14711)
(13831)
(13631)
(13602)
(13550)
(12974)
(12774)
(12670)
(12449)
(10731)
(10657)
(10577)
(10250)
(10014)
(9592)
(9561)
(9396)
(8920)
(8766)
学科
(72058)
经济(71973)
管理(53046)
(50785)
(43094)
企业(43094)
方法(35496)
数学(31753)
数学方法(31315)
(26710)
金融(26703)
中国(24767)
(24418)
银行(24375)
(23547)
(21533)
(18575)
(17659)
地方(15964)
业经(15923)
(14885)
(14275)
财务(14220)
财务管理(14190)
企业财务(13583)
理论(13001)
(12867)
(12626)
贸易(12616)
农业(12590)
机构
大学(249738)
学院(249716)
(101305)
经济(99190)
管理(96446)
理学(83992)
理学院(83126)
研究(82787)
管理学(81379)
管理学院(80959)
中国(68458)
(51552)
科学(51284)
(47580)
(45001)
中心(41177)
(40806)
业大(39498)
财经(38272)
研究所(37465)
(36495)
农业(35653)
(35003)
经济学(31865)
北京(31469)
(30933)
(30393)
师范(29893)
(29287)
财经大学(28956)
基金
项目(178639)
科学(141008)
基金(130971)
研究(127160)
(115732)
国家(114799)
科学基金(98736)
社会(81175)
社会科(77049)
社会科学(77029)
(70665)
基金项目(69148)
自然(65364)
自然科(63942)
自然科学(63919)
自然科学基金(62772)
(59621)
教育(59256)
资助(53847)
编号(49948)
重点(40799)
成果(39380)
(39322)
(38257)
(38240)
创新(35786)
科研(35184)
课题(35012)
国家社会(34094)
教育部(33779)
期刊
(101935)
经济(101935)
研究(69243)
中国(49296)
学报(43071)
(39549)
科学(38085)
(37623)
管理(35930)
(35434)
金融(35434)
大学(33101)
学学(31659)
农业(26106)
教育(25170)
技术(22763)
财经(18989)
经济研究(17060)
业经(16761)
(16315)
(13623)
问题(13190)
(12411)
统计(12373)
理论(11998)
业大(11420)
科技(11416)
技术经济(11152)
(11126)
实践(10895)
共检索到365419条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 实验技术与管理  [作者] 唐贤伦   丁河长   唐瑜泽   谢涛   罗洪平  
关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方法:使用异构图将关系信息作为先验知识融入词表示,增强词表示的表示能力,使得模型能有效地处理单词实体重叠问题;使用语义融合模块将不同层次特征融合在一起作为关系分类模型的输入,使得模型能够有效地处理实体对重叠问题。所提方法在NYT和WebNLG数据集上取得了最好的效果,详细的实验也表明所提方法可以处理复杂的场景。
[期刊] 数据分析与知识发现  [作者] 张琴  郭红梅  张智雄  
【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
[期刊] 图书情报工作  [作者] 魏巍  郑杜  
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 图书情报工作  [作者] 韩普  顾亮  
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
[期刊] 情报科学  [作者] 李枫林  柯佳  
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识
[期刊] 情报理论与实践  [作者] 邓擘  郑彦宁  樊孝忠  
在基于Bootstrap的信息抽取技术中,为提高实体关系抽取模式的质量,需要对抽取模式的可信度进行评估。本文提出了根据模式的历史匹配记录来对其进行可信度评估的简单方法,并以此为基础对模式进行了优化合并。经过可信度评估的模式在对句子进行实体关系标注时,有效提高了标注的准确率。这说明该方法能够提高抽取模式的质量,对信息抽取系统的性能提高有一定价值。
[期刊] 图书情报工作  [作者] 陈德鑫  占袁圆  杨兵  谢亚霓  
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报杂志  [作者] 李航  唐超兰  杨贤  沈婉婷  
[目的/意义]关键词提取在自然语言处理领域有着广泛的应用,如何快速准确地实现关键词的提取已经成为文本处理的关键问题。目前关键词提取方法非常多,但准确率仍有待提升。为此,提出一种结合单一文档内部结构信息、词语对于单文档和文档集整体的重要性的关键词抽取方法。[方法/过程]首先,根据词语的平均信息熵特征计算词语对文档集整体的重要性,利用词语的词性、位置特征计算词语对单文档中的重要性。然后,通过神经网络训练的方式优化三个特征的权重分配实现特征的融合。最后,利用三个特征计算得到词语的综合权值来改进TextRank模
[期刊] 情报理论与实践  [作者] 袁翠敏   李贺   解梦凡   刘嘉宇  
[目的/意义]图书评论中的异构信息包含多种数据结构和复杂高阶关系,而现有聚类方法主要是针对单一数据结构和成对关系的数据分类,为了充分挖掘现实世界中实体间的高阶交互关系,提升异构信息和高维数据集的聚类效果及可靠性,提出了基于异构图书评论信息融合模型(UB-TRR)的超图聚类方法。[方法/过程]以阅读分享社区中的图书评论数据集为基础,抽取图书和用户两类节点,梳理文本评论、评分评级和标签标注三种用户行为中的异构信息并抽取节点间的4类高阶交互关系作为超边,构建超图实现异构数据和高阶关系的融合表示,结合超图随机游走与谱聚类分别实现图书及用户节点的聚类分析,并在“豆瓣读书”数据集中进行模型实验。[结果/结论]实验结果表明,融合异构信息捕捉高阶关系后的超图聚类性能优于基线模型,具有良好的聚类效果和稳定性,为高维数据聚类方法的改进和优化提供了新的视角。
[期刊] 南京农业大学学报  [作者] 沈利言  姜海燕  胡滨  谢元澄  
[目的]水稻病虫草害与药剂之间实体和关系的自动抽取,是构建作物系统领域知识图谱的重要基础。本文针对病虫草害防治文本中含有大量实体没有明确边界以及药剂与病虫草害实体之间存在大量多关系的技术问题,设计了一种基于新标注模式的双长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)网络与注意力机制结合的水稻病虫草害与药剂的实体关系联合抽取算法 (Joint Entity Recongnition And Relation Extraction For Rice Diseases,Pests,Weeds ,JE-DPW)。[方法]该方法在解码层利用BiLSTM网络的前向传播和反向传播,增强了算法对病虫草害防治文本中复杂语义特征的提取;再通过softmax分类器获取字符的类别标签实现实体识别的同时,利用注意力机制判断当前字符与之前字符之间存在的关联关系,实现了实体与多关系的联合抽取。[结果] 利用包含7 380个实体,8 605个关系的病虫草害防治文本数据集训练模型,使用测试集测试后发现:JE-DPW算法在病虫草害与药剂的实体抽取和关系分类任务中的准确率分别为91.3%和76.8%,对无边界实体识别的准确率为88.1%。与BiLSTM实现实体抽取方法相比,准确率高出8.1%。与利用RNN (Recurrent Neural Network)和LSTM(Long Short-Term Memory)分别实现关系分类的方法比较,准确率分别高出了22.6%和19.7%;随着关系数量的增加,JE-DPW算法在关系抽取上的F1值可保持17.4%~20.1%的优势。[结论]本文提出的算法可以有效提升水稻病虫草害防治文本中实体关系联合抽取的准确度,提高作物系统领域知识库的构建速度。
[期刊] 图书情报工作  [作者] 冷伏海  白如江  祝清松  
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
[期刊] 图书馆论坛  [作者] 李芳  刘胜宇  刘峥  
深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融
[期刊] 图书情报工作  [作者] 王东波  胡昊天  周鑫  朱丹浩  
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
[期刊] 图书情报工作  [作者] 邱璇  李端明  张智慧  
[目的/意义]单一资源构建本体存在概念完整性和语义关系完整性的局限,为了满足用户对资源检索的个性化需求,综合FCA和异构资源各自的优势,采用异构资源构建本体的手段克服单一资源的局限。[方法/过程]以主题词表和Folksonomy数据集为数据源,各自构建形式背景,通过并叠置运算获得异构资源的形式背景,转换成概念格,从概念格中抽取概念模型,使用protégé工具和OWL语言构建实验本体。[结果/结论]通过词重率、增词率、漏词率3个参数,评估实验本体构建效果。实验结果表明,融合的本体有效地丰富了概念和概念间关系,比单一资源构建的本体更具有优势,为本体构建提供了一种新的可行方案。
[期刊] 图书情报工作  [作者] 聂卉  黄贵鹏  
重点研究基于语义标注样本的Web信息自动抽取的实现方法。借助自然语言处理框架GATE,首先引入领域本体对样本网页内容进行语义标注,精确定位出待抽取的语义项,并据此将样本网页解析为S-DOM树。从S-DOM树中抽取出语义项的特征描述,形成样本实例并采用机器学习算法归纳抽取规则,自动生成包装器。抽取过程中,通过比较网页结构的相似度,系统能够感知网页的变化,主动学习并扩展规则库。试验结果表明,由于精确定位保障了学习样本的质量,小样本学习生成的包装器能够达到较为理想的查全率和查准率。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除