标题
  • 标题
  • 作者
  • 关键词
登 录
当前IP:忘记密码?
年份
2024(10155)
2023(14601)
2022(12771)
2021(11983)
2020(9940)
2019(23002)
2018(22905)
2017(43702)
2016(23790)
2015(26765)
2014(26724)
2013(25706)
2012(23302)
2011(20744)
2010(20329)
2009(18153)
2008(17227)
2007(14646)
2006(12423)
2005(10292)
作者
(66567)
(55268)
(54845)
(52264)
(35041)
(26424)
(25068)
(21992)
(21110)
(19366)
(18953)
(18410)
(17468)
(17209)
(17119)
(16736)
(16659)
(16512)
(15778)
(15645)
(13622)
(13430)
(13324)
(12700)
(12351)
(12195)
(12063)
(12050)
(11108)
(10971)
学科
(88922)
经济(88817)
管理(66981)
(61995)
(52145)
企业(52145)
方法(44383)
数学(38822)
数学方法(38206)
(23891)
(22821)
中国(22757)
(20230)
业经(20045)
地方(17860)
理论(17038)
(16551)
农业(15853)
(14903)
贸易(14897)
(14769)
财务(14687)
财务管理(14655)
技术(14639)
(14574)
(14456)
环境(14084)
企业财务(13870)
(12863)
教育(12847)
机构
大学(324263)
学院(322897)
管理(130435)
(122223)
经济(119445)
理学(114423)
理学院(113152)
管理学(110858)
管理学院(110279)
研究(103577)
中国(74634)
(68185)
科学(66636)
(54972)
(52782)
业大(50886)
(50469)
中心(47885)
研究所(46586)
(45417)
财经(44975)
(43678)
师范(43187)
北京(42190)
农业(41499)
(41120)
(38669)
(37006)
技术(36353)
经济学(35969)
基金
项目(234203)
科学(184059)
研究(170738)
基金(169123)
(147773)
国家(146561)
科学基金(126516)
社会(105521)
社会科(99858)
社会科学(99833)
(92629)
基金项目(90362)
自然(83873)
自然科(81945)
自然科学(81923)
自然科学基金(80401)
教育(80072)
(78104)
编号(70335)
资助(69348)
成果(55746)
重点(52330)
(51174)
(49196)
(48901)
课题(48429)
创新(45557)
科研(45221)
大学(43941)
教育部(43909)
期刊
(125453)
经济(125453)
研究(89290)
中国(58913)
学报(53634)
科学(47902)
(46726)
管理(46673)
(41494)
教育(41061)
大学(40978)
学学(38539)
农业(32703)
技术(30262)
(22338)
金融(22338)
业经(21878)
财经(20809)
经济研究(19891)
图书(17762)
(17685)
(16348)
问题(16286)
科技(16258)
(15602)
理论(15195)
技术经济(14820)
业大(14132)
实践(14113)
(14113)
共检索到450299条记录
发布时间倒序
  • 发布时间倒序
  • 相关度优先
文献计量分析
  • 结果分析(前20)
  • 结果分析(前50)
  • 结果分析(前100)
  • 结果分析(前200)
  • 结果分析(前500)
[期刊] 图书情报工作  [作者] 韩普  顾亮  
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
[期刊] 情报科学  [作者] 李枫林  柯佳  
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识
[期刊] 图书情报工作  [作者] 王东波  胡昊天  周鑫  朱丹浩  
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
[期刊] 图书情报工作  [作者] 冷伏海  白如江  祝清松  
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
[期刊] 实验技术与管理  [作者] 唐贤伦   丁河长   唐瑜泽   谢涛   罗洪平  
关系抽取是信息抽取中的一项重要任务,其目的是从非结构化文本中抽取出所有关系三元组。然而,如何有效地处理这一问题仍然是一个挑战,特别是对于关系重叠问题。为了有效处理重叠问题,该文提出一种基于异构图和语义融合的实体关系抽取方法:使用异构图将关系信息作为先验知识融入词表示,增强词表示的表示能力,使得模型能有效地处理单词实体重叠问题;使用语义融合模块将不同层次特征融合在一起作为关系分类模型的输入,使得模型能够有效地处理实体对重叠问题。所提方法在NYT和WebNLG数据集上取得了最好的效果,详细的实验也表明所提方法可以处理复杂的场景。
[期刊] 图书情报工作  [作者] 陈德鑫  占袁圆  杨兵  谢亚霓  
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 情报科学  [作者] 梁珊  邱明涛  马静  
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 数据分析与知识发现  [作者] 张琴  郭红梅  张智雄  
【目的】为解决已有方法中单词特征表示不具有语义信息这一问题,对词嵌入表示特征在关系抽取中的作用进行探讨。【方法】考虑词嵌入表示级别、词汇级别和语法级别三种类型特征,利用朴素贝叶斯模型、决策树模型和随机森林模型进行对比实验,并选出代表全部特征的有效特征子集。【结果】使用全部特征时,决策树算法的准确率达到0.48,关系抽取效果最佳,Member-Collection(E_2,E_1)类型关系的F_1值达到0.70,特征排序结果表明依存关系有助于关系抽取。【局限】对小样本量和情况复杂的关系类型识别效果有待提高,
[期刊] 情报学报  [作者] 唐琳  郭崇慧  陈静锋  孙磊磊  
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报学报  [作者] 赵洪  王芳  
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
[期刊] 情报理论与实践  [作者] 朱恒民  马静  黄卫东  
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
[期刊] 图书与情报  [作者] 赵蓉英  张心源  
从资源角度来看,智库是一个拥有大量知识资源的知识库。知识经济时代,知识层面成为继载体层面后的知识资源管理与计量的新视角,知识元概念的提出为实现知识资源直接管理和计量提供了可能。中文文本的分类、挖掘、标引等研究基础为我国智库成果的知识元抽取提供了技术保障,将抽取出的知识元归类、进一步归纳出对应的描述规则有利于实现知识层面的中文智库成果管理与评价。文章基于构建主题词表进行文本抽取的方法,选择中国国际问题研究中心2015年全部可获得的智库研究成果为样本,进行成果知识元的抽取,经过人工选择、精炼抽取结果后归纳总结
[期刊] 情报理论与实践  [作者] 范涛  王昊  张宝隆  
[目的/意义]对非物质文化遗产(以下简称非遗)文本展开属性抽取研究,有利于非遗的知识图谱建设和非遗文化传播。[方法/过程]首先,基于非遗属性表,借助远程监督方法,构建大规模非遗文本属性标注语料。其次,基于深度学习方法构建CNN-BiLSTM-Att-CRF模型,对标注的非遗属性语料库中的属性值进行抽取,并同相关基线模型进行比较。[结果/结论]通过对标注语料库进行抽样检测,发现基于远程监督的非遗属性抽取标注语料库质量较高;本文提出的模型在多个非遗属性中属性抽取表现最优,同时平均的非遗属性抽取性能最佳。
[期刊] 清华大学学报(自然科学版)  [作者] 张敏  丁弼原  马为之  谭云志  刘奕群  马少平  
近年来基于矩阵分解的协同过滤算法在评分预测上取得了显著成果,但仍未能很好地解决冷启动、数据稀疏等问题。因此,如何将评论信息引入推荐系统以缓解上述问题成为研究的热点之一。该文尝试基于深度学习来加强个性化推荐,提出将层叠降噪自动编码器(stacked denoising auto-encoder,SDAE)与隐含因子模型(latent factor model,LFM)相结合的混合推荐方法,综合考虑评论文本与评分,以提升推荐模型对潜在评分预测的准确性。在常用大规模公开Amazon数据集上进行的测试结果表明:与
[期刊] 情报理论与实践  [作者] 朱红灿  邹凯  
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。
文献操作() 导出元数据 文献计量分析
导出文件格式:WXtxt
作者:
删除