- 年份
- 2024(7880)
- 2023(11532)
- 2022(10191)
- 2021(9865)
- 2020(8166)
- 2019(19317)
- 2018(19519)
- 2017(37637)
- 2016(20538)
- 2015(23379)
- 2014(23513)
- 2013(22930)
- 2012(20599)
- 2011(18532)
- 2010(18760)
- 2009(16944)
- 2008(16399)
- 2007(14073)
- 2006(12127)
- 2005(10501)
- 学科
- 济(81069)
- 经济(80980)
- 管理(57992)
- 业(54575)
- 企(47054)
- 企业(47054)
- 方法(42186)
- 数学(36388)
- 数学方法(35632)
- 农(19980)
- 中国(19529)
- 学(18628)
- 财(18115)
- 业经(17856)
- 理论(17654)
- 地方(15311)
- 贸(13781)
- 贸易(13774)
- 和(13743)
- 易(13365)
- 农业(13320)
- 技术(12812)
- 制(12495)
- 教育(12174)
- 环境(11935)
- 务(11794)
- 财务(11718)
- 财务管理(11697)
- 划(11460)
- 企业财务(11042)
- 机构
- 大学(289692)
- 学院(288305)
- 管理(117738)
- 济(108557)
- 经济(106049)
- 理学(103317)
- 理学院(102187)
- 管理学(99916)
- 管理学院(99425)
- 研究(90701)
- 中国(65067)
- 京(61739)
- 科学(58692)
- 财(47995)
- 所(44954)
- 业大(43675)
- 农(43085)
- 研究所(41386)
- 中心(40830)
- 江(40161)
- 范(39455)
- 财经(39376)
- 师范(39128)
- 北京(39010)
- 经(35760)
- 农业(33793)
- 州(33312)
- 院(33052)
- 技术(31925)
- 经济学(31778)
- 基金
- 项目(201990)
- 科学(158742)
- 研究(147839)
- 基金(145428)
- 家(126271)
- 国家(125230)
- 科学基金(108270)
- 社会(89993)
- 社会科(85141)
- 社会科学(85116)
- 省(79843)
- 基金项目(77083)
- 自然(72321)
- 自然科(70665)
- 自然科学(70652)
- 教育(69993)
- 自然科学基金(69326)
- 划(67453)
- 编号(61585)
- 资助(61405)
- 成果(49530)
- 重点(45131)
- 部(43941)
- 课题(42712)
- 创(42082)
- 发(42025)
- 创新(39030)
- 科研(38690)
- 项目编号(38048)
- 大学(38018)
- 期刊
- 济(113119)
- 经济(113119)
- 研究(80956)
- 中国(51957)
- 学报(45043)
- 管理(42954)
- 科学(41611)
- 教育(39257)
- 农(38380)
- 财(34844)
- 大学(34212)
- 学学(32032)
- 技术(27776)
- 农业(27299)
- 融(19202)
- 金融(19202)
- 业经(18803)
- 财经(18286)
- 经济研究(17991)
- 图书(16193)
- 经(15492)
- 问题(14410)
- 科技(14322)
- 技术经济(14151)
- 理论(14147)
- 业(14077)
- 统计(13591)
- 实践(13165)
- 践(13165)
- 版(12840)
共检索到402561条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
赵洪 王芳
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
[期刊] 情报理论与实践
[作者]
王宇琪 周庆山
[目的/意义]互联网开源信息具有海量、多源异构等特点,如何从中及时发现有价值的信息,并对信息加以情报利用一直是情报研究和实践应用的重点领域之一。本文提出一套开源的学术会议领域信息抽取框架,解决信息抽取语义理解和关联融合的问题,并将其应用于情报研究中,为解决情报分析的智能应用提供工具和方法。[方法/过程]采集网络上新闻报道的内容,采用预训练语言模型方法挖掘学术会议事件信息,提出面向特定领域的信息抽取框架,实现会议名称及其举办时间、地点、出席人物、发言人物信息的抽取,并进行实际的情报利用研究案例分析。[结果/结论]相较于单一抽取实体的方法,抽取会议核心元素更具有情报关联性和准确性,可以更好地对开源热点事件发现和跟踪监测、目标人物轨迹动向分析等研究提供方法,为情报分析应用和情报研判奠定基础。
[期刊] 情报学报
[作者]
吴俊 程垚 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
[期刊] 情报理论与实践
[作者]
蒋婷 孙建军
[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
[期刊] 图书情报工作
[作者]
魏巍 郑杜
[目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(AdverseDrugReaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取
[期刊] 情报理论与实践
[作者]
高庆宁 吴鹏 张晶晶
[目的]网页所表达的主要信息通常隐藏在大量无关的结构和内容中,使用户不能迅速获取主题内容,限制了网页资源的可用性,使用信息抽取技术解决了这一问题。[方法]基于文档对象模型(DOM)的信息抽取技术能够简单准确地从网页中提取所需内容,但依靠网页本身结构;基于行块分布算法的技术摆脱网页结构的限制,克服限定数据源的缺点,但需要人工干预,文章结合DOM技术和行块分布算法以及正则表达式,实现网页信息采集与信息抽取。[结论]能够自动准确提取网页信息。[局限]对英文以及结构复杂的网页抽取效果不是很理想,抽取内容仅限于文字。
关键词:
文档对象模型 算法 网页 信息抽取
[期刊] 图书情报工作
[作者]
俞琰 鞠鹏 尚明杰
[目的/意义]针对目前专利关键词抽取算法评价中主要采用抽取的关键词与专家人工标注关键词进行匹配存在的问题,提出一种基于信息增益与相似度的专利关键词抽取算法评价模型。[方法/过程]提出的评价模型从内部和外部两个层面评估专利关键词抽取算法的准确性。其中,内部评价模型度量待评价算法抽取的每个关键词的信息增益,以评估被抽取的关键词的新颖性与创造性;外部评价模型使用待评价算法抽取的关键词集表示专利,计算相关专利的相似度,衡量算法抽取的关键词描述专利主题的有效性。[结果/结论]通过评价模型有效性验证实验与评价模型应用实证研究,结果表明提出的基于信息增益与相似度的评价模型具有可行性与有效性。
关键词:
专利 关键词抽取 评价 信息增益 相似度
[期刊] 情报学报
[作者]
李志义 王冕 赵鹏武
自媒体环境下对海量评价信息进行情感分析与监控已越发重要,它不仅可推动观点挖掘的深入研究,而且可帮助企业探索用户需求以产生巨大的商业价值。本文在条件随机场模型(CRFs)的基础上,结合句法特性,通过实验选取合适的句法特性组合,寻找评价特征提取的路径;其次,构建了手机领域的评论语料库。然后,利用句法分析器把评论短句分解成相应的句法树,分析评价特征词和评价词之间存在的依存关系以及观点信息的完整性结构,利用算法将〈评价特征,评价词〉对从评论语料中抽取出来。提出了基于依存语法的〈评价特征,评价词〉对抽取方法,利用A
[期刊] 图书情报工作
[作者]
陈德鑫 占袁圆 杨兵 谢亚霓
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。
[期刊] 图书情报工作
[作者]
韩普 顾亮
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
[期刊] 情报科学
[作者]
李枫林 柯佳
【目的/意义】从大量非结构化文本中抽取出结构化的实体及其关系,是优化搜索引擎、建立知识图谱、开发智能问答系统的基础工作。【方法/过程】介绍了深度学习框架下不同神经网络模型实现实体关系抽取的方法,比较了各种模型的优劣势,结合远程监督和注意力机制进一步提高关系抽取性能,最后指出了深度学习模型的不足及未来发展方向。【结果/结论】实验发现,卷积神经网络擅长捕获句子局部关键信息,循环神经网络擅长捕获句子的上下文信息,能反映句子多个实体之间的高阶关系,递归神经网络适合短文本的关系抽取。如果模型能结合自然语言的先验知识
关键词:
深度学习 神经网络 实体关系抽取 词向量
[期刊] 情报学报
[作者]
李志义 黄子风 许晓绵
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。
[期刊] 情报理论与实践
[作者]
胡潜 吴茜 陈漳尧 朱清文
[目的/意义] 围绕图书功用分类问题,提出开展图书功用自动化分类研究,并融合预训练和深度学习方法进行实现方案设计,为图书功用属性揭示和信息组织提供参考。[方法/过程] 基于功用视角进行图书分类体系调研与数据验证,构建图书功用分类体系框架。在此基础上,融合BERT预训练模型和BiLSTM模型构建图书功用分类模型,并基于大规模数据集进行实验验证。[结果/结论] 实验结果显示,模型的准确率达到0.89以上,召回率达到0.87以上,总体效果相对较好,能够较为准确地实现图书功用特征的提取。
[期刊] 求索
[作者]
龙红明 伍海琳 彭蝶飞
基于现有研究理论对影响个人创新行为的因素进行分类,并基于分类提出了个人创新能力提升计划训练模型——BTB模型,制订了具体的训练计划及策略。BTB意味着人们要勇于改变、突破现有思维定势,并且主动培养个体的新思维、新习惯和新行为,制订计划,并为之付出切实的行动和努力。
关键词:
个人创新 能力提升 训练模型
[期刊] 图书情报工作
[作者]
胡昊天 邓三鸿 王东波 沈思 沈健威
[目的 /意义]对预训练语言模型在情报学与情报工作中的相关研究进行系统性的梳理与分析,为后续预训练模型与情报研究的融合提供借鉴。[方法 /过程]首先,简述预训练模型的基本原理与发展历程,汇总情报研究中应用较为广泛的预训练模型。其次,宏观上分析预训练模型在国内外情报研究中的热点方向,微观上从情报组织、情报检索、情报挖掘等方面调研预训练模型相关研究成果,并细致分析归纳预训练模型的应用方式、改进策略与性能表现。最后,从预训练模型的语料、训练、评价、应用等方面总结当前预训练模型在情报学科中面临的机遇与挑战,展望未来发展。[结果 /结论 ]当前BERT及其改型在情报处理中应用最广、表现最优。结合神经网络与微调的范式被用于各研究场景,尤其是领域信息抽取与文本分类任务。继续预训练、外部知识增强、架构优化等策略可进一步提升性能。如何平衡训练语料的规模与质量、提升模型易用性与安全性、高准度与多维度评价模型真实能力、加速学科知识挖掘工具落地应是未来考虑的关键问题。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除