- 年份
- 2024(7786)
- 2023(11245)
- 2022(10002)
- 2021(9498)
- 2020(7990)
- 2019(18447)
- 2018(18510)
- 2017(35382)
- 2016(19051)
- 2015(21641)
- 2014(21432)
- 2013(21120)
- 2012(19154)
- 2011(17100)
- 2010(16915)
- 2009(15217)
- 2008(14846)
- 2007(12877)
- 2006(11276)
- 2005(9757)
- 学科
- 济(74920)
- 经济(74841)
- 管理(56773)
- 业(53672)
- 企(45546)
- 企业(45546)
- 方法(37306)
- 数学(31987)
- 数学方法(31469)
- 财(19525)
- 中国(19190)
- 农(18893)
- 学(17897)
- 业经(17302)
- 地方(15101)
- 理论(14217)
- 技术(13864)
- 和(13346)
- 务(13209)
- 财务(13142)
- 财务管理(13117)
- 农业(13106)
- 企业财务(12491)
- 制(12308)
- 贸(12120)
- 贸易(12112)
- 易(11745)
- 环境(11583)
- 银(10507)
- 银行(10469)
- 机构
- 大学(270631)
- 学院(266570)
- 管理(110959)
- 济(99597)
- 经济(97236)
- 理学(96472)
- 理学院(95423)
- 管理学(93578)
- 管理学院(93080)
- 研究(86044)
- 中国(63235)
- 京(58528)
- 科学(56426)
- 财(45079)
- 所(42612)
- 农(41590)
- 业大(41507)
- 中心(39784)
- 研究所(39063)
- 江(37541)
- 北京(37091)
- 财经(36627)
- 范(35341)
- 师范(35031)
- 经(33301)
- 农业(32510)
- 院(31752)
- 州(31372)
- 技术(29263)
- 经济学(28385)
- 基金
- 项目(189282)
- 科学(148411)
- 研究(137931)
- 基金(136722)
- 家(119185)
- 国家(118214)
- 科学基金(102062)
- 社会(84148)
- 社会科(79765)
- 社会科学(79743)
- 省(74029)
- 基金项目(73134)
- 自然(68089)
- 自然科(66518)
- 自然科学(66503)
- 自然科学基金(65295)
- 教育(62722)
- 划(62507)
- 编号(56883)
- 资助(56782)
- 成果(46032)
- 重点(41624)
- 部(40892)
- 发(39367)
- 创(39305)
- 课题(38181)
- 创新(36606)
- 科研(36401)
- 项目编号(36111)
- 大学(35206)
- 期刊
- 济(104123)
- 经济(104123)
- 研究(74855)
- 中国(49157)
- 学报(44610)
- 管理(40149)
- 科学(39534)
- 农(36334)
- 财(33733)
- 大学(33265)
- 学学(30529)
- 教育(30240)
- 农业(25926)
- 技术(24266)
- 图书(21874)
- 融(18734)
- 金融(18734)
- 业经(17052)
- 财经(16655)
- 经济研究(16069)
- 科技(15654)
- 情报(15267)
- 理论(14819)
- 书馆(14642)
- 图书馆(14642)
- 经(13997)
- 实践(13992)
- 践(13992)
- 技术经济(13470)
- 问题(13297)
共检索到382377条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
冷伏海 白如江 祝清松
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。
关键词:
科技文献 信息抽取 语义标注 正则表达
[期刊] 情报理论与实践
[作者]
张思凤 梁梦丽 曹高辉
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词
关键词:
科技文献 引文 主题抽取 关键词
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
[期刊] 情报理论与实践
[作者]
郑梦悦 秦春秀 马续补
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。
[期刊] 图书情报工作
[作者]
韩普 顾亮
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
[期刊] 情报理论与实践
[作者]
谢秀芳 张晓林
[目的/意义]为了加强针对科技路线图的情报研究,探索从科技路线图报告中自动抽取核心信息的方法。[方法/过程]通过分析21个国家或组织发布的166份科技路线图的内容组织和表达特征,总结科技路线图中包含的核心信息,提出一种新的信息抽取思路"抽取—同步—分类",实现对科技路线图中核心内容的抽取。[结果/结论]以45篇科技路线图报告为测试案例进行方法验证,最终获取26736条有效数据信息,按时间序列可视化呈现,能够基本反映科技路线图的主要内容,表明该方法设计可行,能够快速获取科技路线图中的核心信息,提高针对科技路
[期刊] 图书情报工作
[作者]
季培培 鄢小燕 岑咏华
领域中文术语识别与抽取是领域中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。在对领域术语的内涵和特征的阐述基础上,重点对领域中文术语识别与抽取的研究现状、主要的方法以及典型的应用进行综述,最后指出其未来的发展趋势。
关键词:
术语抽取 术语识别 领域中文信息处理
[期刊] 情报理论与实践
[作者]
徐勇 陈建国 胡凌云 张林 周善英
文章从内涵和外延两个角度研究了科技文献相似性度量问题,首先从科技文献内涵的角度在文献特征词字符匹配基础上采用泛化方法将待推荐文献关键词与当前文献关键词及其父/子关键词进行匹配;然后从外延角度结合科技文献项目的特点将文献共引因素引入文献相似性度量;最后根据关键词泛化相似度和共引关联度定义混合相似度(HS)对候选科技文献进行排序推荐,理论分析和实验数据表明,该算法能够在一定程度上避免遗漏"特征词字符不同,但语义相似"科技文献的问题。
关键词:
科技文献 语义关系 相似性度量 算法
[期刊] 情报学报
[作者]
王君泽 宋小炯 杜洪涛
在共指消解领域,目前已经有大量研究工作围绕实体共指问题展开,而有关事件共指方面的研究则相对较少。由于事件表述的灵活性,共指事件识别的研究重点之一在于如何构建事件表述相似度的计算模型。而在对同一事件的相似表述中,不仅包含词级别的同义表述,还包含语句级别的同义表述。针对该状况,本文基于新闻报道语料的特点,一方面针对词级别同义表述模式的抽取,设计了同义词知识库的自动构建策略,并考虑了缩略语、同位语等情况的处理;另一方面在词级别同义表述模式抽取的基础上,设计了语句级别同义表述实例的识别策略,进而可以抽取同义表述模式并剔除模式中的冗余成分。通过在实际数据集合上的实验,表明了本文策略的有效性。基于抽取到的词级别和语句级别的同义表述模式,可以有效提升共指事件识别的效果;本文工作也可以视为对共指事件识别现有策略的有益补充。
[期刊] 中国图书馆学报
[作者]
张卫 王昊 邓三鸿 张宝隆
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。
[期刊] 情报理论与实践
[作者]
石义金 王忠义 沈雪莹 郑鑫
为提高科技文献中各类型知识元抽取的效率,提出一种基于序列模式的科技文献知识元抽取模型。该方法首先在各类型知识元描述规则的基础上,对知识元语句进行依存句法分析,生成融入语义的知识元序列模式;其次,基于知识元序列模式,通过模式匹配算法实现各类型知识元的抽取;最后,基于Prefixspan算法,从抽取的知识元中挖掘出新的描述知识元的序列模式,以实现知识元序列模式的不断动态更新与扩展,进而依据知识元序列模式提高知识元的抽取效率。基于序列模式的科技文献中知识元的抽取方法,克服了基于规则匹配的语义局限,具有学科延展性,提高了知识元抽取的效率。
[期刊] 图书馆建设
[作者]
赵丹宁 牟冬梅 斯琴
以研究型科技文献摘要为对象,结合内容分析、语义分析和语法分析构建研究型科技文献的实验数据自动抽取模型,并以药物代谢动力学领域文献摘要为自动收取对象,根据得到的实验数据抽取结果验证该自动抽取模型的应用性。结果发现,该模型能够有效地对研究型科技文献实验数据进行自动抽取,在帮助科研人员提高对科技文献的信息获取速度的同时,也为图书情报领域在未来更好地为其他领域科研人员提供知识服务奠定了基础。
关键词:
科技文献 实验数据 自动识别 信息抽取
[期刊] 运筹与管理
[作者]
柳森 赵希男
针对现有个体优势特征识别与评析方法的不足,考虑指标值以混合信息形式给出,采用理想点效用评价模式,分别针对单层和多层次结构指标体系,围绕个体优势特征识别、个体代理评析、民主代理评析功能,依据竞优思想,根据直觉模糊数的运算规则以及不同类型信息与直觉模糊数的转化关系,提出基于直觉模糊数的面向混合信息值的个体优势特征识别与评析方法,并用算例验证了方法的可行性和实用性。为个体优势特征识别、个体竞优决策及相关组织的竞优管理提供方法与技术支持。
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除