- 年份
- 2024(10893)
- 2023(15619)
- 2022(13640)
- 2021(12810)
- 2020(10635)
- 2019(24541)
- 2018(24305)
- 2017(46677)
- 2016(25440)
- 2015(28485)
- 2014(28583)
- 2013(27763)
- 2012(25250)
- 2011(22646)
- 2010(22200)
- 2009(20293)
- 2008(19338)
- 2007(16494)
- 2006(14233)
- 2005(12047)
- 学科
- 济(99511)
- 经济(99395)
- 管理(72209)
- 业(65966)
- 企(55354)
- 企业(55354)
- 方法(47740)
- 数学(41652)
- 数学方法(41072)
- 农(25701)
- 中国(25656)
- 财(24817)
- 学(23181)
- 地方(22116)
- 业经(21218)
- 制(18017)
- 理论(17853)
- 农业(17136)
- 和(16470)
- 贸(16168)
- 贸易(16159)
- 务(15709)
- 财务(15629)
- 易(15596)
- 财务管理(15596)
- 环境(15538)
- 技术(15378)
- 企业财务(14779)
- 银(14288)
- 银行(14239)
- 机构
- 大学(351763)
- 学院(348967)
- 管理(139595)
- 济(133691)
- 经济(130671)
- 理学(122191)
- 理学院(120769)
- 管理学(118352)
- 管理学院(117727)
- 研究(114466)
- 中国(83629)
- 京(74178)
- 科学(73413)
- 财(60259)
- 农(56452)
- 所(56450)
- 业大(53895)
- 中心(52719)
- 研究所(52008)
- 江(50095)
- 财经(49208)
- 范(47919)
- 师范(47423)
- 北京(46067)
- 经(44956)
- 农业(44218)
- 院(42563)
- 州(40618)
- 经济学(39636)
- 师范大学(38435)
- 基金
- 项目(250306)
- 科学(197271)
- 研究(181991)
- 基金(181541)
- 家(158806)
- 国家(157506)
- 科学基金(135653)
- 社会(113855)
- 社会科(107763)
- 社会科学(107734)
- 省(98001)
- 基金项目(96723)
- 自然(89456)
- 自然科(87383)
- 自然科学(87359)
- 自然科学基金(85739)
- 教育(84702)
- 划(82998)
- 编号(74616)
- 资助(74148)
- 成果(59667)
- 重点(55987)
- 部(54907)
- 发(52817)
- 创(51938)
- 课题(51204)
- 创新(48399)
- 科研(48201)
- 教育部(46996)
- 大学(46703)
- 期刊
- 济(139389)
- 经济(139389)
- 研究(98089)
- 中国(64063)
- 学报(58774)
- 科学(52516)
- 农(49965)
- 管理(49504)
- 财(45234)
- 大学(44730)
- 教育(42597)
- 学学(41502)
- 农业(34761)
- 技术(31286)
- 融(25601)
- 金融(25601)
- 业经(23737)
- 财经(23040)
- 经济研究(22076)
- 图书(21679)
- 经(19656)
- 问题(17996)
- 科技(17276)
- 业(17237)
- 版(17089)
- 理论(16443)
- 资源(15910)
- 技术经济(15903)
- 统计(15658)
- 商业(15225)
共检索到494956条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报学报
[作者]
蒋婷 孙建军
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学
关键词:
本体构建 等级关系抽取 术语抽取
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报理论与实践
[作者]
王昊 苏新宁
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
[期刊] 情报理论与实践
[作者]
丁君军 郑彦宁 化柏林
学术文献作为科研成果的结晶,蕴含着丰富的知识,属性抽取作为知识抽取的一种应用,是把不同学术文献中对于某一学术概念的属性描述集中起来,用来构建属性描述知识库。本文通过人工构建规则的方法,形成了属性抽取的九大类描述规则,并对属性描述进行了数量关系和情感信息方面的分析,然后对学术概念属性抽取系统进行设计和实现,并对《情报学报》2007年和2008年的文章进行抽取实验,对系统抽取的结果和人工标记的结果进行了测评,并进行了实验结果的分析。
关键词:
知识抽取 规则构建 学术定义 概念
[期刊] 图书情报工作
[作者]
蒋婷 孙建军
[目的 /意义]概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法 /过程]首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果...
关键词:
本体构建 非等级关系抽取 关系抽取
[期刊] 情报理论与实践
[作者]
郑梦悦 秦春秀 马续补
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。
[期刊] 情报理论与实践
[作者]
王思丽 祝忠明 刘巍 杨恒
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。
[期刊] 现代情报
[作者]
朱光 杨嘉韵 吴先华 丰米宁
通过对本体、形式概念分析等理论研究进行分析,提出一种以"文档——术语"为核心,形式概念分析为技术手段的气象灾害领域的本体构建方法。针对气象灾害领域知识库和主题词表的缺失,以中英文学术论文为数据源,对气象灾害领域术语的层次关系抽取和分析进行了详细阐述和论证,具体包括领域术语的抽取和筛选,文档术语矩阵的建立,主题概念格的生成,术语层次关系分析;本体OWL描述和可视化展示等过程,最后利用GATE Developer对构建本体的有效性进行了验证。
[期刊] 情报理论与实践
[作者]
张思凤 梁梦丽 曹高辉
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词
关键词:
科技文献 引文 主题抽取 关键词
[期刊] 中国图书馆学报
[作者]
颜端武 成晓 甘利人
文本相似性测度被广泛用于计算用户提问与文档资源相关程度以及基于内容相似资源推荐。OCVSM是一种基于领域本体和概念向量相似性测度的方法。该方法将军用飞机领域知识本体OntoAvion的概念集作为词汇抽取特征项,根据本体中概念间的关系确定特征项的相似度,最后利用余弦算法计算文本向量相似度。实验证明,该方法与基于语言学词典的相似性测度方法相比,更接近用户对文本相似性的判断。表10。图5。参考文献10。
关键词:
相似性测度 领域本体 概念向量 文本处理
[期刊] 情报理论与实践
[作者]
蒋婷 孙建军
[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
[期刊] 图书馆理论与实践
[作者]
阳广元
以国内2002年1月至2016年5月间发表的与基于本体的信息抽取有关的期刊文献为分析对象,运用内容分析法从领域本体的构建及基于本体的信息抽取方法、信息抽取模型、信息抽取算法、信息抽取系统、信息抽取的应用领域等6个方面对国内该领域的研究现状与热点进行分析,认为目前国内该研究领域具有研究内容从理论走向实践、研究主体多样性、尚未形成核心作者和核心团队等特点,指出本体构建的自动化及基于本体的信息抽取的评估机制、信息抽取的实践应用将成为未来的发展趋势。
[期刊] 图书情报工作
[作者]
韩普 顾亮
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节。针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性。[方法/过程]首.先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型。[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除