- 年份
- 2024(11359)
- 2023(16454)
- 2022(14471)
- 2021(13593)
- 2020(11653)
- 2019(27070)
- 2018(27206)
- 2017(52305)
- 2016(28804)
- 2015(32912)
- 2014(33351)
- 2013(32607)
- 2012(30122)
- 2011(27013)
- 2010(26878)
- 2009(24828)
- 2008(24485)
- 2007(21819)
- 2006(18685)
- 2005(16258)
- 学科
- 济(113206)
- 经济(113072)
- 管理(83436)
- 业(78486)
- 企(65040)
- 企业(65040)
- 方法(56322)
- 数学(49187)
- 数学方法(48536)
- 农(30874)
- 财(30583)
- 中国(28341)
- 学(26343)
- 业经(24592)
- 地方(22425)
- 制(21190)
- 贸(20600)
- 贸易(20595)
- 农业(20299)
- 理论(20112)
- 务(20075)
- 财务(19984)
- 易(19954)
- 财务管理(19936)
- 企业财务(18870)
- 和(18298)
- 技术(17422)
- 环境(17085)
- 银(17019)
- 银行(16958)
- 机构
- 大学(411885)
- 学院(410843)
- 管理(162530)
- 济(157500)
- 经济(153832)
- 理学(140793)
- 理学院(139234)
- 管理学(136536)
- 管理学院(135802)
- 研究(133830)
- 中国(98949)
- 京(87721)
- 科学(86726)
- 财(72094)
- 农(71664)
- 所(68345)
- 业大(65451)
- 研究所(62599)
- 中心(62447)
- 江(60331)
- 财经(58245)
- 农业(56655)
- 北京(54987)
- 范(54250)
- 师范(53654)
- 经(52780)
- 州(49124)
- 院(48599)
- 经济学(46364)
- 技术(45756)
- 基金
- 项目(283131)
- 科学(220303)
- 研究(204014)
- 基金(202846)
- 家(177531)
- 国家(176060)
- 科学基金(150236)
- 社会(124733)
- 社会科(117987)
- 社会科学(117953)
- 省(112263)
- 基金项目(108049)
- 自然(100082)
- 自然科(97724)
- 自然科学(97695)
- 自然科学基金(95913)
- 教育(94981)
- 划(94341)
- 编号(85030)
- 资助(84721)
- 成果(68793)
- 重点(63195)
- 部(61776)
- 发(59427)
- 课题(58310)
- 创(58030)
- 科研(54773)
- 创新(54159)
- 大学(52611)
- 教育部(52296)
- 期刊
- 济(166698)
- 经济(166698)
- 研究(113280)
- 中国(74659)
- 学报(70225)
- 农(63992)
- 科学(61166)
- 管理(56299)
- 财(56276)
- 大学(51863)
- 学学(48597)
- 教育(46128)
- 农业(44147)
- 技术(37130)
- 融(31253)
- 金融(31253)
- 业经(28691)
- 财经(27517)
- 经济研究(26469)
- 图书(24969)
- 经(23373)
- 业(22925)
- 问题(22013)
- 版(20302)
- 理论(20125)
- 技术经济(19812)
- 统计(19596)
- 科技(19509)
- 实践(18611)
- 践(18611)
共检索到586543条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书馆理论与实践
[作者]
阳广元
以国内2002年1月至2016年5月间发表的与基于本体的信息抽取有关的期刊文献为分析对象,运用内容分析法从领域本体的构建及基于本体的信息抽取方法、信息抽取模型、信息抽取算法、信息抽取系统、信息抽取的应用领域等6个方面对国内该领域的研究现状与热点进行分析,认为目前国内该研究领域具有研究内容从理论走向实践、研究主体多样性、尚未形成核心作者和核心团队等特点,指出本体构建的自动化及基于本体的信息抽取的评估机制、信息抽取的实践应用将成为未来的发展趋势。
[期刊] 情报理论与实践
[作者]
洪娜 张智雄 刘建华
本文通过对国内外OBIE理论和OBIE系统的分析,比较了OBIE技术与传统信息抽取技术的主要区别,归纳了4种主要的技术方法,分别是基于实例的OBIE,基于规则的OBIE以及基于机器学习的OBIE和Ontology驱动的OBIE,并用案例对各种技术方法做了阐释,最后总结了OBIE研究和系统开发中存在的难点问题。
关键词:
本体 信息抽取 信息技术
[期刊] 图书馆工作与研究
[作者]
阳广元
本文以CNKI收录的与基于本体的语义检索相关的期刊文献为对象,运用内容分析法对研究主题进行梳理分析。国内基于本体的语义检索研究主要集中在本体的理论、基于本体的语义检索模型、基于本体的语义检索算法、基于本体的语义检索策略和基于本体的语义检索系统5个方面,且研究具有以下特点:研究内容逐步从理论走向实践,研究主体呈现多样性。基于以上分析,笔者指出未来该领域研究趋势,即应加强基于本体的个性化语义检索服务、基于本体的语义检索系统的评估机制和基于本体的语义检索的实践运用研究。
关键词:
语义检索 本体 研究现状 研究热点
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 图书情报工作
[作者]
蒋婷 孙建军
[目的 /意义]概念非等级关系抽取是本体构建的必要步骤,学术文献作为一种重要的学术资源类型,本文主要利用其结构特点来进行本体概念非等级关系的抽取。[方法 /过程]首先,在本体概念抽取的基础上,对文献中概念的类型进行分类,以便于后期关系动词搭配的概念类型来排除不符合条件的三元组;其次,确定学术文献中的关系类型,并采用C-value方法抽取表示关系的动词,进行本体关系的表示;再次,评价概念对的关联性,利用互信息法对概念对进行排序并去除非相关概念对,实验表明该方法非常有效;最后评价概念对与关系动词的关联,分析影响三元组关联的因素,再采用实验确定模型挖掘三元组,实验比较现有的关联规则挖掘的方法。[结果...
关键词:
本体构建 非等级关系抽取 关系抽取
[期刊] 情报学报
[作者]
蒋婷 孙建军
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学
关键词:
本体构建 等级关系抽取 术语抽取
[期刊] 图书情报工作
[作者]
陈俊彬 曹树金
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
[期刊] 图书情报工作
[作者]
王东波 胡昊天 周鑫 朱丹浩
[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
[期刊] 图书情报工作
[作者]
董旻 方曙
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。
[期刊] 情报理论与实践
[作者]
徐进 朱孝文
[目的/意义]项目记忆是项目进行过程中产生和应用的项目知识和信息的集合。传统获取、构建项目记忆的方式依赖人工处理,需要投入大量的人力和时间。如何表示项目记忆,以及如何利用非结构化项目文档这类重要的项目数据源来构建项目记忆,仍然是项目知识管理中的关键挑战。[方法/过程]收集了京沪高铁项目的相关文档1078篇,利用依存句法和规则抽取方法得到项目记忆短语和基础信息,利用LDA模型提取项目文档的主题,并对文档集聚类和描述,达到从项目文档中自动提取项目记忆要素、构建、重现项目记忆的目的。[结果/结论]通过实验和比较分析,验证了所提出框架方法的合理性和有效性。所设计的方法流程一定程度上可以为项目组织、团队及成员进行更加高效的项目知识管理与共享提供支持。
[期刊] 情报理论与实践
[作者]
王昊 苏新宁
本文重点阐述了中文通用本体概念实例的机器抽取过程,建立了基于模式匹配的通用本体概念识别模型,以此作为领域本体自动构建的基础。此后探讨了该模型在情报学各研究领域中的应用前景,并通过实验检验模型在实际应用中的识别效果。
[期刊] 图书馆建设
[作者]
白华
针对用户标注的弱点,在标签的基础上构建本体框架并赋予标签丰富的语义,有助于进一步改善知识组织系统的性能。在大量标签数据的支持下,提取知识框架是一种建立本体框架的有效方法,提取方法主要采用特征或属性概括法,即针对一类标签集合的共同特征抽取它们的上位概念,并根据这些上位概念的关系建立知识框架。对基于两种系统的语义分析而构建的可以整合标签和概念本体的兼容本体进行分析可知,它吸取了用户标注的灵活、多元、表达性强大的特征,提高了知识组织系统的组织能力和标引功能;同时,也改进了用户标注系统的语义能力,使之具有丰富的结构和语义表达功能。
关键词:
用户标注 本体框架抽取 知识组织系统
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除