- 年份
- 2024(7277)
- 2023(10496)
- 2022(9376)
- 2021(8832)
- 2020(7332)
- 2019(16994)
- 2018(17002)
- 2017(33033)
- 2016(18012)
- 2015(20357)
- 2014(20404)
- 2013(20229)
- 2012(18338)
- 2011(16480)
- 2010(16279)
- 2009(14833)
- 2008(14279)
- 2007(12283)
- 2006(10639)
- 2005(9079)
- 学科
- 济(75129)
- 经济(75054)
- 管理(51354)
- 业(47249)
- 企(39994)
- 企业(39994)
- 方法(36486)
- 数学(31657)
- 数学方法(31198)
- 地方(18315)
- 农(17628)
- 中国(17487)
- 学(17442)
- 财(16272)
- 业经(15403)
- 理论(12512)
- 和(12391)
- 农业(12047)
- 贸(12023)
- 贸易(12018)
- 环境(11921)
- 易(11555)
- 技术(11186)
- 制(10884)
- 地方经济(10554)
- 务(10548)
- 财务(10487)
- 财务管理(10468)
- 划(10168)
- 企业财务(9924)
- 机构
- 大学(257531)
- 学院(254873)
- 管理(104757)
- 济(95949)
- 经济(93694)
- 理学(92034)
- 理学院(90939)
- 管理学(89126)
- 管理学院(88689)
- 研究(83379)
- 中国(59679)
- 京(55038)
- 科学(54927)
- 所(41798)
- 财(41667)
- 业大(39595)
- 农(39315)
- 研究所(38587)
- 中心(37215)
- 江(35306)
- 范(35018)
- 师范(34743)
- 北京(34696)
- 财经(34606)
- 经(31420)
- 农业(30940)
- 院(30905)
- 州(29456)
- 师范大学(28346)
- 经济学(27552)
- 基金
- 项目(183154)
- 科学(144120)
- 基金(132858)
- 研究(132240)
- 家(116006)
- 国家(115070)
- 科学基金(99067)
- 社会(81970)
- 社会科(77605)
- 社会科学(77583)
- 省(71494)
- 基金项目(71314)
- 自然(66239)
- 自然科(64669)
- 自然科学(64656)
- 自然科学基金(63468)
- 划(60555)
- 教育(60480)
- 资助(55105)
- 编号(54114)
- 成果(43210)
- 重点(40714)
- 部(39761)
- 发(38669)
- 创(37616)
- 课题(36955)
- 科研(35239)
- 创新(35007)
- 教育部(33748)
- 大学(33646)
- 期刊
- 济(100481)
- 经济(100481)
- 研究(71684)
- 中国(43381)
- 学报(41815)
- 科学(38690)
- 管理(36574)
- 农(34362)
- 大学(31117)
- 学学(29182)
- 财(29065)
- 教育(28633)
- 农业(24665)
- 技术(21983)
- 融(16878)
- 金融(16878)
- 业经(16684)
- 经济研究(15617)
- 财经(15556)
- 图书(15420)
- 科技(13234)
- 经(13085)
- 理论(13060)
- 问题(12852)
- 资源(12692)
- 技术经济(12527)
- 实践(12278)
- 践(12278)
- 统计(12039)
- 业(12006)
共检索到354562条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
朱惠 王昊 苏新宁 邓三鸿
本体是知识组织的有效方式,也是构建语义网的重要环节,而概念非分类关系又是本体的重要组成部分。由于术语是概念的外在表达,因此本文在深入分析当前国内外术语非分类关系抽取研究的基础上,引入共现分析、结构分析、模板构建、逻辑推理等方法和技术构建了面向汉语领域非结构化文本的术语非分类关系抽取模型,分别从内容和结构两个不同的角度抽取术语非分类关系。论文提出了模型的主要运行流程以及各功能模块的主要组成部件,对主要组成部件的具体实现进行了探讨,并对相关方法的局限性进行了论述。本文的研究为术语非分类关系抽取提供了新的思路,丰富了知识发现方法,同时也能为实现可行有效的知识组织提供参考。
[期刊] 情报理论与实践
[作者]
邓擘 郑彦宁 樊孝忠
事件抽取是信息抽取的基本任务之一,而对文本中的事件准确定位和分类是保证事件抽取质量的前提。使用向量空间模型来表示事件描述片段的特征,并分类计算特征词的重要度,最后对文本中的事件片段进行定位和分类。试验结果表明该方法能够对文本中的事件片段进行较为准确的定位、分类,因此对于事件抽取任务的前期处理具有重要价值。
关键词:
信息抽取 事件 特征词 文本片段
[期刊] 情报理论与实践
[作者]
赵文娟 刘忠宝
文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介绍,对流程中使用的技术和方法进行了描述。最后通过"空难"框架下的"德国之翼坠机事件"为例对方法的有效性进行了验证。
关键词:
事件抽取 汉语框架 信息抽取 文本聚类
[期刊] 情报理论与实践
[作者]
杜思奇 李红莲 吕学强
[目的/意义]面向电子商务领域的在线评论,通过识别产品特征和评价词之间是否存在修饰关系,抽取出在线评论中的情感标签,从而帮助网购用户迅速了解某一产品的性能。[方法/过程]引入汉语组块分析对评论文本进行初始化处理,对名词性信息以及形容词性信息进行抽取。通过最大熵对初始化集合进行过滤,从而获得最终的情感标签集合。[结果/结论]该方法对评论文本的适应性较好,可以有效抽取出情感标签。[局限]需要对语料进行初始化抽取,经过过滤后才能获得最终的情感标签集合。
关键词:
情感标签 汉语组块分析 最大熵模型
[期刊] 情报学报
[作者]
薛翠芳 郭炳炎
本文从自动文摘的需求出发 ,探讨特征词自动抽取的方法和技术 ,设计并实现了两种不同的特征词自动抽取算法。这些方法对文本的自动分类和全文检索也有一定的借鉴意义。
关键词:
特征词 加权函数 自动文摘
[期刊] 情报学报
[作者]
蒋婷 孙建军
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学
关键词:
本体构建 等级关系抽取 术语抽取
[期刊] 图书情报工作
[作者]
沈思 苏新宁 谢靖 王东波
基于清华汉语树库,利用条件随机场,构建时间表达式知识抽取模型。为了确保模型的性能,统计分析时间表达式的内部和外部特征,并把确定的特征应用到模型的构建中。在语言特征模板基础上,在摘要语料上抽取验证表明,时间表达式抽取模型的调和平均值最高达到80.83%。
[期刊] 情报理论与实践
[作者]
蒋婷 孙建军
[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
[期刊] 图书情报工作
[作者]
季培培 鄢小燕 岑咏华
领域中文术语识别与抽取是领域中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。在对领域术语的内涵和特征的阐述基础上,重点对领域中文术语识别与抽取的研究现状、主要的方法以及典型的应用进行综述,最后指出其未来的发展趋势。
关键词:
术语抽取 术语识别 领域中文信息处理
[期刊] 情报理论与实践
[作者]
陈果 彭家彬 肖璐
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]本文提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报学报
[作者]
程为 郑德俊 朱梦蝶 丛天时 王燕红
知识元逻辑关系抽取关注上下文的句法结构与语法特征,通过上下文功能语义依赖定义触发词规则实现上下文范围内的关系抽取。为摆脱上下文的结构限制,本文提出一种知识元逻辑关系抽取的新方法。首先,面向领域文献资料,通过知识元抽取构建知识元集合;其次,基于领域知识特征构建知识元属性描述框架,对知识元进行全方位、细粒度的统一描述,基于知识元属性抽取构建知识元属性集合;最后,结合实际需求定义逻辑关系类型,采用逻辑关联实例分析与属性对比关联分析,以属性值的共现、包含、相关等基本关系为线索,通过特征分析与归纳总结构建逻辑关系规则库,通过规则匹配实现知识元逻辑关系抽取。以南海维权证据知识元为例,选取部分不同文本来源的证据,定义了证据间逻辑关系类型及其抽取规则,在证据知识元及其属性抽取的基础上,基于规则匹配实现南海维权证据间并列、承接、反驳与补强4种逻辑关系的抽取,构建了南海维权证据逻辑关联图谱。实证研究验证了本文方法的可行性,能够为知识元逻辑关系抽取的相关研究提供可参考的新思路。
[期刊] 清华大学学报(自然科学版)
[作者]
胡明昊 王芳 徐先涛 罗威 刘晓鹏 罗准辰 谭玉珊
互联网开源渠道蕴含大量国防科技信息资源,是获取高价值军事情报的重要数据来源。国防科技领域开放信息抽取(open information extraction, OpenIE)旨在从海量信息资源中进行主谓宾-宾补(SAO-C)结构元组抽取,其对于国防科技领域本体归纳、知识图谱构建等具有重要意义。然而,相比其他领域的信息抽取,国防科技领域开放信息抽取面临元组重叠嵌套、实体跨度长且难识别、领域标注数据缺乏等问题。本文提出一种国防科技领域两阶段开放信息抽取方法,首先利用基于预训练语言模型的序列标注算法抽取谓语,然后引入多头注意力机制来学习预测要素边界。结合领域专家知识,利用基于实体边界的标注策略构建了国防科技领域标注数据集,并在该数据集上进行了实验,结果显示该方法的F1值在两阶段上比长短期记忆结合条件随机场(LSTM+CRF)方法分别提高了3.92%和16.67百分点。
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除