- 年份
- 2024(10524)
- 2023(15248)
- 2022(13340)
- 2021(12613)
- 2020(10547)
- 2019(24416)
- 2018(24166)
- 2017(46889)
- 2016(25351)
- 2015(28632)
- 2014(28465)
- 2013(27798)
- 2012(25138)
- 2011(22657)
- 2010(22427)
- 2009(20113)
- 2008(19272)
- 2007(16561)
- 2006(14368)
- 2005(12245)
- 学科
- 济(99885)
- 经济(99783)
- 管理(72378)
- 业(66520)
- 企(55949)
- 企业(55949)
- 方法(49887)
- 数学(44004)
- 数学方法(43241)
- 中国(25402)
- 农(25289)
- 财(23559)
- 学(22620)
- 地方(22309)
- 业经(21537)
- 理论(17694)
- 农业(17159)
- 和(16618)
- 贸(16554)
- 贸易(16545)
- 易(16039)
- 技术(15691)
- 制(15472)
- 环境(15396)
- 务(15348)
- 财务(15266)
- 财务管理(15232)
- 企业财务(14388)
- 划(13735)
- 银(12707)
- 机构
- 大学(351539)
- 学院(348601)
- 管理(142881)
- 济(132659)
- 经济(129653)
- 理学(124813)
- 理学院(123434)
- 管理学(120784)
- 管理学院(120119)
- 研究(109580)
- 中国(79775)
- 京(73876)
- 科学(70740)
- 财(58175)
- 所(53330)
- 业大(53180)
- 农(53172)
- 中心(50842)
- 江(49606)
- 研究所(49181)
- 财经(47986)
- 范(47515)
- 师范(47078)
- 北京(45914)
- 经(43798)
- 农业(41606)
- 州(41499)
- 院(40623)
- 经济学(39375)
- 技术(38051)
- 基金
- 项目(249823)
- 科学(196915)
- 研究(181978)
- 基金(181162)
- 家(157852)
- 国家(156591)
- 科学基金(135765)
- 社会(113281)
- 社会科(107414)
- 社会科学(107385)
- 省(98063)
- 基金项目(96350)
- 自然(89818)
- 自然科(87786)
- 自然科学(87767)
- 自然科学基金(86126)
- 教育(84689)
- 划(82454)
- 编号(75929)
- 资助(74729)
- 成果(60325)
- 重点(55589)
- 部(54296)
- 发(52840)
- 创(52053)
- 课题(50612)
- 创新(48469)
- 科研(48016)
- 项目编号(47192)
- 教育部(46739)
- 期刊
- 济(134610)
- 经济(134610)
- 研究(93420)
- 中国(60443)
- 学报(57164)
- 管理(49997)
- 科学(49839)
- 农(46562)
- 大学(43237)
- 财(43095)
- 教育(40050)
- 学学(38932)
- 图书(36251)
- 农业(32878)
- 技术(32844)
- 书馆(26806)
- 图书馆(26806)
- 融(23694)
- 金融(23694)
- 业经(23179)
- 财经(21933)
- 经济研究(21731)
- 经(18646)
- 情报(17769)
- 问题(17402)
- 科技(16982)
- 理论(16888)
- 业(16870)
- 技术经济(16686)
- 统计(16656)
共检索到492636条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
蒋婷 孙建军
[目的/意义]术语是本体的重要组成部分,术语自动抽取是本体自动构建的基础,文章采用回归的方法对未登录词进行概率(某个数值(组合)对应的候选词集合中术语的概率)预测,获得该词可能为术语的概率。[方法/过程]文章结合语言学和统计方法,通过构建术语库提取术语抽取模板来抽取候选术语,此外,通过引入回归的方法,将术语抽取问题转化为对词语成为术语的概率的预测问题。[结果/结论]提出的方法最后通过实验验证了其有效性。
[期刊] 图书情报工作
[作者]
季培培 鄢小燕 岑咏华
领域中文术语识别与抽取是领域中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。在对领域术语的内涵和特征的阐述基础上,重点对领域中文术语识别与抽取的研究现状、主要的方法以及典型的应用进行综述,最后指出其未来的发展趋势。
关键词:
术语抽取 术语识别 领域中文信息处理
[期刊] 情报学报
[作者]
朱惠 王昊 苏新宁 邓三鸿
本体是知识组织的有效方式,也是构建语义网的重要环节,而概念非分类关系又是本体的重要组成部分。由于术语是概念的外在表达,因此本文在深入分析当前国内外术语非分类关系抽取研究的基础上,引入共现分析、结构分析、模板构建、逻辑推理等方法和技术构建了面向汉语领域非结构化文本的术语非分类关系抽取模型,分别从内容和结构两个不同的角度抽取术语非分类关系。论文提出了模型的主要运行流程以及各功能模块的主要组成部件,对主要组成部件的具体实现进行了探讨,并对相关方法的局限性进行了论述。本文的研究为术语非分类关系抽取提供了新的思路,丰富了知识发现方法,同时也能为实现可行有效的知识组织提供参考。
[期刊] 情报学报
[作者]
吴俊 程垚 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
[期刊] 情报理论与实践
[作者]
朱恒民 马静 黄卫东
为了快速有效地自动处理中文Web文本,提出了一种基于领域本体的主题特征抽取方法。该方法针对Web文本特点,介绍了一种领域词典的半自动化构建方法。基于领域词典切分文本,通过对词条的主题映射,采用领域本体的概念表示文本向量,从而有效地降低文本特征向量的维数,提高主题抽取的质量。考虑文本信息的不同位置与频率,计算主题特征的权值,并且基于领域本体的结构,对主题概念的权值进行调整和排序。实例验证了该方法的有效性。
关键词:
主题抽取 领域本体 文本挖掘
[期刊] 情报学报
[作者]
唐琳 郭崇慧 陈静锋 孙磊磊
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
[期刊] 图书情报工作
[作者]
屈鹏 王惠临
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。
关键词:
术语抽取 文本挖掘 专利 信息分析
[期刊] 中国图书馆学报
[作者]
张卫 王昊 邓三鸿 张宝隆
在跨学科知识范式下,数字人文的研究范畴随着自身学科体系的拓展而不断泛化,采取关键语义技术解析文化对象中的人文内涵与情感知识对于重拾学科"人文性"与"计算性"特质具有重要意义。本文以古诗文本为例,面向汉语诗文及其鉴赏实现大规模人文情感术语的自动化抽取与分析。首先在无标注集环境下提出一种基于"冷启动"的字序列自动标引方法来获取学习语料,随后在字向量(Char2Vec)指导下将汉字特征(部首、拼音等)和BERT语言学模型分别引入机器学习与深度学习模型,并从知识发现的角度定义新术语识别规则。研究发现,将现代鉴赏融入古诗原文显著优化了情感知识的广度与深度,领域术语能够被有效标引。训练的BERT-BiLSTM-CRFs深度学习模型的效果明显优于CRFs机器学习,最佳F1与F1_distinct可分别达到95.63%和85.43%;同时汉字特征的引入也有效提升了传统CRFs效果,以领域特征和基于"竖心旁""心字底"部首约束特征为最优。相较于机器学习抽取出的长篇幅新术语,深度学习能够拓展出更多寄托情感知识的新意象词。源于诗文与鉴赏的情感术语为文学信息资源的情感分析与知识服务提供了参考(人文性),基于汉字语言特征的抽取方案为中文领域自然语言处理技术的深化提供了启迪(计算性)。图11。表6。参考文献30。
[期刊] 情报理论与实践
[作者]
王东波 高瑞卿 苏新宁 朱丹浩
情报课程是情报学教学体系的核心和灵魂,是新的情报学人才培养模式的基础。在大数据、数据科学、人工智能发展的大环境下,数据学科与情报学之间存在很多共同点和交叉点,尤其是在对相应工作者所具有的技能素养上。文章通过对数据科学招聘信息中出现的人才技能素养实体的抽取,探究指导情报学学科紧跟时代发展潮流的课程设计内容。通过对招聘网站中数据科学相关工作岗位公告的抓取,经人工标注10534条公告数据,构建了基于预训练字嵌入的BI-LSTM-CRF神经网络的技能素养实体自动抽取模型,并在开发集中取得最高调和平均值85. 04%的效果。文章利用最优模型在11508条招聘公告中进行实体自动抽取,分析抽取结果,并围绕数据科学技能素养要求为情报学课程发展提出了适当建议。
关键词:
情报学课程 数据科学 深度学习 自动抽取
[期刊] 情报学报
[作者]
赵洪 王芳
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
[期刊] 情报理论与实践
[作者]
陈果 彭家彬 肖璐
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]本文提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。
[期刊] 数据分析与知识发现
[作者]
倪维健 孙浩浩 刘彤 曾庆田
【目的】对现有中文分词方法在领域文献上的分词结果进行调整,以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析,以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差,并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验,结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果 F1值提升2%-3%,并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性,
关键词:
领域文献 中文分词 分词优化 词频偏差
[期刊] 情报学报
[作者]
蒋婷 孙建军
等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层叠条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学
关键词:
本体构建 等级关系抽取 术语抽取
[期刊] 图书馆论坛
[作者]
曾子明 宋扬扬
针对文化遗产知识检索方式单一、服务缺乏个性化等不足,提出面向文化遗产领域的移动视觉搜索(Mobile Visual Search,MVS)模型。该模型以读者为中心,将MVS无缝融入读者的文化遗产知识活动中,并根据读者情境提供相应的智慧服务。文章分析了文化遗产数字化建设中MVS的必要性,重点介绍了面向文化遗产领域的MVS模型的体系结构,探讨模型实现的技术框架。
[期刊] 沈阳农业大学学报
[作者]
李娜 邓寒冰 朴在林 谭东明 杨萍 刘君
随着信息技术的快速发展,农业知识和数据在互联网中呈现爆发式增长,如何实现农业信息的精准推送是农业信息化领域所面临的重要问题。为此,提出一种面向农业领域知识的自适应决策模型,设计了面向农业领域知识的思维决策模型AKDM(Agriculture KnowleDge Decision-MAKing MoDel),利用软件Agent主动采集网络环境中的知识信息,基于信息内容来推理、分析并导出结果,进而指导知识推送行为。结果表明:将农业本体知识转换成信念、愿望和意图集合,同时利用三者之间的决策推理关系指导知识推送行为,可以实现基于农业领域知识的自适应决策推理过程,且涉及的试验过程为实现农业信息的个性化智...
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除