- 年份
- 2024(8524)
- 2023(12514)
- 2022(11158)
- 2021(10550)
- 2020(8857)
- 2019(20103)
- 2018(20159)
- 2017(38453)
- 2016(21093)
- 2015(23232)
- 2014(22686)
- 2013(22208)
- 2012(20091)
- 2011(17946)
- 2010(17803)
- 2009(16287)
- 2008(15319)
- 2007(13057)
- 2006(11220)
- 2005(9610)
- 学科
- 济(76173)
- 经济(76093)
- 管理(56479)
- 业(53001)
- 企(44852)
- 企业(44852)
- 方法(35938)
- 数学(30963)
- 数学方法(30582)
- 农(20504)
- 学(19972)
- 中国(19905)
- 财(19512)
- 业经(17353)
- 地方(15784)
- 制(13850)
- 贸(13742)
- 贸易(13734)
- 理论(13680)
- 农业(13506)
- 易(13296)
- 和(13115)
- 务(12790)
- 财务(12726)
- 财务管理(12706)
- 环境(12231)
- 企业财务(12029)
- 技术(11860)
- 教育(10938)
- 银(10896)
- 机构
- 大学(285910)
- 学院(285063)
- 管理(112389)
- 济(105066)
- 经济(102617)
- 理学(98280)
- 理学院(97139)
- 研究(95516)
- 管理学(95244)
- 管理学院(94763)
- 中国(68192)
- 科学(63886)
- 京(60861)
- 农(48683)
- 所(48415)
- 财(47252)
- 业大(46103)
- 研究所(44846)
- 中心(42782)
- 江(40266)
- 范(39023)
- 财经(38701)
- 师范(38572)
- 农业(38524)
- 北京(37971)
- 院(35329)
- 经(35234)
- 州(33091)
- 技术(31661)
- 师范大学(31231)
- 基金
- 项目(205144)
- 科学(160296)
- 基金(147522)
- 研究(147255)
- 家(130257)
- 国家(129192)
- 科学基金(110159)
- 社会(89926)
- 社会科(85066)
- 社会科学(85044)
- 省(81083)
- 基金项目(79318)
- 自然(74108)
- 自然科(72368)
- 自然科学(72350)
- 自然科学基金(71041)
- 划(68945)
- 教育(67544)
- 编号(60760)
- 资助(60164)
- 成果(48534)
- 重点(46727)
- 部(44021)
- 发(43823)
- 创(42751)
- 课题(41636)
- 科研(39966)
- 创新(39851)
- 计划(38547)
- 大学(37815)
共检索到398685条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
王东波 高瑞卿 叶文豪 周鑫 朱丹浩
随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,从而促进学术文本挖掘研究的发展。本文以学术文本的不同结构功能为研究对象,以Journal of the Association for Information Science and Technology(JASIST)上发表的1579篇论文为数据集,进行双向长短时记忆神经网络、支持向量机和条件随机场三种模型上的预实验,并对比实验结果的性能,最终确定利用条件随机场模型做进一步探究。利用条件随机场模型,本文将学术文本结构功能识别问题转化为对句子单元的序列标注问题,寻找最优识别模型并探究不同特征对结构功能识别的影响,最终获得开放测试的调和平均值为92.88%的结构整体识别效果。实验结果表明,章节标题中词汇信息和章节内容的特征词汇信息对学术文本的功能结构识别起到巨大作用,可以达到令人满意的效果,而结构的长度特征则干扰条件随机场方法的性能。在最后,本文对学术文本结构功能识别出错原因进行总结,指出进一步探讨的问题和方向。
关键词:
文本分类 条件随机场 篇章结构 深度学习
[期刊] 情报理论与实践
[作者]
章成志 徐津 马舒天
[目的/意义]目前学术文献被引片段识别研究存在两个问题:对于给定的一个引文上下文,其所对应的被引片段句子数量并没有明确的定义;构建特征中很少考虑句子中词语的语义相似度特征。文章基于以上两个角度,对已有的实验方案进行改进,旨在提高被引片段的识别效果。[方法/过程]首先,按照不同的粒度对被引文献进行句子切分,以考察不同粒度切分下被引片段的识别效果,从而确定被引片段的最佳句子数量。随后,在被引片段识别模型中加入词语语义相似度特征,即通过词嵌入进行分布式词向量表示,并依据词汇语义网络本体,度量不同句子中词语间的语义相似度。[结果/结论]实验结果表明,随着句子切分粒度的逐渐增加,被引片段识别效果呈下降趋势;另外,所增加的词语语义相似度特征能够有效地在句子间建立细粒度的语义关联,提高了模型的稳定性,从而提升了被引片段的识别效果。[局限]仅从特征构建的角度对被引片段的识别工作进行优化,提升效果较为有限。模型选择方面,仍局限于使用传统的机器学习算法,未考虑现有的深度学习算法对本工作进行改进。
[期刊] 数字图书馆论坛
[作者]
程齐凯 李信
为提高学术文献语义出版水平,既需要在写作和出版模式方面进行研究,也需要探索学术文本语义理解技术,以实现对学术文献,特别是存量学术文献的语义化处理。本文在学术文本词汇功能分析框架基础上,提出一种基于条件随机场的学术文献问题和方法识别模型,该模型使用词法特征、句法特征、组块特征等27个特征。实验表明,该方法具有优于当前最佳的识别效果。
关键词:
词汇功能 语义出版 序列标注 学术文本
[期刊] 情报学报
[作者]
沈思 胡昊天 叶文豪 王东波
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
[期刊] 情报理论与实践
[作者]
张晓娟 杨诗涵 郭佳润 桂思思
[目的/意义] 通过抽取有效分类特征,实现对学术搜索情境下困难搜索的自动识别。[方法/过程]人工标注万方数据库用户行为日志数据中的1125个搜索会话;从查询表达式、用户单类行为、用户多类行为间转换3个维度提出分类特征;对比分析所提出分类特征在GBDT、神经网络、LightGBM及XGboost 4种分类模型中的分类效果。[结果/结论]提出的特征集合能有效识别困难搜索,且优于已有研究中所提出的特征;提出的3类特征集合具有一定的独立分类效果,且相对其他两类分类集合,基于用户单类行为的特征在多数情况下取得了最好的实验性能。[局限]由于公开可用数据集的有限性,本研究只在一个数据集上对所提出特征进行了验证;分类特征来源于日志数据,故无法覆盖用户生理、心理所反映的特征;人工标注效率低导致数据集有限。
[期刊] 情报学报
[作者]
方龙 李信 黄永 陆伟
当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,
[期刊] 图书情报工作
[作者]
张晓娟 陆伟 雷声伟
从Sogou查询日志中选取样本查询且进行人工标注,通过对标注后新闻查询的分析,提出能用于识别新闻意图的新特征,即查询表达式特征、查询随时间分布特征以及点击结果特征。根据这3个特征,利用决策树分类器实现查询中新闻意图的自动识别,结果发现:1新闻类查询的查询目标主要集中在特定主题信息以及娱乐类信息方面,其查询主题大多为娱乐、政治、体育与经济类信息;2相对非新闻查询,新闻查询具有更可能包含实体、随时间分布波动较大、点击结果之间相似度更高的特点;3本方法对查询中新闻意图的识别效果较好,其宏平均准确率、召回率、F值分别为0.76、0.73、0.74。
关键词:
查询意图 新闻查询 新闻意图 查询分类
[期刊] 情报理论与实践
[作者]
蔡乐 罗卓然 陆伟
[目的/意义]学术论文中的科研贡献是论文中最有价值的信息类型之一。[方法/过程]本文将学术论文贡献内容从理论层面分为三个主要维度,即贡献功能、贡献重要性、问题-方法贡献。以此为指导,设计了一套包含五大贡献类别的标注框架,其中包括揭示贡献类型抽象性质的贡献分类标注体系及描述贡献内容的多层术语词汇功能标注体系。在此基础上,以SCI-BERT为基础模型,显示的引入了学术论文的章节功能和结构化的术语信息,提出了语义角色标注增强下的科研贡献识别模型CNSC,并将其与过往的文本分类方法进行对比。[结果/结论]实验结果表明,文章提出的CNSC模型充分利用了论文的术语结构和贡献句的章节信息,对贡献类型的识别要优于其他模型。
关键词:
贡献内容 学术论文 文本分类 预训练模型
[期刊] 图书情报工作
[作者]
雷声伟 陈海华 黄永 陆伟
[目的 /意义]引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法 /过程]梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果 /结论]实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。
[期刊] 图书情报工作
[作者]
王佳敏 陆伟 刘家伟 程齐凯
[目的/意义]学术文本结构功能是对学术文献的结构和章节功能的概括,针对当前研究较少从学术文本多层次结构出发进行融合和传统方法依赖人工经验构建规则或特征的问题,本文在对学术文本层次结构进行解析的基础上,构建了多层次融合的学术文本结构功能识别模型。[方法/过程]以ScienceDirect数据集为例进行实验,该模型首先通过深度学习方法对不同层次学术文本进行结构功能识别,接着采用投票方法对不同层次和不同模型的识别结果进行融合。[结果/结论]研究结果表明各层次集成后的整体效果较单一模型均有不同程度提升,综合结果的整体准确率、召回率和F1值分别达到86%、84%和84%,并且深度学习算法在学术文本分类任务中的性能较传统机器学习算法SVM更优,最后对学术文本结构功能错分情况进行了分析,指出本研究潜在的应用领域和下一步的研究方向。
关键词:
深度学习 结构功能 多层次融合 学术文本
[期刊] 地理科学进展
[作者]
叶建栲,刘岳
特征参数的抽取,是实现地形图中点状符号自动识别的关键。本文根据点状符号在扫描图中可能出现的旋转、缩放等情况,归纳和总结出了4种易于计算的不变性特征,并给出了这些特征的提取方法和部分实验结果。这4种特征参数是:复杂度——用以描述符号外围的复杂程度;扁率——用以反映符号的扁平程度;比重——符号的黑色部分在其整个覆盖区域中所占的比例;偏心率——用以反映符号重心与符号的几何中心的偏离程度。这4种特征参数具有旋转不变性和大小不变性,且便于提取、容易计算。
关键词:
地图模式识别 不变性特征
[期刊] 情报理论与实践
[作者]
侯小雯 邹永利
学术性文献内的图片具有确定信息需求、辅助滤检的功能,网络学术文献内的图片在上下文语境、大小、命名、格式、超链接等方面有着独特的特征,可以与网络广告、图标等干扰图片区分开来,便于实现自动识别和辅助检索。基于这样的理论,以Google的自动抓取为基础采用VC++进行系统开发,实现了对含图片的文献的检索并在结果页面上以缩略图的形式展示图片,并依此对检索重新排序。
关键词:
信息检索 学术文献 主题图片
[期刊] 图书情报工作
[作者]
陈锋 翟羽佳 王芳
[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率。[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1 822篇论文的标题和摘要进行实验。[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响。如何选择语义特征、语义标注和语义消歧是需要解决的新问题。
[期刊] 情报理论与实践
[作者]
黄珊 刘茹 石燕青 杨波
[目的/意义]探索数据论文引用意图自动识别方法,为实现更高效的科学数据组织和数据共享提供参考和依据。[方法/过程]以生物医学领域为例,在构建大规模数据论文引用句标准语料库的基础上,通过引用句的内容特征对引用意图进行分类,提出基于深度学习技术的数据论文引用意图自动识别方法。[结果/结论]利用文本分类手段对数据论文引用意图进行自动识别具有可行性,深度预训练的语言模型PubMedBert性能优良且具有明显的领域优势,能够应用于大规模语料实践任务中。在数据论文引用意图中,半数以上是实质性引用且这类引用呈上升趋势。
关键词:
数据论文 引用意图 开放科学 文本分类
[期刊] 北京林业大学学报
[作者]
孙仁山 李文彬 田勇臣 华丽
为了适应我国人工工业用材林自动化整枝抚育的需要,该文提出一种用于工业用材林自动整枝的立木枝干动态识别系统框架,对人工林侧柏的枝干进行了数字图像采集及处理,利用计算机视觉、图像处理、小波分析技术对图像进行压缩、滤波、分割、消噪及边缘特征提取.同时提出了一种立木枝干计算机自动识别算法,提取立木图像枝干形状、尺寸、弯曲度及相对空间位置关系基本生长特征,即利用模式识别技术验算其与特征数据库的匹配情况,从而达到立木枝干自动识别的目的,为后续的自动识别研究提供了依据.
关键词:
立木整枝 模式识别 图像处理 小波分析
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除