- 年份
- 2024(5956)
- 2023(8641)
- 2022(7817)
- 2021(7532)
- 2020(6245)
- 2019(14724)
- 2018(14751)
- 2017(28472)
- 2016(15528)
- 2015(17480)
- 2014(17457)
- 2013(17244)
- 2012(15622)
- 2011(13999)
- 2010(13666)
- 2009(12287)
- 2008(11720)
- 2007(9895)
- 2006(8473)
- 2005(7184)
- 学科
- 济(58716)
- 经济(58651)
- 管理(44180)
- 业(41485)
- 企(35249)
- 企业(35249)
- 方法(29647)
- 数学(25625)
- 数学方法(25333)
- 农(14996)
- 中国(14530)
- 财(14012)
- 学(13769)
- 业经(13073)
- 地方(12142)
- 理论(10647)
- 和(10556)
- 农业(10116)
- 贸(10060)
- 贸易(10056)
- 技术(9784)
- 易(9745)
- 环境(9576)
- 务(9391)
- 财务(9334)
- 财务管理(9319)
- 制(9053)
- 教育(8903)
- 企业财务(8831)
- 划(8477)
- 机构
- 大学(216537)
- 学院(213351)
- 管理(90602)
- 济(79858)
- 理学(79593)
- 理学院(78736)
- 经济(78011)
- 管理学(77411)
- 管理学院(77036)
- 研究(68042)
- 中国(48285)
- 京(46234)
- 科学(44292)
- 财(34798)
- 所(33318)
- 业大(33229)
- 农(32195)
- 研究所(30783)
- 中心(30565)
- 北京(29093)
- 财经(28925)
- 范(28869)
- 江(28801)
- 师范(28633)
- 经(26381)
- 农业(25271)
- 院(25009)
- 州(24168)
- 师范大学(23403)
- 商学(22743)
- 基金
- 项目(154426)
- 科学(121215)
- 研究(113523)
- 基金(111781)
- 家(96811)
- 国家(95995)
- 科学基金(83053)
- 社会(69410)
- 社会科(65713)
- 社会科学(65695)
- 基金项目(60674)
- 省(60247)
- 自然(55351)
- 自然科(54043)
- 自然科学(54032)
- 自然科学基金(53035)
- 教育(51696)
- 划(50827)
- 编号(47288)
- 资助(45702)
- 成果(37847)
- 重点(33748)
- 部(33623)
- 创(32163)
- 发(32134)
- 课题(31565)
- 创新(29862)
- 项目编号(29649)
- 科研(29600)
- 大学(28977)
共检索到294544条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
章成志 徐津 马舒天
[目的/意义]目前学术文献被引片段识别研究存在两个问题:对于给定的一个引文上下文,其所对应的被引片段句子数量并没有明确的定义;构建特征中很少考虑句子中词语的语义相似度特征。文章基于以上两个角度,对已有的实验方案进行改进,旨在提高被引片段的识别效果。[方法/过程]首先,按照不同的粒度对被引文献进行句子切分,以考察不同粒度切分下被引片段的识别效果,从而确定被引片段的最佳句子数量。随后,在被引片段识别模型中加入词语语义相似度特征,即通过词嵌入进行分布式词向量表示,并依据词汇语义网络本体,度量不同句子中词语间的语义相似度。[结果/结论]实验结果表明,随着句子切分粒度的逐渐增加,被引片段识别效果呈下降趋势;另外,所增加的词语语义相似度特征能够有效地在句子间建立细粒度的语义关联,提高了模型的稳定性,从而提升了被引片段的识别效果。[局限]仅从特征构建的角度对被引片段的识别工作进行优化,提升效果较为有限。模型选择方面,仍局限于使用传统的机器学习算法,未考虑现有的深度学习算法对本工作进行改进。
[期刊] 情报学报
[作者]
王东波 高瑞卿 叶文豪 周鑫 朱丹浩
随着大量科研论文全文本的出现,如何从中挖掘相应的知识不仅有利于学术文献的深度知识组织而且有益于学术文献的精准检索。而识别学术文本的结构是进行上述探究的基础,因为结构的识别有助于从更深层次或者偏重语义的角度理解学术文本,从而促进学术文本挖掘研究的发展。本文以学术文本的不同结构功能为研究对象,以Journal of the Association for Information Science and Technology(JASIST)上发表的1579篇论文为数据集,进行双向长短时记忆神经网络、支持向量机和条件随机场三种模型上的预实验,并对比实验结果的性能,最终确定利用条件随机场模型做进一步探究。利用条件随机场模型,本文将学术文本结构功能识别问题转化为对句子单元的序列标注问题,寻找最优识别模型并探究不同特征对结构功能识别的影响,最终获得开放测试的调和平均值为92.88%的结构整体识别效果。实验结果表明,章节标题中词汇信息和章节内容的特征词汇信息对学术文本的功能结构识别起到巨大作用,可以达到令人满意的效果,而结构的长度特征则干扰条件随机场方法的性能。在最后,本文对学术文本结构功能识别出错原因进行总结,指出进一步探讨的问题和方向。
关键词:
文本分类 条件随机场 篇章结构 深度学习
[期刊] 数字图书馆论坛
[作者]
程齐凯 李信
为提高学术文献语义出版水平,既需要在写作和出版模式方面进行研究,也需要探索学术文本语义理解技术,以实现对学术文献,特别是存量学术文献的语义化处理。本文在学术文本词汇功能分析框架基础上,提出一种基于条件随机场的学术文献问题和方法识别模型,该模型使用词法特征、句法特征、组块特征等27个特征。实验表明,该方法具有优于当前最佳的识别效果。
关键词:
词汇功能 语义出版 序列标注 学术文本
[期刊] 情报理论与实践
[作者]
张晓娟 杨诗涵 郭佳润 桂思思
[目的/意义] 通过抽取有效分类特征,实现对学术搜索情境下困难搜索的自动识别。[方法/过程]人工标注万方数据库用户行为日志数据中的1125个搜索会话;从查询表达式、用户单类行为、用户多类行为间转换3个维度提出分类特征;对比分析所提出分类特征在GBDT、神经网络、LightGBM及XGboost 4种分类模型中的分类效果。[结果/结论]提出的特征集合能有效识别困难搜索,且优于已有研究中所提出的特征;提出的3类特征集合具有一定的独立分类效果,且相对其他两类分类集合,基于用户单类行为的特征在多数情况下取得了最好的实验性能。[局限]由于公开可用数据集的有限性,本研究只在一个数据集上对所提出特征进行了验证;分类特征来源于日志数据,故无法覆盖用户生理、心理所反映的特征;人工标注效率低导致数据集有限。
[期刊] 情报理论与实践
[作者]
蔡乐 罗卓然 陆伟
[目的/意义]学术论文中的科研贡献是论文中最有价值的信息类型之一。[方法/过程]本文将学术论文贡献内容从理论层面分为三个主要维度,即贡献功能、贡献重要性、问题-方法贡献。以此为指导,设计了一套包含五大贡献类别的标注框架,其中包括揭示贡献类型抽象性质的贡献分类标注体系及描述贡献内容的多层术语词汇功能标注体系。在此基础上,以SCI-BERT为基础模型,显示的引入了学术论文的章节功能和结构化的术语信息,提出了语义角色标注增强下的科研贡献识别模型CNSC,并将其与过往的文本分类方法进行对比。[结果/结论]实验结果表明,文章提出的CNSC模型充分利用了论文的术语结构和贡献句的章节信息,对贡献类型的识别要优于其他模型。
关键词:
贡献内容 学术论文 文本分类 预训练模型
[期刊] 图书情报工作
[作者]
雷声伟 陈海华 黄永 陆伟
[目的 /意义]引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法 /过程]梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果 /结论]实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。
[期刊] 情报学报
[作者]
黄水清 周好 彭秋茹 王东波
古籍文本中存在大量事实上的引文条目,即引书。目前,引文分析法多基于现代文本开展研究,学术界对古籍文本中的引用现象的关注较少。本文将引文分析法应用于古籍文本,计算和分析引书的引文指标,为古籍文本的引书计量学研究建立初步框架。本文选择《十三经注疏》中的《论语注疏》《毛诗正义》《春秋左传正义》三部典籍为研究对象,分别基于CRF (conditional random field)模型、Bi-LSTM (bidirectional long short-term memory)模型以及Bi-LSTM-CRF模型,从古籍文本中自动识别引书条目,并对比抽取性能,利用引文分析方法计算并分析了三部典籍中引书的各项引文计量指标,进而分析古籍文本之间的知识关联,探讨古人的引用行为。研究结果表明,机器学习模型应用于引书条目的自动识别整体效果良好,两种深度学习模型表现更佳,CRF模型存在明显差距。在两种深度学习模型中,Bi-LSTM-CRF模型性能略好。古籍文本之间的关联强度不一,引书的规模受多方因素影响,经部文献的被引次数占比最高,经部文献中的礼制类文献尤甚。此外,古人的引用行为也受成书目的、学者知识背景、引书文献获取难易程度等多重因素的影响。
[期刊] 情报理论与实践
[作者]
侯小雯 邹永利
学术性文献内的图片具有确定信息需求、辅助滤检的功能,网络学术文献内的图片在上下文语境、大小、命名、格式、超链接等方面有着独特的特征,可以与网络广告、图标等干扰图片区分开来,便于实现自动识别和辅助检索。基于这样的理论,以Google的自动抓取为基础采用VC++进行系统开发,实现了对含图片的文献的检索并在结果页面上以缩略图的形式展示图片,并依此对检索重新排序。
关键词:
信息检索 学术文献 主题图片
[期刊] 图书情报工作
[作者]
陈锋 翟羽佳 王芳
[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率。[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1 822篇论文的标题和摘要进行实验。[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响。如何选择语义特征、语义标注和语义消歧是需要解决的新问题。
[期刊] 数据分析与知识发现
[作者]
徐健 李纲 毛进 叶光辉
【目的】对科技文献领域的被引片段概念的特征进行分析,并比较不同识别方法效果的差异。【方法】以CL-Sci Summ 2016比赛被引片段标注数据为例,探索被引片段长度、位置与重要性特征,并分析与其对应引文上下文在长度和位置上的相关性。之后以基于词袋模型、主题模型、Word Net语义词典的相似性算法为例,比较这些方法在被引片段识别中的效果差异。【结果】研究结果发现:被标注的被引片段有96%少于三句,且更多地出现在文章前部和章节内的前部分,被引片段的Text Rank权重均值显著高于其他片段;被引片段与引文
关键词:
被引片段 识别方法 引文上下文 引用对象
[期刊] 情报理论与实践
[作者]
黄珊 刘茹 石燕青 杨波
[目的/意义]探索数据论文引用意图自动识别方法,为实现更高效的科学数据组织和数据共享提供参考和依据。[方法/过程]以生物医学领域为例,在构建大规模数据论文引用句标准语料库的基础上,通过引用句的内容特征对引用意图进行分类,提出基于深度学习技术的数据论文引用意图自动识别方法。[结果/结论]利用文本分类手段对数据论文引用意图进行自动识别具有可行性,深度预训练的语言模型PubMedBert性能优良且具有明显的领域优势,能够应用于大规模语料实践任务中。在数据论文引用意图中,半数以上是实质性引用且这类引用呈上升趋势。
关键词:
数据论文 引用意图 开放科学 文本分类
[期刊] 北京林业大学学报
[作者]
孙仁山 李文彬 田勇臣 华丽
为了适应我国人工工业用材林自动化整枝抚育的需要,该文提出一种用于工业用材林自动整枝的立木枝干动态识别系统框架,对人工林侧柏的枝干进行了数字图像采集及处理,利用计算机视觉、图像处理、小波分析技术对图像进行压缩、滤波、分割、消噪及边缘特征提取.同时提出了一种立木枝干计算机自动识别算法,提取立木图像枝干形状、尺寸、弯曲度及相对空间位置关系基本生长特征,即利用模式识别技术验算其与特征数据库的匹配情况,从而达到立木枝干自动识别的目的,为后续的自动识别研究提供了依据.
关键词:
立木整枝 模式识别 图像处理 小波分析
[期刊] 物流技术
[作者]
梁碧婵
指出利用图像识别的技术对配送货物的编号进行识别是一种有效的方法,它不仅实现简单,而且成本较低,是一种能够实现RFID功能的低成本方法,并将最小二乘支撑向量机(Least Square Support Vector Machine,LSSVM)用于货物的编号自动识别。通过实验验证了其有效性。
[期刊] 情报学报
[作者]
沈思 胡昊天 叶文豪 王东波
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
[期刊] 数据分析与知识发现
[作者]
张琳 秦策 叶文豪
【目的】法言法语实体的自动识别是实现裁判文书文本挖掘的重要的基础性工作。【方法】采用爬虫方法获取数据,人工方式进行语料标注,利用NLPIR加载法律领域词典对语料进行分词,结合法言法语的内部和外部特征构建基于条件随机场的特征模板,自动识别语料中的法言法语。【结果】融入法言法语内部和外部特征的条件随机场模型,自动识别法言法语的实验效果良好,模型的调和平均值达到90%以上。【局限】法言法语实体自动识别模型在领域的扩展上有一定的局限性。【结论】基于条件随机场对法言法语实体实现自动抽取是可行的。
关键词:
裁判文书 条件随机场模型 法言法语实体
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除