- 年份
- 2024(5974)
- 2023(8798)
- 2022(7602)
- 2021(7265)
- 2020(6203)
- 2019(14337)
- 2018(14296)
- 2017(27875)
- 2016(14768)
- 2015(16800)
- 2014(16327)
- 2013(15552)
- 2012(13848)
- 2011(12034)
- 2010(11894)
- 2009(10404)
- 2008(9709)
- 2007(8091)
- 2006(6518)
- 2005(5125)
- 学科
- 济(57518)
- 经济(57465)
- 管理(42662)
- 业(40419)
- 企(34476)
- 企业(34476)
- 方法(32825)
- 数学(29812)
- 数学方法(29194)
- 农(14205)
- 财(14201)
- 中国(13602)
- 业经(11899)
- 理论(10753)
- 技术(9670)
- 务(9604)
- 地方(9570)
- 财务(9549)
- 贸(9543)
- 贸易(9537)
- 财务管理(9527)
- 学(9526)
- 农业(9337)
- 易(9302)
- 企业财务(8995)
- 和(8773)
- 制(8560)
- 环境(8264)
- 划(7895)
- 银(7112)
- 机构
- 学院(195028)
- 大学(192346)
- 管理(81735)
- 济(77252)
- 经济(75793)
- 理学(72435)
- 理学院(71752)
- 管理学(70114)
- 管理学院(69755)
- 研究(55514)
- 中国(41021)
- 京(38189)
- 科学(34489)
- 财(33516)
- 业大(29488)
- 农(28203)
- 财经(27962)
- 中心(27562)
- 江(26666)
- 经(25679)
- 所(25200)
- 经济学(23786)
- 范(23544)
- 研究所(23315)
- 师范(23281)
- 北京(22721)
- 农业(22096)
- 技术(22009)
- 经济学院(21628)
- 经济管理(21602)
- 基金
- 项目(144572)
- 科学(115756)
- 基金(106286)
- 研究(105083)
- 家(92262)
- 国家(91533)
- 科学基金(80997)
- 社会(66818)
- 社会科(63518)
- 社会科学(63501)
- 省(57680)
- 基金项目(56413)
- 自然(53941)
- 自然科(52811)
- 自然科学(52802)
- 自然科学基金(51806)
- 教育(50914)
- 划(48167)
- 资助(43749)
- 编号(43072)
- 成果(32584)
- 重点(32367)
- 部(31952)
- 创(31449)
- 发(30175)
- 创新(29273)
- 课题(28767)
- 科研(28207)
- 教育部(28088)
- 国家社会(27810)
共检索到259074条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
张晗 赵玉虹
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。
[期刊] 情报理论与实践
[作者]
唐晓波 翟夏普
[目的/意义]信息过载是当前社会面临的普遍性问题,如何从大量的信息中提取有价值的内容,已成为研究的一个重点,目前自动摘要技术成为解决此问题的一种途径。[方法/过程]为了解决多文档摘要信息不全面、冗余度高的问题,文章提出了针对中文文本的多文档自动摘要混合模型,并对该模型所包含的句子向量化、分类器分类、句群划分和句子重组四个部分做了详细说明。该混合模型在摘要提取的过程不仅考虑了句子的形式特征,还融合了句子的深层语义,最后采用基于改进的PageRank算法对摘要句进行重组。[结果/结论]当摘要句为30时,该模型的ROUGE-1得分平均值为0.2074,明显高于TextRank (0.0728)和基于聚类的算法(0.1074)。实验结果表明该模型在多主题的中文长文本上是有效的。[局限]由于中文语料的限制,本实验的数据量相对较小,模型的适应能力未在大数据集上验证。
[期刊] 图书情报工作
[作者]
李纲 徐伟 王馨平
[目的/意义]为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法。[方法 /过程]针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt?MI)的特点提取事件摘要关键词,以微博传播价值和主题相关性为标准筛选微博,以时间-摘要关键词-摘要微博的形式生成时间轴摘要。[结果/结论]利用人工标注的测试集,与传统的TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高
[期刊] 情报科学
[作者]
黄文彬 倪少康
【目的/意义】多文档自动摘要技术的目的是从一组文档中精炼出重要信息摘要,减轻用户从文档中获取与理解信息的负担,是自然语言理解领域的重要研究方向之一。【方法/过程】本文提取十五年内的多文档自动摘要研究文献并筛选出至少50篇关键影响文章,梳理多文档自动摘要的概念与研究进展,揭示了最新的技术实现与实践情况。【结果/结论】基于不同技术方法对单词、句子或段落作为主要数据处理对象,找出多文档自动摘要的技术特征与难点,明确该领域的发展趋势,为未来的研究奠定了基础。
关键词:
自动摘要 多文档处理 自然语言处理
[期刊] 情报杂志
[作者]
杜秀英
[目的/意义]现有文本自动摘要算法普遍存在处理速度慢、压缩率不足或摘要质量不高等问题,如何高效处理、有效利用海量文本是图书馆信息管理及服务一个重要的研究方向。[方法/过程]提出了一种云计算平台下基于聚类与语义相似分析的多文本自动摘要方法。该方法在文本向量化基础上,通过MapReduce框架对多文本进行聚类、主题抽取、主题词及语义相似词频率统计等处理,然后摘取主题句构造出多文本摘要。[结果/结论]实验结果证实,基于聚类与语义相似分析的MapReduce自动摘要架构在生成大规模多文本摘要时,不但具有较好的时间
[期刊] 图书情报工作
[作者]
袁琳 孙巍 马晓敏 李周晶 项芮
[目的/意义]针对现有文本自动摘要形成过程中重要技术节点——图模型框架下摘要知识表达方式中内容语义揭示深度不够的问题,提出报道性新闻自动摘要模型方案,为相关领域利用经过摘要处理后的网页报道性新闻文本数据开展实践研究提供借鉴参考。[方法/过程]利用ETM(Embedded Topic Model)融合词向量的主题模型分析工具,在图模型框架下针对目标摘要句的主题构造环节,加入主题重要度特征和语义相关性特征并重新设计报道性新闻句间统计特征,对报道性新闻文本深层次主题语义信息进行挖掘、过滤,以此初步形成报道性新闻自动摘要抽取模型;后续依据报道性新闻摘要主要功能需求提出摘要主题测度功能量化指标体系,建立测度标准与句子统计特征量化方法的对应关系,以此优化调整提出的报道性新闻自动摘要抽取模型。[结果/结论 ]利用图模型框架下的报道性新闻自动摘要方法具体选取农业领域科技动态报道性新闻的摘要抽取过程进行实证,建立报道性新闻自动摘要测度标准进一步得到优化后报道性新闻摘要模型方案,结果显示在外部报道性功能及内部ROUGE评价测评综合表现上优于对比方法,可以有效提高报道性新闻自动摘要抽取的准确性。
[期刊] 情报理论与实践
[作者]
陈红伶 杨佳颖 许鑫
[目的/意义]现有基于合作或引证建立的学术共同体展现了更显性的学术关联,但不能直观地揭示出学术共同体所共有的特征,同时不可避免增加了人情因素带来的偏私倾向。[方法/过程]以知网文献摘要数据为研究对象,文章利用LDA和Word2vec混合模型挖掘得到每篇文献的主题,主题包含主题词及其扩展词。并以此作为主题与文献作者关系的依据,构建学者—主题二模网络,通过对二模网络以及映射的一模学者网络进行可视化,直观地反映了领域内学者就研究方向的聚集情况。[结果/结论]LDA和Word2vec混合模型能够深入挖掘文献主题,而利用二模能够展现二元的主体,通过上述方法,能够找到在现实中或许没有发生合作、但具有潜在重合研究主题倾向的学者群体。以国内图情领域为例,识别其核心学术共同体。"学者—主题"的二模网络中纳入了学者隶属群体的信息,不仅从全局视域归纳出领域内由词语元素构成的具体主题,而且利用向量距离计算得到的各个主题的扩展词语集,能进一步解释学者共同体所隶属群体的深化特征,能够有效降低人情因素,为同行评议提供支持。
[期刊] 情报理论与实践
[作者]
胡吉明 杨云
[目的/意义]为缓解政策信息过载、提高政策阅读效率及提升政策作用发挥效果,对政策文本的核心信息进行汇总凝练并生成高质量摘要。[方法/过程]集成无监督模型和算法,提出基于句向量改进的政策文本关键句子抽取策略;将依存句法结构融合至政策文本摘要生成中,提取政策文本依存句法树及其依存句法特征,增强基于RoBERTa模型的政策文本表示效果;在基于Seq2Seq的政策文本摘要生成模型中,引入PGN模型和改进SIMCLS模型筛选出最佳候选摘要,提升模型性能与所生成摘要的质量。[结果/结论]针对国务院政策文本的摘要生成实验表明,研究构建的融合关键句子和依存句法的政策文本摘要模型与策略,在ROUGE指标的评价上显著优于其他模型,且从实例呈现上看,模型所生成摘要在语义和语言质量上均表征良好。但政策文本摘要生成的连贯性有待提升,用于学习训练的、适用的参考摘要较少,摘要生成的评价评估有待进一步完善。
[期刊] 情报学报
[作者]
石磊 阮选敏 魏瑞斌 成颖
相较于早期的生成式摘要方法,基于序列到序列模型的文本摘要方法更接近人工摘要的生成过程,生成摘要的质量也有明显提高,越来越受到学界的关注。本文梳理了近年来基于序列到序列模型的生成式文本摘要的相关研究,根据模型的结构,分别综述了编码、解码、训练等方面的研究工作,并对这些工作进行了比较和讨论,在此基础上总结出该领域未来研究的若干技术路线和发展方向。
[期刊] 图书情报工作
[作者]
李海蓉
针对传统文档自动分类方法和目前语义分类方法中存在的问题,提出一种新的基于概念向量空间的文档语义分类模型,该模型通过字符匹配算法将原文档高维词向量空间中相互独立的词项匹配到描述本体概念的属性集合,进而映射成属性集合对应的本体概念,形成低维的、语义丰富的文档概念向量空间。采用目前非常流行的数据集"20Newsgroups"作为实验数据集,对基于概念向量空间的文档语义分类模型进行实验验证。实验结果表明:提出的文档语义分类方法与传统基于词向量空间的文档分类方法相比,能够极大地降低向量空间维度,提高文档分类的性能。
[期刊] 图书情报工作
[作者]
宋东桓 李晨英 刘子瑜 韩明杰
[目的/意义]论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程]假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论]结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。
[期刊] 情报学报
[作者]
沈思 胡昊天 叶文豪 王东波
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
[期刊] 情报理论与实践
[作者]
张兴旺 黄晓斌 郑聪
[目的/意义]目前国内外已发现了数百件我国古代海洋地图的珍稀文献资源,对其视觉内容与人机交互模型进行分析,对于解决其深层次数字化保护与开发利用问题,具有一定的理论价值和实践意义。[方法/过程]通过总结分析南海海图可视化人机交互的基础理论,提出了一种基于视觉摘要的南海海图可视化人机交互模型与体系结构,再围绕该模型的关键内容分别进行了阐述与分析,并对相应的应用模式进行了分析。[结果/结论]南海海图所呈现的是一系列高浓缩、抽象化的视觉符号,对应的是其所蕴藏的历史、文化与社会价值;南海海图视觉摘要为具有层次性、关联性的知识关联体系提供了较理想的可视化展示形式,也为用户提供了便捷的可视化人机交互方法。
[期刊] 清华大学学报(自然科学版)
[作者]
李佳沂 黄瑞章 陈艳平 林川 秦永彬
尽管大语言模型在新闻、艺术等领域的文本摘要任务上取得了良好的效果,但由于大语言模型缺乏对司法领域知识的学习,同时难以理解裁判文书的结构特征和逻辑关系,导致生成的裁判文书摘要质量不佳。该文提出结合提示学习和Qwen大语言模型的裁判文书摘要方法,将裁判文书数据作为SFT(supervised fine-tuning)技术对大语言模型微调的输入,增强其法律领域适用性;同时设计融入结构信息与角色指令的提示模板,以优化摘要生成,使其更精准地反映文书结构特征与逻辑关系。实验结果表明,该方法在ROUGE-1、 ROUGE-2和ROUGE-L的F1值上比基线模型分别提升了21.44%、28.50%和28.97%,说明大语言模型经裁判文书数据微调并引入结构信息后,在裁判文书摘要任务中展现了卓越的性能与巨大的应用潜力。
[期刊] 情报学报
[作者]
余传明 郑智梁 朱星宇 安璐
本文系统性地研究面向查询的观点摘要任务,旨在构建一种查询式观点摘要模型框架,探究不同的摘要方法对摘要效果的影响。通过综合考虑情感倾向与句子相似度,从待检文档中抽取出待摘要语句,再结合神经网络和词嵌入技术生成摘要,进而构建面向查询的观点摘要框架。从Debatepedia网站上爬取议题和论述内容构建观点摘要实验数据集,将本文方法应用到该数据集上,以检验不同模型的效果。实验结果表明,在该数据集上,仅使用基于抽取式的方法生成的观点摘要质量更高,取得了最高的平均ROUGE分数、深度语义相似度分数和情感分数,较生成式方法分别提高6.58%、1.79%和11.52%,而比组合式方法提高了8.33%、2.80%和13.86%;同时,本文提出的句子深度语义相似度和情感分数评估指标有助于更好地评估面向查询的观点摘要模型效果。研究结果对于提升面向查询的观点摘要效果,促进观点摘要模型在情报学领域的应用具有重要意义。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除