- 年份
- 2024(6450)
- 2023(9431)
- 2022(8197)
- 2021(7640)
- 2020(6797)
- 2019(15895)
- 2018(15858)
- 2017(30751)
- 2016(16595)
- 2015(18973)
- 2014(19047)
- 2013(18784)
- 2012(17201)
- 2011(15292)
- 2010(14987)
- 2009(13816)
- 2008(13589)
- 2007(12068)
- 2006(9823)
- 2005(8456)
- 学科
- 济(70343)
- 经济(70272)
- 管理(47421)
- 业(46210)
- 方法(39563)
- 企(38119)
- 企业(38119)
- 数学(35623)
- 数学方法(35099)
- 财(18439)
- 农(17548)
- 中国(15693)
- 学(14265)
- 业经(13293)
- 贸(12717)
- 贸易(12714)
- 务(12366)
- 地方(12354)
- 易(12353)
- 财务(12319)
- 财务管理(12286)
- 企业财务(11628)
- 农业(11573)
- 制(10930)
- 和(10644)
- 理论(10560)
- 技术(10150)
- 环境(9798)
- 银(9161)
- 银行(9135)
- 机构
- 大学(237471)
- 学院(236828)
- 济(96674)
- 管理(95610)
- 经济(94717)
- 理学(83787)
- 理学院(82922)
- 管理学(81257)
- 管理学院(80812)
- 研究(73152)
- 中国(54802)
- 京(48701)
- 科学(46737)
- 财(42588)
- 农(40116)
- 业大(37656)
- 所(36247)
- 中心(35838)
- 财经(35161)
- 江(34101)
- 研究所(33356)
- 农业(31979)
- 经(31918)
- 经济学(29932)
- 北京(29624)
- 范(29184)
- 师范(28844)
- 经济学院(27326)
- 州(26822)
- 院(26542)
- 基金
- 项目(165981)
- 科学(130975)
- 基金(121937)
- 研究(117409)
- 家(106544)
- 国家(105723)
- 科学基金(91678)
- 社会(74201)
- 社会科(70491)
- 社会科学(70470)
- 省(65317)
- 基金项目(64924)
- 自然(61570)
- 自然科(60218)
- 自然科学(60200)
- 自然科学基金(59073)
- 教育(55158)
- 划(55103)
- 资助(50886)
- 编号(47404)
- 重点(37370)
- 部(37070)
- 成果(36910)
- 发(34755)
- 创(34590)
- 科研(33033)
- 创新(32404)
- 教育部(31757)
- 课题(31585)
- 大学(31348)
共检索到324971条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报杂志
[作者]
杜秀英
[目的/意义]现有文本自动摘要算法普遍存在处理速度慢、压缩率不足或摘要质量不高等问题,如何高效处理、有效利用海量文本是图书馆信息管理及服务一个重要的研究方向。[方法/过程]提出了一种云计算平台下基于聚类与语义相似分析的多文本自动摘要方法。该方法在文本向量化基础上,通过MapReduce框架对多文本进行聚类、主题抽取、主题词及语义相似词频率统计等处理,然后摘取主题句构造出多文本摘要。[结果/结论]实验结果证实,基于聚类与语义相似分析的MapReduce自动摘要架构在生成大规模多文本摘要时,不但具有较好的时间
[期刊] 情报理论与实践
[作者]
缪建明 贾广威 张运良
随着我国专利申请数量的迅猛发展,对受理专利实现快速分类的需求也越来越迫切。作为专业性知识极强的科技文献,专利自动分类的正确率远高于普通文本的分类效果。基于专利摘要进行快速自动分类的方法,充分考虑专利类别的层次结构特性,建立不同层次的类别特征中心向量,采用经典的类中心向量分类算法实现专利的快速自动分类。实验结果表明:该方法在专利不同层次上的分类效果明显,时效性大大提高,能够满足专利快速分类的实际需求。
关键词:
文本分类 专利分类 自动分类
[期刊] 情报科学
[作者]
黄文彬 倪少康
【目的/意义】多文档自动摘要技术的目的是从一组文档中精炼出重要信息摘要,减轻用户从文档中获取与理解信息的负担,是自然语言理解领域的重要研究方向之一。【方法/过程】本文提取十五年内的多文档自动摘要研究文献并筛选出至少50篇关键影响文章,梳理多文档自动摘要的概念与研究进展,揭示了最新的技术实现与实践情况。【结果/结论】基于不同技术方法对单词、句子或段落作为主要数据处理对象,找出多文档自动摘要的技术特征与难点,明确该领域的发展趋势,为未来的研究奠定了基础。
关键词:
自动摘要 多文档处理 自然语言处理
[期刊] 数据分析与知识发现
[作者]
贾晓婷 王名扬 曹宇
【目的】引入深度神经网络模型Doc2Vec,以综合考察文本的上下文语境信息。结合改进的K-means聚类算法,实现中文单文档摘要的提取。【方法】利用Doc2Vec模型,提取语句的语义、语法、语序等特征,将其转化为固定维度的向量。基于密度最大距离最远原则为K-means聚类算法选取初始聚类中心,对语句向量进行聚类。在每个类簇内计算句子的信息熵,提取类内与其他语句均具有较高相似度的句子作为摘要句。【结果】相对于传统的向量化表示方法 PLSA,利用本文方法生成的摘要效果在准确率、召回率、F值上分别提高了9.57
[期刊] 情报学报
[作者]
沈思 胡昊天 叶文豪 王东波
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
[期刊] 图书情报工作
[作者]
张晗 赵玉虹
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。
[期刊] 情报理论与实践
[作者]
唐晓波 翟夏普
[目的/意义]信息过载是当前社会面临的普遍性问题,如何从大量的信息中提取有价值的内容,已成为研究的一个重点,目前自动摘要技术成为解决此问题的一种途径。[方法/过程]为了解决多文档摘要信息不全面、冗余度高的问题,文章提出了针对中文文本的多文档自动摘要混合模型,并对该模型所包含的句子向量化、分类器分类、句群划分和句子重组四个部分做了详细说明。该混合模型在摘要提取的过程不仅考虑了句子的形式特征,还融合了句子的深层语义,最后采用基于改进的PageRank算法对摘要句进行重组。[结果/结论]当摘要句为30时,该模型的ROUGE-1得分平均值为0.2074,明显高于TextRank (0.0728)和基于聚类的算法(0.1074)。实验结果表明该模型在多主题的中文长文本上是有效的。[局限]由于中文语料的限制,本实验的数据量相对较小,模型的适应能力未在大数据集上验证。
[期刊] 情报学报
[作者]
王晓宇 王芳
鉴于关键词对大规模文献检索和文本内容分析的基础作用,本文提出了一种基于语义文本图的无监督关键词抽取算法,重点对传统基于图(graph-based)方法中的文本图构建和词加权方式进行改进。为了使文本图保留更多的语义和结构信息,算法根据单词在句子中的语义依存关系,生成由概念连接、等价隶属、功能属性和修饰限定四种属性边构成的语义文本图,省去传统图生成方法中所需要的窗口长度参数设定。在此基础上,本文提出融合关键词位置信息、概念层级和连接强度的词权重计算方法,并对词语的重要性排序,最终选择高得分节点构成摘要文本的关键词集合。在四个开放语料上的实验结果显示,本文提出的方法抽词效果优于其他三个同类baseline算法,F1值最高为0.570。
关键词:
文本图 关键词抽取 词加权 句法解析
[期刊] 情报科学
[作者]
刘家益 邹益民
【目的/意义】文本自动摘要能快速获取文本主要内容,极大提高信息使用效率,帮助人们从信息海洋中解放出来。随着互联网大数据日益深入发展,文本信息的数量已经远远超出人工处理极限,文本自动摘要研究显得越发迫切和重要。【方法/内容】本文通过对过去70年国内外文本自动摘要经典文献重要文献进行收集、整理和分析,总结归纳出六类主要文本自动摘要方法及其理念和具体做法,对比评析其优势不足,并对未来研究方向进行展望,绘制出该研究领域的一个发展全景图。【结果/结论】自动摘要方法所使用的特征经历了由简单到复杂、由个体到联系、由表层
[期刊] 情报理论与实践
[作者]
杜坤 刘怀亮 王帮金
[目的/意义]在基于向量空间模型的文本聚类中,文本相似度计算忽略特征项间语义关联,针对此问题,提出一种改进的语义文本相似度计算方法。[方法/过程]新方法利用维基百科知识库计算语义相关度,结合特征项在文本中的表示权重,构造文本相似度语义加权因子,并进行K-means文本聚类实验。[结果/结论]与传统的余弦相似度相比,改进后的语义文本相似度应用在文本聚类上,能有效提高聚类的准确度。[局限]语义相关度的计算没有对词语进行消歧处理。
[期刊] 工业工程与管理
[作者]
张东玲 高齐圣 李朝玲
为解决客户关系管理中的客户分类问题,提出了一种基于二元语义信息处理方法的聚类分析技术。在介绍二元语义和有序加权平均算子(Ordered Weighted Averaging,OWA)基本概念的基础上,构建了客户群分类分析语言信息指标体系,给出了客户聚类分析模型和计算步骤,最后进行了实例分析。
[期刊] 情报理论与实践
[作者]
胡吉明 杨云
[目的/意义]为缓解政策信息过载、提高政策阅读效率及提升政策作用发挥效果,对政策文本的核心信息进行汇总凝练并生成高质量摘要。[方法/过程]集成无监督模型和算法,提出基于句向量改进的政策文本关键句子抽取策略;将依存句法结构融合至政策文本摘要生成中,提取政策文本依存句法树及其依存句法特征,增强基于RoBERTa模型的政策文本表示效果;在基于Seq2Seq的政策文本摘要生成模型中,引入PGN模型和改进SIMCLS模型筛选出最佳候选摘要,提升模型性能与所生成摘要的质量。[结果/结论]针对国务院政策文本的摘要生成实验表明,研究构建的融合关键句子和依存句法的政策文本摘要模型与策略,在ROUGE指标的评价上显著优于其他模型,且从实例呈现上看,模型所生成摘要在语义和语言质量上均表征良好。但政策文本摘要生成的连贯性有待提升,用于学习训练的、适用的参考摘要较少,摘要生成的评价评估有待进一步完善。
[期刊] 图书情报工作
[作者]
王连喜
处理流程和梳理国内外重要研究成果的基础上,重点对自动摘要研究在文本分词、冗余度控制、质量评价、短文本自动摘要以及多语言与跨语言文本自动摘要等方面所面临的若干基本问题及其主要解决方法进行归纳和总结,并对部分研究内容的发展方向进行展望,以期为未来的自动摘要和自然语言处理研究提供有意义的参考。
[期刊] 情报学报
[作者]
王永成 许慧敏
本文概括地介绍了研究与开发中文文献自动摘要系统的必要性、突破口的选择、发展进化的简史、已达到的最新水平以及实现的诀窍
关键词:
中文,自动摘要,技术诀窍,最新水平
[期刊] 情报学报
[作者]
杨建林
本文提出了一种使用自动聚类思想的自动文摘方法 ,这种方法是进行自动文摘研究的一种新的有益的尝试。该方法首先利用词频统计方法得到文献的关键词向量、每个段落的关键词向量 ,然后利用自动聚类的方法将文献分为若干个段落类 ,从中选出与文献主题相关的段落类作为候选的用来挑出文摘句的段落类 ,最后从候选段落类中选出文摘句构成文摘
关键词:
自动文摘 自动聚类 词频统计
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除