- 年份
- 2024(6401)
- 2023(9394)
- 2022(8505)
- 2021(8007)
- 2020(6814)
- 2019(15932)
- 2018(16066)
- 2017(31213)
- 2016(16979)
- 2015(19339)
- 2014(19269)
- 2013(19016)
- 2012(17174)
- 2011(15396)
- 2010(15225)
- 2009(13598)
- 2008(13130)
- 2007(11213)
- 2006(9571)
- 2005(8127)
- 学科
- 济(64484)
- 经济(64415)
- 管理(47637)
- 业(44732)
- 企(37989)
- 企业(37989)
- 方法(33486)
- 数学(29062)
- 数学方法(28537)
- 学(16000)
- 农(15841)
- 中国(15577)
- 财(15311)
- 业经(13851)
- 地方(13052)
- 理论(11898)
- 贸(11430)
- 贸易(11422)
- 和(11172)
- 易(11068)
- 技术(10634)
- 农业(10617)
- 环境(10300)
- 务(10285)
- 财务(10221)
- 财务管理(10202)
- 制(9976)
- 企业财务(9621)
- 教育(9338)
- 划(9239)
- 机构
- 大学(237611)
- 学院(235370)
- 管理(97424)
- 济(86690)
- 理学(85506)
- 经济(84596)
- 理学院(84573)
- 管理学(82796)
- 管理学院(82400)
- 研究(75362)
- 中国(54415)
- 京(51126)
- 科学(50400)
- 财(38091)
- 业大(38012)
- 农(37858)
- 所(37788)
- 研究所(34911)
- 中心(34116)
- 江(32596)
- 北京(32146)
- 财经(31479)
- 范(31025)
- 师范(30729)
- 农业(29906)
- 经(28578)
- 院(27817)
- 州(26990)
- 技术(26202)
- 师范大学(24852)
- 基金
- 项目(169515)
- 科学(132651)
- 基金(122761)
- 研究(121468)
- 家(107263)
- 国家(106402)
- 科学基金(91787)
- 社会(73647)
- 社会科(69754)
- 社会科学(69734)
- 省(66751)
- 基金项目(65748)
- 自然(62561)
- 自然科(61116)
- 自然科学(61106)
- 自然科学基金(59932)
- 划(56217)
- 教育(55772)
- 资助(51693)
- 编号(49948)
- 成果(39725)
- 重点(37394)
- 部(36402)
- 发(34989)
- 创(34965)
- 课题(33968)
- 科研(32902)
- 创新(32541)
- 大学(31398)
- 计划(31319)
共检索到328029条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
贾晓婷 王名扬 曹宇
【目的】引入深度神经网络模型Doc2Vec,以综合考察文本的上下文语境信息。结合改进的K-means聚类算法,实现中文单文档摘要的提取。【方法】利用Doc2Vec模型,提取语句的语义、语法、语序等特征,将其转化为固定维度的向量。基于密度最大距离最远原则为K-means聚类算法选取初始聚类中心,对语句向量进行聚类。在每个类簇内计算句子的信息熵,提取类内与其他语句均具有较高相似度的句子作为摘要句。【结果】相对于传统的向量化表示方法 PLSA,利用本文方法生成的摘要效果在准确率、召回率、F值上分别提高了9.57
[期刊] 情报科学
[作者]
黄文彬 倪少康
【目的/意义】多文档自动摘要技术的目的是从一组文档中精炼出重要信息摘要,减轻用户从文档中获取与理解信息的负担,是自然语言理解领域的重要研究方向之一。【方法/过程】本文提取十五年内的多文档自动摘要研究文献并筛选出至少50篇关键影响文章,梳理多文档自动摘要的概念与研究进展,揭示了最新的技术实现与实践情况。【结果/结论】基于不同技术方法对单词、句子或段落作为主要数据处理对象,找出多文档自动摘要的技术特征与难点,明确该领域的发展趋势,为未来的研究奠定了基础。
关键词:
自动摘要 多文档处理 自然语言处理
[期刊] 图书情报工作
[作者]
曹祺 赵伟 张英杰 赵树君 陈亮
[目的/意义]专利相似度检测(Similarity Measurement)可从宏观上辅助制定国家创新战略规划,发现国内外的热点及应对其他国家的专利流氓,从微观上为专利发明人、专利审查员、专利权人提供辅助支撑。[方法/过程]提出基于深度学习的Doc2Vec专利相似度分析方法,基于未进行清洗的专利语料库,采用深度学习的Doc2Vec模型,随机挑选了专利,研究了专利相似度检测问题,并和传统的相似度检测模型进行对比研究。[结果/结论]实验结果表明,基于深度学习的Doc2Vec模型和TF-IDF模型对于处理不做数据清洗的专利语料的结果有相近性,该方法对分析人员的专利领域知识要求较低,不需要对专利数据进行基于专利领域知识的数据清洗,同时可为专利侵权、专利查新提供新的智能工具支撑,降低研究门槛和工作量,提升研究效率。
关键词:
专利 相似度 深度学习 Doc2Vec
[期刊] 情报杂志
[作者]
杜秀英
[目的/意义]现有文本自动摘要算法普遍存在处理速度慢、压缩率不足或摘要质量不高等问题,如何高效处理、有效利用海量文本是图书馆信息管理及服务一个重要的研究方向。[方法/过程]提出了一种云计算平台下基于聚类与语义相似分析的多文本自动摘要方法。该方法在文本向量化基础上,通过MapReduce框架对多文本进行聚类、主题抽取、主题词及语义相似词频率统计等处理,然后摘取主题句构造出多文本摘要。[结果/结论]实验结果证实,基于聚类与语义相似分析的MapReduce自动摘要架构在生成大规模多文本摘要时,不但具有较好的时间
[期刊] 情报学报
[作者]
王永成 许慧敏
本文概括地介绍了研究与开发中文文献自动摘要系统的必要性、突破口的选择、发展进化的简史、已达到的最新水平以及实现的诀窍
关键词:
中文,自动摘要,技术诀窍,最新水平
[期刊] 情报理论与实践
[作者]
阮光册 夏磊
[目的/意义]将深度学习方法应用于热点识别的研究,实现研究热点的语义描述。[方法/过程]以教育学36本CSSCI期刊的62084篇论文为实验数据。首先,采用Doc2Vec方法对论文摘要进行向量计算;其次,对向量值进行相似度计算,生成热点选题论文集;最后,运用聚类算法和主题词提取算法获取论文热点选题的主题描述。[结果/结论]对比词频统计和共词聚类方法,本文的实验结果在研究热点的描述上具有更好的语义特征。[局限]热点选题论文集的生成受阈值的影响。深度学习可以作为揭示学科研究热点的新方法。
[期刊] 情报理论与实践
[作者]
唐晓波 翟夏普
[目的/意义]信息过载是当前社会面临的普遍性问题,如何从大量的信息中提取有价值的内容,已成为研究的一个重点,目前自动摘要技术成为解决此问题的一种途径。[方法/过程]为了解决多文档摘要信息不全面、冗余度高的问题,文章提出了针对中文文本的多文档自动摘要混合模型,并对该模型所包含的句子向量化、分类器分类、句群划分和句子重组四个部分做了详细说明。该混合模型在摘要提取的过程不仅考虑了句子的形式特征,还融合了句子的深层语义,最后采用基于改进的PageRank算法对摘要句进行重组。[结果/结论]当摘要句为30时,该模型的ROUGE-1得分平均值为0.2074,明显高于TextRank (0.0728)和基于聚类的算法(0.1074)。实验结果表明该模型在多主题的中文长文本上是有效的。[局限]由于中文语料的限制,本实验的数据量相对较小,模型的适应能力未在大数据集上验证。
[期刊] 情报理论与实践
[作者]
缪建明 贾广威 张运良
随着我国专利申请数量的迅猛发展,对受理专利实现快速分类的需求也越来越迫切。作为专业性知识极强的科技文献,专利自动分类的正确率远高于普通文本的分类效果。基于专利摘要进行快速自动分类的方法,充分考虑专利类别的层次结构特性,建立不同层次的类别特征中心向量,采用经典的类中心向量分类算法实现专利的快速自动分类。实验结果表明:该方法在专利不同层次上的分类效果明显,时效性大大提高,能够满足专利快速分类的实际需求。
关键词:
文本分类 专利分类 自动分类
[期刊] 图书情报工作
[作者]
王连喜
处理流程和梳理国内外重要研究成果的基础上,重点对自动摘要研究在文本分词、冗余度控制、质量评价、短文本自动摘要以及多语言与跨语言文本自动摘要等方面所面临的若干基本问题及其主要解决方法进行归纳和总结,并对部分研究内容的发展方向进行展望,以期为未来的自动摘要和自然语言处理研究提供有意义的参考。
[期刊] 图书情报工作
[作者]
袁琳 孙巍 马晓敏 李周晶 项芮
[目的/意义]针对现有文本自动摘要形成过程中重要技术节点——图模型框架下摘要知识表达方式中内容语义揭示深度不够的问题,提出报道性新闻自动摘要模型方案,为相关领域利用经过摘要处理后的网页报道性新闻文本数据开展实践研究提供借鉴参考。[方法/过程]利用ETM(Embedded Topic Model)融合词向量的主题模型分析工具,在图模型框架下针对目标摘要句的主题构造环节,加入主题重要度特征和语义相关性特征并重新设计报道性新闻句间统计特征,对报道性新闻文本深层次主题语义信息进行挖掘、过滤,以此初步形成报道性新闻自动摘要抽取模型;后续依据报道性新闻摘要主要功能需求提出摘要主题测度功能量化指标体系,建立测度标准与句子统计特征量化方法的对应关系,以此优化调整提出的报道性新闻自动摘要抽取模型。[结果/结论 ]利用图模型框架下的报道性新闻自动摘要方法具体选取农业领域科技动态报道性新闻的摘要抽取过程进行实证,建立报道性新闻自动摘要测度标准进一步得到优化后报道性新闻摘要模型方案,结果显示在外部报道性功能及内部ROUGE评价测评综合表现上优于对比方法,可以有效提高报道性新闻自动摘要抽取的准确性。
[期刊] 情报学报
[作者]
陈福集 杨善林
近年来Internet迅猛发展 ,网上的信息急剧膨胀 ,如何高效、高质量地检索到用户所感兴趣的中文信息资源 ,是当前我国Internet资源发现的热点问题之一。本文将神经网络聚类方法之一SOM(Self OrganizingMap ,自组织特征映射 )的思想和方法引入中文Web搜索引擎 ,首先探讨了其网络模型和算法 ,而后提出一种聚类用户所感兴趣的中文Web文档的层次聚类方法 ,从而提高中文Web文档的检索质量
[期刊] 图书馆论坛
[作者]
吴娜 刘畅 刘江峰 王东波
作为自然语言处理中的关键任务,旨在压缩长文本信息、解决文本信息过载问题。文章以《二十四史》中的人物列传语料为例,从抽取式和生成式方法出发,探索AIGC技术驱动下古籍文本自动摘要应用的可行路径,为古籍资源的创造性转化和创新性发展提供参考,助力数字人文理念下的古籍内容价值实现。首先基于GujiBERT、SikuBERT、Bert-ancient-chinese模型进行语义表征,并使用LexRank算法进行重要性排序以抽取摘要。然后利用GPT-3.5-turbo、GPT-4和ChatGLM3模型生成摘要,并构建ChatGLM3和GPT-3.5-turbo微调模型。最后采用信息覆盖率和信息多样性指标对抽取式摘要结果进行评测,采用rouge和mauve指标对生成式摘要结果进行评测。研究表明:SikuBERT在抽取式摘要任务中对古文的语义表征能力和理解能力较强;通用大语言模型在古籍领域的自动摘要能力各有特色,但主旨提炼能力有所欠缺;通过小样本数据集微调GPT-3.5-turbo和ChatGLM3模型能有效提升模型的摘要生成能力。
[期刊] 情报科学
[作者]
刘家益 邹益民
【目的/意义】文本自动摘要能快速获取文本主要内容,极大提高信息使用效率,帮助人们从信息海洋中解放出来。随着互联网大数据日益深入发展,文本信息的数量已经远远超出人工处理极限,文本自动摘要研究显得越发迫切和重要。【方法/内容】本文通过对过去70年国内外文本自动摘要经典文献重要文献进行收集、整理和分析,总结归纳出六类主要文本自动摘要方法及其理念和具体做法,对比评析其优势不足,并对未来研究方向进行展望,绘制出该研究领域的一个发展全景图。【结果/结论】自动摘要方法所使用的特征经历了由简单到复杂、由个体到联系、由表层
[期刊] 情报学报
[作者]
沈思 胡昊天 叶文豪 王东波
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题。以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比。本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%。与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%。
[期刊] 情报学报
[作者]
史磊 王永成
信息爆炸和Internet的迅速普及 ,使得英文文献摘要的自动编制工作越来越重要。本文对英文文献自动摘要系统的结构进行了研究 ,介绍了该系统的体系结构、主要构成、设计思想及其基本原理。
关键词:
英文文献 自动摘要 仿人算法
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除