- 年份
- 2024(9206)
- 2023(13420)
- 2022(11809)
- 2021(11082)
- 2020(9374)
- 2019(21688)
- 2018(21380)
- 2017(41701)
- 2016(22464)
- 2015(25259)
- 2014(24930)
- 2013(24381)
- 2012(22166)
- 2011(19785)
- 2010(19204)
- 2009(17180)
- 2008(16237)
- 2007(13775)
- 2006(11702)
- 2005(9690)
- 学科
- 济(85499)
- 经济(85402)
- 管理(63301)
- 业(59435)
- 企(50019)
- 企业(50019)
- 方法(43866)
- 数学(38553)
- 数学方法(38012)
- 农(22201)
- 财(21684)
- 中国(20942)
- 学(20134)
- 业经(18781)
- 地方(16360)
- 贸(15384)
- 贸易(15379)
- 农业(14945)
- 易(14945)
- 理论(14713)
- 务(14194)
- 财务(14126)
- 财务管理(14095)
- 和(13840)
- 技术(13837)
- 环境(13566)
- 制(13548)
- 企业财务(13342)
- 划(11902)
- 银(11138)
- 机构
- 大学(310046)
- 学院(307529)
- 管理(124822)
- 济(117611)
- 经济(115109)
- 理学(109821)
- 理学院(108634)
- 管理学(106437)
- 管理学院(105917)
- 研究(100513)
- 中国(71996)
- 科学(65858)
- 京(65378)
- 农(53023)
- 财(51448)
- 业大(50488)
- 所(49718)
- 研究所(46099)
- 中心(45920)
- 财经(42590)
- 江(42572)
- 农业(42032)
- 北京(40323)
- 范(39911)
- 师范(39415)
- 经(38990)
- 院(37450)
- 经济学(34926)
- 州(34750)
- 技术(33477)
- 基金
- 项目(225434)
- 科学(176731)
- 基金(164189)
- 研究(160427)
- 家(144775)
- 国家(143624)
- 科学基金(123382)
- 社会(99472)
- 社会科(94201)
- 社会科学(94173)
- 省(88317)
- 基金项目(87746)
- 自然(83411)
- 自然科(81488)
- 自然科学(81463)
- 自然科学基金(79981)
- 划(74923)
- 教育(74024)
- 资助(67799)
- 编号(64954)
- 成果(50786)
- 重点(50501)
- 部(49149)
- 发(47410)
- 创(47110)
- 科研(44117)
- 课题(44014)
- 创新(43956)
- 计划(42211)
- 教育部(41907)
- 期刊
- 济(119034)
- 经济(119034)
- 研究(84261)
- 学报(54216)
- 中国(52343)
- 科学(48318)
- 农(46827)
- 管理(44296)
- 大学(40806)
- 学学(38519)
- 财(38339)
- 农业(32966)
- 教育(32785)
- 技术(27337)
- 融(20753)
- 金融(20753)
- 业经(20173)
- 财经(19806)
- 经济研究(19286)
- 图书(17178)
- 经(16832)
- 业(16710)
- 科技(15718)
- 问题(15440)
- 版(15101)
- 理论(14812)
- 业大(14582)
- 技术经济(14350)
- 实践(13762)
- 践(13762)
共检索到423943条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
武帅 杨秀璋 何琳 公佐权
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking, word, pattern, and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。
[期刊] 情报学报
[作者]
武帅 杨秀璋 何琳
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT (bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN (DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准主题推荐,对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。
[期刊] 图书情报工作
[作者]
王彦莹 王昊 朱惠 李晓敏
[目的 /意义]针对历史古籍事件识别问题,对比序列标注方法和文本生成方法,探究两种方法在古汉语上的表现,构建模型实现历史古籍事件识别自动化,以提高面向历史古籍构建知识图谱的效率。[方法 /过程]选取《三国志》为原始语料,序列标注实验对《三国志》事件数据集进行BMES标注,构建BBCN-SG模型,文本生成实验构建T5-SG模型,对比两种方法的表现。接下来,构建RoBERTa-SG、NEZHA-SG模型展开生成模型的对比实验。最后,结合三个文本生成模型,融入Stacking集成学习的思想,构建Stacking-TRN-SG模型。[结果 /结论 ]在历史古籍事件识别建模问题上,文本生成方法的表现明显优于序列标注方法。而在文本生成方法中,RoBERTaSG模型的识别效果综合最好。Stacking集成学习能够大大提高生成模型的识别效果,构建的Stacking-TRN-SG模型达到70.35%的召回率,初步实现历史古籍的自动事件识别。
[期刊] 图书情报工作
[作者]
林立涛 吴梦成 刘畅 胡蝶 王东波 黄水清
[目的/意义]网络学术社区中的用户生成答案质量良莠不齐,难以为用户提供高效的决策支持,筛选高可用性答案能够促进网络学术社区问答知识的高效利用。[方法/过程]从文本主题语义视角出发,提出一种基于深度预训练语言模型和多标签分类技术的问答相关性计算方法,用于实现对网络学术社区用户答案的有用性排序。该方法首先提取问题文本和答案文本的语义向量,然后进一步将其映射到领域化的主题向量空间,从而实现对问题和答案主题相似度的计算。[结果/结论 ]以“小木虫”学术社区论文投稿板块“求助完结”栏目下的所有提问及每条提问下的全部答案为实验数据,以NDCG、Q-Measure为评测指标,将本文方法与Cross-Encoder和Bi-Encoder两种基于语义的常规排序方法进行比较,发现本文方法与常规方法性能相当,但是对标注数据的需求更少。
[期刊] 图书情报工作
[作者]
吕鲲 项旻昊 靖继鹏
[目的/意义]颠覆性技术关乎国家竞争力和国际地位,科学准确地识别出颠覆性技术主题,能够解决技术发展过程中主题不够明确、发展路径不够清晰等问题,以此有效把握技术发展动态,调整国家科技战略布局,更好地抢占国际竞争制高点。[方法/过程]以能源科技领域的专利文本数据为研究客体,构建基于Word2Vec词向量与LDA(Latent Dirichlet Allocation)主题向量的融合特征向量,并引入K-means算法优化主题聚类效果,最后结合颠覆性技术特征指标,识别颠覆性技术主题,利用DTM(Dynamic Topic Model)模型揭示该领域颠覆性技术主题的发展状况。[结果/结论]通过人工验证和模型结果对比可以发现,实证结果具有合理性,且模型的精准率、召回率、F1值均高于同类型的主题模型,证明该方法对颠覆性技术主题识别具有较好效果。
[期刊] 中国图书馆学报
[作者]
郭红梅 张智雄
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 图书馆杂志
[作者]
阮光册 夏磊
本文将共现分析应用于非结构化文本文件,挖掘文本主题的语义关联。由于文本文献不同于科技文献,缺少关键字等描述信息,本文引入主题模型对文本进行语义降维,生成的主题词作为共词分析的研究对象。实验发现中频主题词能更好地反映文本的主题特征,为此,本文结合齐普夫定律和同词频理论选取中频主题词,通过共词分析识别语义关联,并采用K-means聚类算法实现主题词的聚类。本文以"创新创业"相关新闻文本进行实验,实现文本集主题词的聚类,通过实验对比分析,本文的方法能够更好地体现文本主题的语义联系。
[期刊] 中国图书馆学报
[作者]
许海云 武华维 罗瑞 董坤 李婧
当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。图4。表6。参考文献19。
[期刊] 图书情报工作
[作者]
张培晶 宋蕾
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。
关键词:
LDA 概率主题模型 微博 主题建模
[期刊] 情报科学
[作者]
王静茹 陈震
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数据时,
[期刊] 图书情报工作
[作者]
丁敬达 陈一帆 刘超 蔡微
[目的/意义]共词分析作为主题识别的重要方法,存在一定的局限和不足,将Word2Vec加权向量与共词分析相结合,有利于明确具体文献的主题归属,更好地对主题的发展演化进行分析。[方法/过程]在运用共词分析进行主题聚类的基础上,通过Word2Vec加权向量分别计算文献向量与聚类主题向量,并基于余弦相似度进行文献与主题的语义匹配。[结果/结论]国内外知识共享领域的实证分析表明,该方法能较好地将相关文献匹配至对应主题,并能从文献层面对主题特征及发展演化进行动态分析。
[期刊] 情报学报
[作者]
席笑文 郭颖 宋欣娜 王瑾
技术相似性是企业、组织或国家进行技术情报分析的重要内容,能为其识别潜在竞争关系和合作伙伴提供准确、有效的信息支持。本文针对传统LDA (latent Dirichlet allocation)主题模型忽略专利文本上下文间语义关联的问题,提出了基于word2vec和LDA主题模型的技术相似性可视化研究方法。首先,基于word2vec模型学习特征词在专利文档集合中的上下文语境信息;其次,基于LDA主题模型构建专利权人-专利-技术主题三层概率分布,并将两者融合生成"词粒度"层面的主题向量、专利文档向量及专利权人向量;再次,利用向量相似性指标计算专利权人间的语义相似度,并在此基础上构建能够直观反映专利权人与技术主题关系的二模网络;最后,以NEDD (nano enabled drug delivery)领域为例进行实证研究,证明了该模型在技术相似性测度分析中具有较好的效果。
[期刊] 情报科学
[作者]
李端明 韦 炼
【目的/意义】利用海量的非结构化资源,结合结构化资源,构建更加完善的领域本体。【方法/过程】首先运用Word2vec工具发现异构资源中的相关概念,然后进行形式化背景表示以及概念格构建,最后构建领域本体概念模型,并以protégé工具进行可视化表示。【结果/结论】实验结果表明,本文的研究方法能够从大量的异构资源中,获取丰富的领域概念和关系,构建的领域本体语义也更加丰富,能够更好地反映领域的知识结构。
[期刊] 情报学报
[作者]
刘浏 齐月 刘雏菲 李文祺 王东波
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除