- 年份
- 2024(8962)
- 2023(13314)
- 2022(11796)
- 2021(11266)
- 2020(9461)
- 2019(22220)
- 2018(22285)
- 2017(43113)
- 2016(23610)
- 2015(26791)
- 2014(26820)
- 2013(26307)
- 2012(24071)
- 2011(21645)
- 2010(21741)
- 2009(19745)
- 2008(19135)
- 2007(16501)
- 2006(14486)
- 2005(12377)
- 学科
- 济(92196)
- 经济(92097)
- 管理(65455)
- 业(62411)
- 企(51824)
- 企业(51824)
- 方法(44946)
- 数学(39251)
- 数学方法(38495)
- 农(25179)
- 中国(23277)
- 学(21705)
- 财(20887)
- 业经(20030)
- 地方(19709)
- 理论(17358)
- 农业(17091)
- 和(15675)
- 技术(15465)
- 贸(15416)
- 贸易(15407)
- 制(14986)
- 易(14904)
- 环境(14050)
- 务(13347)
- 财务(13262)
- 财务管理(13239)
- 银(12730)
- 银行(12685)
- 划(12646)
- 机构
- 大学(332481)
- 学院(331102)
- 管理(132084)
- 济(123087)
- 经济(120196)
- 理学(115317)
- 理学院(113995)
- 管理学(111493)
- 管理学院(110926)
- 研究(108313)
- 中国(78791)
- 科学(71582)
- 京(71369)
- 财(55054)
- 所(54823)
- 农(54686)
- 业大(52055)
- 研究所(50497)
- 中心(49007)
- 江(47687)
- 范(45568)
- 师范(45146)
- 北京(44852)
- 财经(44827)
- 农业(42951)
- 经(40652)
- 院(39531)
- 州(39493)
- 技术(36684)
- 师范大学(36405)
- 基金
- 项目(232104)
- 科学(181706)
- 研究(168311)
- 基金(166412)
- 家(145666)
- 国家(144447)
- 科学基金(123765)
- 社会(102366)
- 社会科(96810)
- 社会科学(96779)
- 省(91957)
- 基金项目(88868)
- 自然(82906)
- 自然科(80976)
- 自然科学(80955)
- 自然科学基金(79469)
- 教育(78293)
- 划(77902)
- 编号(69799)
- 资助(69652)
- 成果(56703)
- 重点(51876)
- 部(50295)
- 发(49040)
- 创(48369)
- 课题(48248)
- 创新(45007)
- 科研(44370)
- 大学(42921)
- 教育部(42827)
- 期刊
- 济(131050)
- 经济(131050)
- 研究(92693)
- 中国(60636)
- 学报(54922)
- 科学(50476)
- 农(49085)
- 管理(47093)
- 大学(41093)
- 财(40266)
- 教育(40225)
- 学学(38129)
- 农业(34401)
- 技术(30679)
- 融(23788)
- 金融(23788)
- 业经(22097)
- 图书(21185)
- 经济研究(20335)
- 财经(20317)
- 科技(18160)
- 业(17766)
- 问题(17308)
- 经(17207)
- 技术经济(16192)
- 版(16179)
- 理论(15840)
- 资源(15663)
- 实践(14717)
- 践(14717)
共检索到470508条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
王婷婷 韩满 王宇
【目的】为提升传统LDA模型的主题识别性能,并给主题最优数目选择提供技术方案,提出基于自适应聚类的K-wrLDA模型。【方法】利用LDA和Word2Vec模型得出包含主题词概率信息及词义相关性的T-WV矩阵,并将传统LDA模型的主题数目选择问题转化为聚类效果评价问题,以内部指标伪F统计量作为目标函数,计算主题聚类数目的最优解,并对新旧两种模型的主题识别效果进行比较。【结果】经自适应聚类得出最优主题数量为33,且新模型的困惑度得分始终低于传统模型,主题识别效果对比显示新模型具有更好的凝聚性。【局限】在实证语
关键词:
主题模型 词嵌入 自适应聚类 困惑度
[期刊] 图书馆论坛
[作者]
李湘东 胡逸泉 黄莉
探索对多种类型文献进行混合分类组织时LDA主题模型的可行性及优越性。以图书、期刊、网页等不同类型的馆藏文献作为实验对象,分别采用LDA主题模型与VSM模型对实验材料进行建模,采用SVM算法实现文本混合自动分类。仿真实验表明:LDA主题模型相对VSM模型具有一定优势,混合自动分类准确率最大差距达19.9%;图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达72%以上。实验证明LDA主题模型对实现多种类型文献统一组织具有较高的可行性和适用性。
[期刊] 科技管理研究
[作者]
马文聪 雷璇 李远辉
利用中国知网(CNKI)数据,基于CiteSpace可视化文献分布情况,采用隐含狄利克雷分布(LDA)主题模型提取关键词,挖掘出文本隐含的研究主题及重要性程度;结合动态主题模型(DTM),分析不同主题内容的演化过程。结果表明,粤港澳相关研究主题主要集中于经济合作、协同治理、人才培养、环境保护、产业升级、旅游与文化六大方面。其中,经济合作和协同治理是目前研究关注的重点,人才培养和环境保护是今后主要研究趋势,且相关内容呈现不断细化特征。
[期刊] 图书情报工作
[作者]
吕鲲 项旻昊 靖继鹏
[目的/意义]颠覆性技术关乎国家竞争力和国际地位,科学准确地识别出颠覆性技术主题,能够解决技术发展过程中主题不够明确、发展路径不够清晰等问题,以此有效把握技术发展动态,调整国家科技战略布局,更好地抢占国际竞争制高点。[方法/过程]以能源科技领域的专利文本数据为研究客体,构建基于Word2Vec词向量与LDA(Latent Dirichlet Allocation)主题向量的融合特征向量,并引入K-means算法优化主题聚类效果,最后结合颠覆性技术特征指标,识别颠覆性技术主题,利用DTM(Dynamic Topic Model)模型揭示该领域颠覆性技术主题的发展状况。[结果/结论]通过人工验证和模型结果对比可以发现,实证结果具有合理性,且模型的精准率、召回率、F1值均高于同类型的主题模型,证明该方法对颠覆性技术主题识别具有较好效果。
[期刊] 图书情报工作
[作者]
关鹏 王曰芬 傅柱
[目的/意义]潜在狄利克雷分布(Latent DirichLet aLLocation,LDa)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDa主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDa在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDa主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘...
[期刊] 情报理论与实践
[作者]
叶春蕾 冷伏海
海量的科技文献中蕴含着大量揭示学科内容的主题信息。文章提出了一种新的概率模型:引文—主题概率模型,该模型对文献中的关键词和引文进行联合建模以完成科技文献中的主题内容识别,在获得主题中关键词分布的同时也获得相关主题间的引文分布。实验表明,基于引文—主题模型识别的主题信息能为进一步的主题演化分析提供一定的分析基础。
[期刊] 图书情报工作
[作者]
王燕鹏
[目的 /意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法 /过程]选取中国知网(CNKI)数据库及万方数据知识服务平台作为文献来源,检索并筛选相关文献,通过人工判读提炼出基于主题模型的科技文献主题发现及演化研究的分析流程,并采用文献分析法对流程中国内研究人员所使用到的策略、方法、分析手段等进行归纳和总结。[结果 /结论]研究已初具规模,形成较为完整的分析流程,同时各个流程环节上所涉及到的策略、方法和分析手段较为多样化。另外,也存在着一些问题:主题模型方法在科技文献领域的应用尚且不成熟,主题数目固定,缺少对主题模型应用效果的评价方...
[期刊] 情报理论与实践
[作者]
王曰芬 傅柱 陈必坤
[目的]利用LDA主题模型来探究全局主题和学科主题之间存在的差异。[方法]基于LDA主题模型,以国内知识流研究领域为例,在主题抽取的基础上,比较与分析全局主题和学科主题所存在的差异。[结果]全局主题和学科主题在可描述性、内容相关性、内容质量、学科分布4个方面具有显著的差异。[局限]采用经验判断选取了用于实验分析的全局热点主题和学科热点主题。
关键词:
LDA模型 科学文献 主题识别 知识流
[期刊] 情报科学
[作者]
马秀峰 郭顺利 宋凯
【目的 /意义】探析一个学科领域中学术文献的研究内容与研究方法之间的潜在关系,对科学研究和科研管理均具有一定的指导意义。为此,本文给出一种“内容-方法”共现分析方法。【方法 /过程】选取Web of Science数据库中国际著名的17种情报学期刊文献共12082篇,利用LDA模型提取文献主题;通过人工识别对提取的主题分别标注为研究内容和研究方法;通过自编程序,建立学术文献研究内容与研究方法的共现关系;最后通过2-模网络实现共现关系的可视化。【结果 /结论】研究结果表明,“内容-方法”共现分析不仅能够从内
[期刊] 经济问题
[作者]
杜恒波 王绍运 罗润东
中华文化通过图书走向世界舞台,是提高国家文化软实力、讲好中国故事、塑造良好国家形象的有效途径。通过Python语言工具对美国亚马逊网站上的中国图书评论数据进行分析,构建LDA主题模型,探讨中国图书出口效果,深入挖掘海外读者对中国出口图书的认知评价。研究发现,海外读者对中国图书的关注点集中于内容评价、翻译理解、服务体验、中国元素、题材情节5个方面。针对以上关注点,从图书内容、出版传播、读者反馈等角度提出了具有实践价值的建议,为推动中国图书高质量出口提供了理论参考和解决思路。
关键词:
中国图书 出口效果 亚马逊读者评论
[期刊] 情报理论与实践
[作者]
周娜 李秀霞 高丹
[目的/意义]探究一个学科领域权威作者学术文献的研究主题和研究方法之间的关系,对后来研究者确定研究主题、选择研究方法起到一定的指导作用。[方法/过程]选取CNKI数据库中16种图书情报学核心期刊文献,统计近10年发表文献≥30篇的作者113位,共计文献6201篇,利用LDA模型提取文献主题;人工对识别出的主题进行类型划分;通过自编程序,建立作者、研究内容和研究方法之间的关系;最后通过Ucinet 6生成"作者—内容—方法"多重共现网络。[结果/结论]研究结果表明:"作者—内容—方法"多重共现网络不仅可以发现该领域的权威作者、热点研究内容,还可得到作者、研究内容与研究方法之间的关联。研究可为揭示学科领域隐性知识组合提供新的范式。
[期刊] 图书情报工作
[作者]
王平
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用。针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型h LDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词。最后,利用先/后离散分析方法研究主题随时间的演化问题。实验结果验证了主题发现及演化方法的可行性及有效性。
关键词:
主题发现 主题演化 层次概率主题模型
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 情报理论与实践
[作者]
裴超 肖诗斌 江敏
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
关键词:
微博 主题模型 文本聚类 k均值算法
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除