- 年份
- 2024(9635)
- 2023(14109)
- 2022(12391)
- 2021(11744)
- 2020(9904)
- 2019(23073)
- 2018(23000)
- 2017(44836)
- 2016(24113)
- 2015(27440)
- 2014(27238)
- 2013(26533)
- 2012(23948)
- 2011(21248)
- 2010(21085)
- 2009(19050)
- 2008(18255)
- 2007(15627)
- 2006(13439)
- 2005(11199)
- 学科
- 济(94645)
- 经济(94543)
- 管理(71890)
- 业(67502)
- 企(57772)
- 企业(57772)
- 方法(50166)
- 数学(43855)
- 数学方法(43063)
- 财(24367)
- 农(23745)
- 中国(22270)
- 业经(21338)
- 学(20902)
- 理论(18126)
- 地方(17340)
- 务(16914)
- 财务(16827)
- 财务管理(16790)
- 农业(16001)
- 企业财务(15918)
- 技术(15665)
- 贸(15624)
- 贸易(15616)
- 和(15510)
- 易(15170)
- 制(14586)
- 环境(14387)
- 划(13285)
- 银(12106)
- 机构
- 大学(336797)
- 学院(336013)
- 管理(139397)
- 济(126932)
- 经济(124129)
- 理学(122249)
- 理学院(120970)
- 管理学(118349)
- 管理学院(117747)
- 研究(103028)
- 中国(74991)
- 京(70642)
- 科学(66546)
- 财(56736)
- 业大(52000)
- 农(51385)
- 所(50098)
- 中心(48335)
- 财经(47031)
- 江(46675)
- 研究所(46153)
- 北京(43831)
- 范(43557)
- 师范(43136)
- 经(42846)
- 农业(40390)
- 州(38551)
- 院(38051)
- 经济学(37434)
- 技术(36764)
- 基金
- 项目(240663)
- 科学(189778)
- 基金(175086)
- 研究(174103)
- 家(152564)
- 国家(151333)
- 科学基金(131609)
- 社会(107778)
- 社会科(102157)
- 社会科学(102128)
- 省(94458)
- 基金项目(93051)
- 自然(88277)
- 自然科(86314)
- 自然科学(86295)
- 自然科学基金(84702)
- 教育(81684)
- 划(79370)
- 资助(73250)
- 编号(72086)
- 成果(56755)
- 重点(53270)
- 部(52483)
- 创(50136)
- 发(49790)
- 课题(48420)
- 创新(46674)
- 科研(46520)
- 教育部(45262)
- 大学(45209)
- 期刊
- 济(127472)
- 经济(127472)
- 研究(89872)
- 中国(56885)
- 学报(53826)
- 管理(49230)
- 科学(48408)
- 农(44985)
- 财(43466)
- 大学(40786)
- 学学(38196)
- 教育(38099)
- 技术(32461)
- 农业(31816)
- 业经(22054)
- 融(22034)
- 金融(22034)
- 图书(21787)
- 财经(21656)
- 经济研究(20676)
- 经(18343)
- 统计(17152)
- 技术经济(16787)
- 理论(16538)
- 科技(16455)
- 业(16398)
- 问题(16328)
- 情报(15873)
- 版(15526)
- 策(15438)
共检索到461830条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报学报
[作者]
李湘东 丁丛 高凡
以书目信息为分类对象的自动分类研究对信息资源组织具有重要意义。本文以概率主题模型LDA作为书目信息的文本表示模型,以克服因文本短小而产生的特征稀疏问题;以书目信息的体例结构和所在类目的类别区分能力分别实现两种不同的特征加权策略,在此基础上构建复合加权策略,使获取的特征词集既不向高频词倾斜,也更能代表书目信息的所属类别。将复合加权策略融合于LDA、提出一种基于复合加权LDA的书目信息分类方法。使用公开和自建的书目信息语料进行对比实验,验证和分析复合加权策略的有效性,实验显示本文提出的复合加权LDA分类方法的
[期刊] 现代情报
[作者]
廖列法 勒孚刚
[目的 /意义]运用概率主题模型全面研究专利文献主题演化,分析专利技术发展过程及趋势。[方法/过程]LDA模型按时间窗口对专利文本建模,困惑度确定最优主题数,按专利文本结构特性提取主题向量,采用JS散度度量主题之间的关联,引入IPC分类号度量技术主题强度,最后实现主题强度、主题内容和技术主题强度3方面的演化研究。[结果 /结论]实验结果表明:该方法能够深入挖掘专利文献的主题,可以较好地分析专利技术随时间的演化规律,帮助相关从业人员了解专利技术的演化过程及趋势。
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 现代情报
[作者]
廖列法 勒孚刚 朱亚兰
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。
[期刊] 图书情报工作
[作者]
杨超 朱东华 汪雪锋 朱福进 衡晓帆
[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(P&S)模式,基于"bagofP&S"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 图书馆论坛
[作者]
李湘东 胡逸泉 黄莉
探索对多种类型文献进行混合分类组织时LDA主题模型的可行性及优越性。以图书、期刊、网页等不同类型的馆藏文献作为实验对象,分别采用LDA主题模型与VSM模型对实验材料进行建模,采用SVM算法实现文本混合自动分类。仿真实验表明:LDA主题模型相对VSM模型具有一定优势,混合自动分类准确率最大差距达19.9%;图书与学术性期刊、网页与非学术性期刊之间的混合分类效果较好,分类准确率可达72%以上。实验证明LDA主题模型对实现多种类型文献统一组织具有较高的可行性和适用性。
[期刊] 工业工程与管理
[作者]
黄琳 王丽亚 明新国
在线评论作为客户购后主要的信息分享方式,潜藏着大量的客户需求,LDA模型常被用来挖掘评论主题,以此导出客户需求。但客户对于产品服务的在线评论往往会与有关产品自身性能的评论混杂在一起,直接应用LDA模型会存在主题指代不明、关键词混乱的问题。本文提出了一种改进的LDA模型,该模型通过将根据客户-产品服务画像得来的先验知识整合进LDA模型中,以此来引导模型学习与产品服务相关的特定主题,进而使导出的产品服务需求更贴合实际需要且更具预测性。
[期刊] 情报理论与实践
[作者]
裴超 肖诗斌 江敏
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
关键词:
微博 主题模型 文本聚类 k均值算法
[期刊] 图书情报工作
[作者]
杨波 邵婉婷
[目的/意义]针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程]基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论]以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。
[期刊] 情报理论与实践
[作者]
叶艳 吴鹏 周知 黄炜 张莉曼
[目的/意义]为了从在线患者评论中识别医疗服务质量主题及其情感,本文提出基于LDA和BiLSTM模型的服务质量主题情感识别模型。[方法/过程]以好大夫在线为例,利用Python收集高血压患者139962条评价数据,采用LDA主题模型得到患者评论的13个主题,并结合相关文献得到6大医疗服务质量主题;根据BiLSTM模型得到各服务质量主题的情感倾向分布;对负向评论较多的服务质量主题进行筛选,分析负向情感产生的原因。[结果/结论]本文提出的方法能帮助医院和医生识别和改善医疗服务质量,提升患者的满意度,从而降低医患纠纷的发生率。
[期刊] 现代情报
[作者]
马林山 郭磊
文章概述了主题概率模型(LDA)的计算原理和方法,以及开源R语言中lda程序包采用快速压缩吉普抽样算法分析语料库的处理流程。设计了基于LDA模型的查新辅助分析系统设计功能框架,对其功能、编程实现思路和工作流程做了描述。最后结合课题查新实例,详述了采用LDA模型通过相关文献关键词进行潜在主题挖掘,对比分析课题研究内容,对课题给出客观评价的过程。结果表明,基于主题模型的查新辅助分析系统可以快速有效挖掘相关文献主题,降低查新员对相关文献的分析难度,提高课题评价的客观性,整体辅助分析效果良好。
关键词:
主题模型 R语言 查新 课题评价
[期刊] 情报科学
[作者]
马秀峰 郭顺利 宋凯
【目的 /意义】探析一个学科领域中学术文献的研究内容与研究方法之间的潜在关系,对科学研究和科研管理均具有一定的指导意义。为此,本文给出一种“内容-方法”共现分析方法。【方法 /过程】选取Web of Science数据库中国际著名的17种情报学期刊文献共12082篇,利用LDA模型提取文献主题;通过人工识别对提取的主题分别标注为研究内容和研究方法;通过自编程序,建立学术文献研究内容与研究方法的共现关系;最后通过2-模网络实现共现关系的可视化。【结果 /结论】研究结果表明,“内容-方法”共现分析不仅能够从内
[期刊] 情报理论与实践
[作者]
周娜 李秀霞 高丹
[目的/意义]探究一个学科领域权威作者学术文献的研究主题和研究方法之间的关系,对后来研究者确定研究主题、选择研究方法起到一定的指导作用。[方法/过程]选取CNKI数据库中16种图书情报学核心期刊文献,统计近10年发表文献≥30篇的作者113位,共计文献6201篇,利用LDA模型提取文献主题;人工对识别出的主题进行类型划分;通过自编程序,建立作者、研究内容和研究方法之间的关系;最后通过Ucinet 6生成"作者—内容—方法"多重共现网络。[结果/结论]研究结果表明:"作者—内容—方法"多重共现网络不仅可以发现该领域的权威作者、热点研究内容,还可得到作者、研究内容与研究方法之间的关联。研究可为揭示学科领域隐性知识组合提供新的范式。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除