- 年份
- 2024(5974)
- 2023(8729)
- 2022(7415)
- 2021(7039)
- 2020(6010)
- 2019(14029)
- 2018(13897)
- 2017(27073)
- 2016(14295)
- 2015(16096)
- 2014(15720)
- 2013(15024)
- 2012(13228)
- 2011(11512)
- 2010(11228)
- 2009(9910)
- 2008(9129)
- 2007(7328)
- 2006(5908)
- 2005(4591)
- 学科
- 济(57771)
- 经济(57717)
- 管理(41641)
- 业(40098)
- 企(34364)
- 企业(34364)
- 方法(33549)
- 数学(30559)
- 数学方法(29942)
- 财(13844)
- 农(13771)
- 中国(12772)
- 业经(11925)
- 理论(10269)
- 贸(9695)
- 贸易(9690)
- 技术(9672)
- 地方(9594)
- 务(9461)
- 易(9451)
- 财务(9407)
- 财务管理(9384)
- 学(9224)
- 农业(9143)
- 企业财务(8888)
- 和(8614)
- 环境(8225)
- 制(7899)
- 划(7837)
- 融(6717)
- 机构
- 学院(190164)
- 大学(188277)
- 管理(81698)
- 济(77273)
- 经济(75904)
- 理学(72743)
- 理学院(72071)
- 管理学(70490)
- 管理学院(70143)
- 研究(53611)
- 中国(39349)
- 京(37165)
- 科学(33082)
- 财(32775)
- 业大(28488)
- 财经(27674)
- 中心(26657)
- 农(26571)
- 江(25544)
- 经(25510)
- 所(24128)
- 经济学(23979)
- 范(22975)
- 师范(22719)
- 研究所(22404)
- 北京(21891)
- 经济学院(21855)
- 经济管理(21707)
- 财经大学(21152)
- 商学(21055)
- 基金
- 项目(142920)
- 科学(115254)
- 基金(106618)
- 研究(103091)
- 家(92635)
- 国家(91939)
- 科学基金(81757)
- 社会(66654)
- 社会科(63450)
- 社会科学(63434)
- 基金项目(56778)
- 省(56274)
- 自然(54735)
- 自然科(53616)
- 自然科学(53606)
- 自然科学基金(52604)
- 教育(49598)
- 划(47179)
- 资助(43835)
- 编号(41482)
- 重点(32019)
- 部(31907)
- 创(31216)
- 成果(30720)
- 发(29818)
- 创新(29076)
- 教育部(28170)
- 科研(28087)
- 国家社会(28083)
- 人文(27548)
共检索到247339条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
胡吉明 陈果
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。
关键词:
主题挖掘 主题演化 动态LDA模型
[期刊] 华中师范大学学报(自然科学版)
[作者]
肖明 商慧语 肖毅 廖莉莉
为揭示并对比统计学CSSCI期刊创办至今的刊文发展趋势与热门主题,该研究收集从1985-2020年CNKI数据库收录的统计学CSSCI期刊43 001篇文献为研究对象,运用LDA主题模型及共现网络模型对热门主题及主流研究方法等指标进行热门主题与知识图谱分析,并绘制相关知识图谱.研究表明,近5年来研究方法上大量采用结构方程模型和分位数回归法,而大数据则成为近年来新增的高频词.LDA模型能够较为精确地挖掘统计学领域的热门主题和研究方法,为科研人员和决策人员开展前沿科学活动提供重要支持.
[期刊] 物流技术
[作者]
魏忠 乐玥
电商平台上存在大量的物流数据评价信息,然而,个人语言表达中存在或多或少的差异,导致主题分类词并不能很好的聚类,为商家与消费者提供决策信息。因此,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的同义主题合并的文本分类方法对在线评价进行物流主题挖掘,寻找其中更深层次的决策信息。首先,采用python3.9爬取某电商平台生鲜类、食品类、电器类、个护类、日用类及服务类产品的在线评论数据。运用TF-IDF(Term Frequency-Inverse Document Frequency)分词方法对数据集进行分词处理,获得特征词及其概率分布,利用物流行业同义词库进行特征词的同义替换,并进行概率重整合,最后进行LDA主题模型分析以及可视化分析。在数据实证算例分析中发现,在六大类的商品中,消费者对于物流的要求并不相同,商家可根据在线评论的主题挖掘结果进行物流企业的选择以满足消费者需求,物流企业也可依据此进行自身服务质量的提升。
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 情报科学
[作者]
曲靖野 陈震 胡轶楠
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的主题演化信息;在同
[期刊] 情报杂志
[作者]
王文娟 马建霞
[目的/意义]基于当前对科研项目的研究主要以数据统计和计量分析为主,以NSF资助的海洋酸化相关研究的项目数据为例,从项目主题的角度研究科研立项的重点和演化,并对未来投入趋势加以预测。[方法/过程]使用LDA主题模型对该研究的主题进行分析,计算主题强度分析演化过程,统计NSF申请书项目与支撑发表的核心论文主题强度之间的相关性,进而分析NSF海洋酸化项目的主题发展趋势。[结果/结论]发现LDA模型可以很好的发现海洋酸化的主要研究主题,且NSF资助的科研项目与支撑发表论文的主题演化规律具有一致性。使用的方法对科
关键词:
LDA NSF项目 主题演化 海洋酸化
[期刊] 情报理论与实践
[作者]
朱晓霞 宋嘉欣 孟建芳
[目的/意义]近些年来,随着互联网的快速发展,微博逐渐成为人们发表言论的一个社交网络平台。通过对大量评论信息进行情感分析,对政府进行舆情治理、企业市场决策和消费行为分析具有十分重要的意义。[方法/过程]文章针对微博评论表达的特点,提出一种基于主题—情感挖掘模型的无监督情感分类方法,通过将语义角色标注、TF-IDF和K-means聚类方法相结合,构建情感单元词表和主题—情感匹配词表,同时挖掘出评论中主题和情感的分布与联系,并利用点互信息(Pointwise Mutual Information,PMI)和情感词典的方法计算主题词的情感极性值,基于此进行情感分类。[结果/结论]经实验证明,该方法同时考虑了评论中的主题分布与情感极性信息,解决了主题模型中常见的数据稀疏问题,提高了情感分类的效率和准确性,在F值上比S-LDA模型提高了14.24%。
[期刊] 图书情报工作
[作者]
张琴 张智雄
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。
关键词:
主题模型 短语挖掘 主题短语
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 图书情报工作
[作者]
唐晓波 王洪艳
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 图书情报工作
[作者]
唐晓波 向坤
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。
关键词:
LDA 微博热度 主题模型 热点挖掘
[期刊] 情报理论与实践
[作者]
余传明 张小青 陈雷
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
关键词:
热点话题识别 热点挖掘 用户评论 模型
[期刊] 图书情报知识
[作者]
董克 陶艳
大数据是当前高速发展的新领域,也是广受关注的研究热点之一。本文以WOS数据库中大数据研究论文为分析对象,利用斯坦福主题模型工具包对大数据研究的内容进行了挖掘。分析结果表明,当前国际大数据研究集中在大数据环境下的风险控制、大数据的核心技术、特定领域中的大数据及其应用研究等三大类十五个主题;大数据核心技术和特定领域中的大数据及其应用是当前大数据研究的主要内容;目前大数据研究的主题均处于高速发展阶段;特定领域的大数据及其应用研究增速最快,将成为未来最受关注的研究方向。
关键词:
大数据 内容挖掘 主题模型 研究趋势
[期刊] 情报理论与实践
[作者]
周娜 李秀霞 高丹
[目的/意义]探究一个学科领域权威作者学术文献的研究主题和研究方法之间的关系,对后来研究者确定研究主题、选择研究方法起到一定的指导作用。[方法/过程]选取CNKI数据库中16种图书情报学核心期刊文献,统计近10年发表文献≥30篇的作者113位,共计文献6201篇,利用LDA模型提取文献主题;人工对识别出的主题进行类型划分;通过自编程序,建立作者、研究内容和研究方法之间的关系;最后通过Ucinet 6生成"作者—内容—方法"多重共现网络。[结果/结论]研究结果表明:"作者—内容—方法"多重共现网络不仅可以发现该领域的权威作者、热点研究内容,还可得到作者、研究内容与研究方法之间的关联。研究可为揭示学科领域隐性知识组合提供新的范式。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除