- 年份
- 2024(6510)
- 2023(9471)
- 2022(8172)
- 2021(7703)
- 2020(6710)
- 2019(15536)
- 2018(15385)
- 2017(29716)
- 2016(15863)
- 2015(18015)
- 2014(17506)
- 2013(16840)
- 2012(15132)
- 2011(13194)
- 2010(12940)
- 2009(11547)
- 2008(10756)
- 2007(9014)
- 2006(7493)
- 2005(6158)
- 学科
- 济(61739)
- 经济(61671)
- 管理(44747)
- 业(43303)
- 企(37011)
- 企业(37011)
- 方法(34442)
- 数学(31147)
- 数学方法(30522)
- 财(15269)
- 农(15079)
- 中国(14459)
- 学(12985)
- 业经(12757)
- 理论(11317)
- 贸(10602)
- 贸易(10595)
- 易(10342)
- 务(10131)
- 财务(10079)
- 技术(10072)
- 财务管理(10053)
- 地方(10029)
- 农业(10013)
- 企业财务(9518)
- 制(9454)
- 和(9308)
- 环境(8690)
- 划(8237)
- 银(7773)
- 机构
- 学院(213492)
- 大学(212996)
- 管理(85742)
- 济(84079)
- 经济(82490)
- 理学(75685)
- 理学院(74936)
- 管理学(73151)
- 管理学院(72787)
- 研究(67500)
- 中国(49576)
- 科学(43896)
- 京(43719)
- 农(37598)
- 财(36147)
- 业大(35218)
- 所(33122)
- 中心(32118)
- 研究所(30718)
- 江(30370)
- 农业(29997)
- 财经(29908)
- 经(27513)
- 北京(26348)
- 经济学(25951)
- 范(25832)
- 师范(25403)
- 院(25341)
- 技术(24574)
- 州(23680)
- 基金
- 项目(157623)
- 科学(124839)
- 基金(116061)
- 研究(110127)
- 家(103308)
- 国家(102524)
- 科学基金(88715)
- 社会(69182)
- 社会科(65658)
- 社会科学(65639)
- 省(62241)
- 基金项目(61099)
- 自然(60909)
- 自然科(59612)
- 自然科学(59591)
- 自然科学基金(58506)
- 划(53157)
- 教育(52685)
- 资助(48684)
- 编号(43720)
- 重点(36029)
- 部(34705)
- 创(34001)
- 发(33381)
- 成果(33183)
- 创新(31749)
- 科研(31395)
- 计划(30727)
- 课题(29979)
- 教育部(29763)
共检索到291306条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
唐晓波 向坤
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。
关键词:
LDA 微博热度 主题模型 热点挖掘
[期刊] 情报理论与实践
[作者]
余传明 张小青 陈雷
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
关键词:
热点话题识别 热点挖掘 用户评论 模型
[期刊] 情报理论与实践
[作者]
朱晓霞 宋嘉欣 孟建芳
[目的/意义]近些年来,随着互联网的快速发展,微博逐渐成为人们发表言论的一个社交网络平台。通过对大量评论信息进行情感分析,对政府进行舆情治理、企业市场决策和消费行为分析具有十分重要的意义。[方法/过程]文章针对微博评论表达的特点,提出一种基于主题—情感挖掘模型的无监督情感分类方法,通过将语义角色标注、TF-IDF和K-means聚类方法相结合,构建情感单元词表和主题—情感匹配词表,同时挖掘出评论中主题和情感的分布与联系,并利用点互信息(Pointwise Mutual Information,PMI)和情感词典的方法计算主题词的情感极性值,基于此进行情感分类。[结果/结论]经实验证明,该方法同时考虑了评论中的主题分布与情感极性信息,解决了主题模型中常见的数据稀疏问题,提高了情感分类的效率和准确性,在F值上比S-LDA模型提高了14.24%。
[期刊] 图书情报工作
[作者]
唐晓波 王洪艳
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 图书情报工作
[作者]
胡吉明 陈果
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。
关键词:
主题挖掘 主题演化 动态LDA模型
[期刊] 华中师范大学学报(自然科学版)
[作者]
肖明 商慧语 肖毅 廖莉莉
为揭示并对比统计学CSSCI期刊创办至今的刊文发展趋势与热门主题,该研究收集从1985-2020年CNKI数据库收录的统计学CSSCI期刊43 001篇文献为研究对象,运用LDA主题模型及共现网络模型对热门主题及主流研究方法等指标进行热门主题与知识图谱分析,并绘制相关知识图谱.研究表明,近5年来研究方法上大量采用结构方程模型和分位数回归法,而大数据则成为近年来新增的高频词.LDA模型能够较为精确地挖掘统计学领域的热门主题和研究方法,为科研人员和决策人员开展前沿科学活动提供重要支持.
[期刊] 物流技术
[作者]
魏忠 乐玥
电商平台上存在大量的物流数据评价信息,然而,个人语言表达中存在或多或少的差异,导致主题分类词并不能很好的聚类,为商家与消费者提供决策信息。因此,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的同义主题合并的文本分类方法对在线评价进行物流主题挖掘,寻找其中更深层次的决策信息。首先,采用python3.9爬取某电商平台生鲜类、食品类、电器类、个护类、日用类及服务类产品的在线评论数据。运用TF-IDF(Term Frequency-Inverse Document Frequency)分词方法对数据集进行分词处理,获得特征词及其概率分布,利用物流行业同义词库进行特征词的同义替换,并进行概率重整合,最后进行LDA主题模型分析以及可视化分析。在数据实证算例分析中发现,在六大类的商品中,消费者对于物流的要求并不相同,商家可根据在线评论的主题挖掘结果进行物流企业的选择以满足消费者需求,物流企业也可依据此进行自身服务质量的提升。
[期刊] 情报理论与实践
[作者]
傅柱 王曰芬 关鹏
[目的]为了能够更为全面地探索和揭示研究领域的知识结构和热点主题,文章提出基于分类视角的LDA主题抽取方法。[方法]以国外知识流领域为研究对象,根据研究方向将知识流的相关文献分为5类。利用LDA主题模型分别对分类后的文献集进行主题抽取,筛选得到不同研究方向下的11个热点主题,并深入分析不同研究方向下热点主题所揭示的知识点。[结果]实验结果表明,基于分类视角的LDA主题抽取方法能够较为全面和细致地挖掘研究领域的学科主题和研究热点。[局限]所提的方法未能与其他主题挖掘方法进行对比,研究结果也未与现有文献中分析出的知识流领域研究热点进行对照。
[期刊] 情报科学
[作者]
曲靖野 陈震 胡轶楠
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的主题演化信息;在同
[期刊] 统计与决策
[作者]
何跃 蔡博驰
文章首先从微博用户特征、微博文本内容特征和微博信息传播特征三个维度出发构建评价微博热度的指标体系;然后运用因子分析方法从实证角度对指标体系进行合理性和有效性验证,并确立三个公共因子的权重,得到综合因子分数的评价模型;最后基于该模型对不同类别微博热度来源成分做了比较研究。实证分析结论表明:综合来说,一条微博的热度来源有39.83%来自于信息传播因子,24.50%来源于博主特征因子,16.16%来自内容特征因子,不同种类的微博热度来源类别表现也不同。
关键词:
微博热度 指标体系 因子分析
[期刊] 情报理论与实践
[作者]
裴超 肖诗斌 江敏
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
关键词:
微博 主题模型 文本聚类 k均值算法
[期刊] 图书情报工作
[作者]
盛宇
指出依据传统信息源对学科热点进行分析研究存在时间上严重滞后的缺点,提出基于微博的学科热点发现、跟踪和分析机制,论证其可行性并给出实现方法和步骤。以基于新浪微博的"数据挖掘"领域学科热点的研究作为实例,将微博结果同传统研究结果进行对比,表明该方法同传统热点分析结论有重合部分,但又可以反映出传统方法所无法反映出的最新热点。
关键词:
微博 学科热点 热点发现 数据挖掘
[期刊] 情报理论与实践
[作者]
何黎 何跃 霍叶青
文章通过对微博用户的信息和关系数据进行决策树分析、相关性分析和关联规则来挖掘用户特征,并对微博网络进行核心用户发掘。结果表明:微博中的名人具有关注数小,被关注数大的特征;用户趋向于通过关注他人和积极发布微博文章两种方法来提高被关注度;愿意公布性别或自我描述的用户,通常愿意公布地址和发布博文,而不愿意公布地址、性别或自我描述的用户,通常不愿意公布其他两项;对微博网络进行核心用户挖掘并进行个性化营销是可行的。
关键词:
微博客 用户分析 核心用户
[期刊] 情报理论与实践
[作者]
陆泉 陈仕 陈静 郝志同 朱安琪
[目的/意义]专业领域微博往往具有话题的高维稀疏性,探寻此类情境下微博热点话题挖掘的高效模型,以便相关管理部门快速掌握领域近况并进行决策。[方法/过程]提出高维稀疏情境下微博热点话题挖掘模型,引入领域词典监督预处理微博文本,基于朴素贝叶斯分类器进行特定领域信息识别,采用“密度—距离”快速搜索聚类算法实现领域热点话题挖掘,并以国土资源领域为典型进行实证。[结果/结论]本文模型能在高维稀疏情境下准确识别专业领域信息并挖掘出热点话题,有助于专业领域微博舆情分析与预警。
[期刊] 情报科学
[作者]
汪祖柱 阮振秋
【目的/意义】为进一步加强政府获取公众信息的能力、有效提高政民互动的效率。【方法/过程】使用文本分析、关联规则Apriori方法对政务微博"平安北京"的公众评论文本数据进行用户观点的挖掘与分析。【结果/结论】最终从评论数据中识别出公众对事件的关注点、公众期待等有助于政府理解民意的相关信息。
关键词:
政务微博 数据挖掘 关联规则 公众观点
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除