- 年份
- 2024(10803)
- 2023(15814)
- 2022(13978)
- 2021(13157)
- 2020(11331)
- 2019(26562)
- 2018(26599)
- 2017(51506)
- 2016(28241)
- 2015(32258)
- 2014(32493)
- 2013(32065)
- 2012(29350)
- 2011(26262)
- 2010(26344)
- 2009(24192)
- 2008(23698)
- 2007(21013)
- 2006(17812)
- 2005(15280)
- 学科
- 济(113147)
- 经济(113023)
- 管理(80585)
- 业(77805)
- 企(65069)
- 企业(65069)
- 方法(58628)
- 数学(51770)
- 数学方法(50950)
- 农(29842)
- 财(28353)
- 中国(26948)
- 学(25483)
- 业经(23921)
- 地方(21922)
- 贸(20396)
- 贸易(20387)
- 理论(19954)
- 农业(19868)
- 易(19777)
- 务(18819)
- 财务(18729)
- 财务管理(18685)
- 制(18564)
- 和(17868)
- 企业财务(17641)
- 技术(17317)
- 环境(16901)
- 银(15394)
- 银行(15337)
- 机构
- 学院(403414)
- 大学(402688)
- 管理(160914)
- 济(155258)
- 经济(151762)
- 理学(140711)
- 理学院(139172)
- 管理学(136252)
- 管理学院(135544)
- 研究(128334)
- 中国(93814)
- 京(84719)
- 科学(83880)
- 财(68947)
- 农(68204)
- 所(65057)
- 业大(64104)
- 研究所(59860)
- 中心(59465)
- 江(57854)
- 财经(56496)
- 农业(53937)
- 北京(52934)
- 范(52582)
- 师范(52014)
- 经(51255)
- 州(47169)
- 院(46567)
- 经济学(46136)
- 技术(44561)
- 基金
- 项目(280653)
- 科学(219050)
- 基金(201916)
- 研究(200880)
- 家(176606)
- 国家(175165)
- 科学基金(150259)
- 社会(123086)
- 社会科(116548)
- 社会科学(116513)
- 省(111493)
- 基金项目(107484)
- 自然(101024)
- 自然科(98675)
- 自然科学(98646)
- 自然科学基金(96815)
- 教育(94251)
- 划(93626)
- 资助(85009)
- 编号(83266)
- 成果(66292)
- 重点(62773)
- 部(61177)
- 发(58934)
- 创(57962)
- 课题(56959)
- 科研(54468)
- 创新(54032)
- 大学(52353)
- 教育部(52064)
- 期刊
- 济(160666)
- 经济(160666)
- 研究(108749)
- 中国(69554)
- 学报(66874)
- 农(60612)
- 科学(60066)
- 管理(55931)
- 财(53174)
- 大学(49952)
- 学学(47178)
- 教育(44245)
- 农业(42058)
- 技术(37683)
- 融(28808)
- 金融(28808)
- 业经(27710)
- 财经(26448)
- 经济研究(25943)
- 经(22443)
- 业(22146)
- 问题(21228)
- 图书(20948)
- 统计(20282)
- 技术经济(20233)
- 版(19687)
- 科技(19272)
- 理论(18918)
- 商业(18374)
- 策(18295)
共检索到560829条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 图书情报工作
[作者]
唐晓波 王洪艳
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 情报理论与实践
[作者]
朱晓霞 宋嘉欣 孟建芳
[目的/意义]近些年来,随着互联网的快速发展,微博逐渐成为人们发表言论的一个社交网络平台。通过对大量评论信息进行情感分析,对政府进行舆情治理、企业市场决策和消费行为分析具有十分重要的意义。[方法/过程]文章针对微博评论表达的特点,提出一种基于主题—情感挖掘模型的无监督情感分类方法,通过将语义角色标注、TF-IDF和K-means聚类方法相结合,构建情感单元词表和主题—情感匹配词表,同时挖掘出评论中主题和情感的分布与联系,并利用点互信息(Pointwise Mutual Information,PMI)和情感词典的方法计算主题词的情感极性值,基于此进行情感分类。[结果/结论]经实验证明,该方法同时考虑了评论中的主题分布与情感极性信息,解决了主题模型中常见的数据稀疏问题,提高了情感分类的效率和准确性,在F值上比S-LDA模型提高了14.24%。
[期刊] 图书情报工作
[作者]
唐晓波 向坤
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。
关键词:
LDA 微博热度 主题模型 热点挖掘
[期刊] 图书情报工作
[作者]
金聪 刘金安 金枢炜
针对图像的特性,给出一种图像的二元视觉语言模型,在此基础上提出一种新的图像语义挖掘方法。该方法将每幅图像表示成一个由视觉单词构成的矩阵,通过计算每个视觉单词的权重,按照权重的大小对视觉单词进行选择,利用选择后的视觉单词集合,构建图像的视觉语言模型;之后,按照贝叶斯公式,建立基于视觉语言模型的图像语义挖掘方法。实验结果表明,该方法在图像语义描述能力和区分性方面是有效的,能充分反映人对图像内容的理解,具有很好的应用价值。
[期刊] 情报科学
[作者]
曲靖野 陈震 胡轶楠
【目的/意义】大数据时代文本主题挖掘在情报分析领域中的作用日趋重要,通过特征比较共词分析和LDA模型分析两种主流文本主题挖掘方法,研究两者的具体特点,为相关人员合理地运用文本主题挖掘方法处理数据提供一定的参考。【方法/过程】本文分两种情况对比研究:第一、两者挖掘不同时段同一种类文本数据的主题分布信息和主题演化信息的能力;第二、两者挖掘同一时段不同种类文本数据的提取正确主题的能力。【结果/结论】在不同时段LDA模型分析与共词分析相比挖掘主题分布信息的能力可不断提升,并且其可挖掘出更加细化的主题演化信息;在同
[期刊] 华中师范大学学报(自然科学版)
[作者]
肖明 商慧语 肖毅 廖莉莉
为揭示并对比统计学CSSCI期刊创办至今的刊文发展趋势与热门主题,该研究收集从1985-2020年CNKI数据库收录的统计学CSSCI期刊43 001篇文献为研究对象,运用LDA主题模型及共现网络模型对热门主题及主流研究方法等指标进行热门主题与知识图谱分析,并绘制相关知识图谱.研究表明,近5年来研究方法上大量采用结构方程模型和分位数回归法,而大数据则成为近年来新增的高频词.LDA模型能够较为精确地挖掘统计学领域的热门主题和研究方法,为科研人员和决策人员开展前沿科学活动提供重要支持.
[期刊] 物流技术
[作者]
魏忠 乐玥
电商平台上存在大量的物流数据评价信息,然而,个人语言表达中存在或多或少的差异,导致主题分类词并不能很好的聚类,为商家与消费者提供决策信息。因此,提出了一种基于LDA(Latent Dirichlet Allocation)主题模型的同义主题合并的文本分类方法对在线评价进行物流主题挖掘,寻找其中更深层次的决策信息。首先,采用python3.9爬取某电商平台生鲜类、食品类、电器类、个护类、日用类及服务类产品的在线评论数据。运用TF-IDF(Term Frequency-Inverse Document Frequency)分词方法对数据集进行分词处理,获得特征词及其概率分布,利用物流行业同义词库进行特征词的同义替换,并进行概率重整合,最后进行LDA主题模型分析以及可视化分析。在数据实证算例分析中发现,在六大类的商品中,消费者对于物流的要求并不相同,商家可根据在线评论的主题挖掘结果进行物流企业的选择以满足消费者需求,物流企业也可依据此进行自身服务质量的提升。
[期刊] 图书情报工作
[作者]
张琴 张智雄
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。
关键词:
主题模型 短语挖掘 主题短语
[期刊] 情报理论与实践
[作者]
陈斌 马静
[目的/意义]为了弥补LDA模型建模过程中未考虑到网络文本中文档关注度和质量度这一因素,并增强结果的语义可解释性和主题表示能力,文章提出了一种热度加权的HLDA-IDF的网络文本主题挖掘模型。[方法/过程]本文首先是给出了较为准确的热度定义,并对LDA模型进行热度加权,构建出了HLDA模型,再依据词汇的主题表示能力存在差异这一实际情况,引入TF-IDF算法并改进,构建出HLDA-IDF模型,最后利用实际论坛数据进行实验验证。[结果/结论]实验结果表明该模型的结果语义可解释性和主题表示能力较强。
关键词:
热度 模型 主题挖掘 网络文本 文本挖掘
[期刊] 中国科学技术大学学报
[作者]
邱镇 王琪媛 刘迪 孟洪民
大数据反映了人们的生活习惯、社会规律以及自然规律.数据流作为大数据最重要的表现形式之一,应用的范围非常广泛.在实际的数据流应用领域中,连续数据点组成的波段在宏观层次上展示了丰富的语义,因此以模式(波段)为粒度来表达数据流显得尤为重要.为此基于SP-tree挖掘的可伸缩模式,提出了Pattern2vec的方法,将可伸缩模式向量化,利用向量来发现数据流上潜在的隐含语义,完成分类工作.在医疗和电力数据开展实验,实验结果表明,Pattern2vec相比其他对比方法,具有更好的分类表现.
[期刊] 情报理论与实践
[作者]
唐晓波 肖璐
在社会化网络环境下,关于产品的评论成为企业竞争情报分析重要的数据源。这些评论中包含用户对产品各个方面的情感倾向,对其进行情感分析可以帮助商家了解产品的优缺点。针对现有情感分析的不足,本文在构建评论挖掘模型时综合采用了共词分析和基于句法分析的极性传递法。共词分析可定量确定用户关心的产品维度;极性传递算法考虑句子结构特点,在对句子级文本做情感分析时相较传统情感分类算法有更好的分析效果。同时,引入极性值和强度值计算情感词和主题词的情感强度。
关键词:
情感分析 评论挖掘 共词分析
[期刊] 图书情报工作
[作者]
胡吉明 陈果
指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于LDA主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的LDA模型,并通过改进的Gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。
关键词:
主题挖掘 主题演化 动态LDA模型
[期刊] 情报理论与实践
[作者]
蔡皎洁
文章提出两种Web环境下的语义挖掘模型,分别是基于语义标注的Web语义挖掘模型,即在语义标注的基础上实现智能化知识挖掘过程,获取高质量知识模式;基于本体映射的Web语义挖掘模型,即参照领域本体概念体系,运用本体映射技术,对所获取的知识模式进行语义修正。通过对语义分类模式的预测准确率、模型创建速度的实验对比分析,基于本体映射的Web语义挖掘模型所提出的算法略占优势。
关键词:
语义挖掘 语义标注 本体映射 语义网
[期刊] 情报理论与实践
[作者]
梁晓贺 田儒雅 吴蕾 张学福
[目的/意义]微博舆情的形成是一个多层面、错综复杂的过程,可采用超网络描述和揭示。[方法/过程]构建了包含用户—观点—情感—时序阶段4层子网的超网络模型,并将该模型应用于"毒疫苗"事件这一具体实例中。[结果/结论]研究表明,舆情主题发现超网络模型的子网分析可揭示每层子网的特征信息,超边分析可用于舆情预警分析、舆情主题挖掘及舆情主题演化分析。[局限]下一步研究将从细化指标、多重验证两个方面对模型进行完善。
关键词:
微博 舆情 主题挖掘 超网络
[期刊] 情报科学
[作者]
王正成 袁竹星
【目的/意义】在微博中,意见领袖对于消息的传播以及舆情走向起着关键的作用。然而,现有的意见领袖研究大多忽略了意见领袖在特定话题下的意见代表性。【方法/过程】提出了面向主题的微博意见领袖研究的方法,该方法旨在利用LDA主题模型挖掘出特定话题中的各个主题,根据主题划分结果对参与话题讨论的用户进行分类,并结合用户自身属性,借鉴Page Rank算法思想挖掘出该主题演化中的意见领袖。【结果/结论】实验证明,本文方法更能体现特定话题的舆情走向,其针对主题挖掘的意见领袖也更具代表性。
关键词:
LDA模型 意见领袖 主题演化
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除