- 年份
- 2024(5960)
- 2023(8698)
- 2022(7453)
- 2021(7147)
- 2020(6093)
- 2019(14198)
- 2018(14173)
- 2017(27768)
- 2016(14739)
- 2015(16548)
- 2014(16157)
- 2013(15458)
- 2012(13648)
- 2011(11814)
- 2010(11603)
- 2009(10189)
- 2008(9405)
- 2007(7702)
- 2006(6236)
- 2005(4880)
- 学科
- 济(59298)
- 经济(59241)
- 管理(42083)
- 业(41370)
- 企(34313)
- 企业(34313)
- 方法(34292)
- 数学(31411)
- 数学方法(30812)
- 农(15271)
- 财(14637)
- 中国(13756)
- 业经(11774)
- 农业(10297)
- 理论(10271)
- 贸(9976)
- 贸易(9971)
- 易(9746)
- 务(9607)
- 财务(9553)
- 财务管理(9534)
- 技术(9507)
- 地方(9493)
- 企业财务(9028)
- 学(8990)
- 和(8611)
- 制(8308)
- 环境(8007)
- 划(7786)
- 银(6986)
- 机构
- 学院(194411)
- 大学(192865)
- 管理(82801)
- 济(80066)
- 经济(78697)
- 理学(73689)
- 理学院(73024)
- 管理学(71415)
- 管理学院(71062)
- 研究(55108)
- 中国(40871)
- 京(37910)
- 财(34255)
- 科学(33257)
- 财经(28900)
- 业大(28816)
- 中心(27324)
- 农(27184)
- 经(26647)
- 江(26066)
- 经济学(25241)
- 所(24917)
- 范(23184)
- 研究所(23053)
- 经济学院(23024)
- 师范(22931)
- 北京(22479)
- 经济管理(22139)
- 财经大学(22083)
- 商学(21468)
- 基金
- 项目(144590)
- 科学(116476)
- 基金(107913)
- 研究(104811)
- 家(93391)
- 国家(92665)
- 科学基金(82343)
- 社会(67815)
- 社会科(64531)
- 社会科学(64514)
- 基金项目(57239)
- 省(56545)
- 自然(54789)
- 自然科(53663)
- 自然科学(53654)
- 自然科学基金(52674)
- 教育(50385)
- 划(47425)
- 资助(44552)
- 编号(42413)
- 部(32433)
- 重点(32105)
- 成果(31755)
- 创(31348)
- 发(29996)
- 创新(29224)
- 教育部(28707)
- 国家社会(28529)
- 科研(28321)
- 人文(28103)
共检索到255446条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 数据分析与知识发现
[作者]
方小飞 黄孝喜 王荣波 谌志群 王小华
【目的】运用中文信息处理和话题识别与追踪的方法,从大量移动投诉文本中找出有价值的信息。【方法】从分析投诉文本的特点入手,使用k-means先对文本聚类。利用LDA对每个类进行建模,提取话题,并从词频、词跨度和词长三方面计算每个话题中词的权值,把权重最大的词作为该话题的标签,并计算每个话题的文档分布概率均值。对具有相同标签的话题,先按照均值最大的原则去掉重复标签话题,再对所有话题计算文档支持率,并将文档支持率作为话题的热度,通过热度区分热点话题和一般话题。【结果】对投诉文本进行时间上的建模,通过对比一般话题
[期刊] 图书情报工作
[作者]
廖君华 孙克迎 钟丽霞
设计基于网络数据的时序主题演化系统Hot Topics Analysis System(HTAS),实现网络热点话题数据源自动定制、自动获取和自动存储。针对中文话题分析,HTAS集成了Google的开源分词系统IKAnalyzer,批量处理中文文档。采用LDA模型对网络热点话题主题进行提取,并利用时间标签发现热点话题,通过图标形式可视化展示其演化规律。通过"钓鱼岛事件"的实验证明,HTAS系统能快速获取、存储网络热点话题,并能有效地分析其演化趋势。
关键词:
主题模型 话题演化 热点话题 LDA
[期刊] 情报科学
[作者]
魏德志 陈福集 林丽娜
【目的/意义】网络舆情的热点话题对政府和网民有着很大的影响,及时发现热点话题有利于政府监控话题的发展。【方法/过程】本文提出了基于时间序列的话题动态演化两层模型,并将新闻网页内容的相似度和页面链接分析作为话题热度的计算依据,然后利用改进的Single-Pass算法进行增量聚类获得聚类中心,最后根据热度权重将聚类中心进行排序,获得热点话题。【结果/结论】通过实验验证,该算法发现效果好,能够更好地获得热点话题。
[期刊] 清华大学学报(自然科学版)
[作者]
陈舒婷 疏学明 胡俊 解学才 张雷 张伽
网络舆情安全是社会安全的重要组成部分,识别和追踪热点话题是治理突发事件网络舆情的基础。现有研究具有网络舆情事件表征不全面、对于热点话题的识别和追踪局限于语义信息等问题。该研究基于社交、内容、话题、情感4个维度构造超网络模型,并引入时间特征作为网络的连接关系,用于定量表征时序的网络舆情事件;将话题节点在超网络中的中心性及中心性变化率作为话题热度的度量指标,实现热点话题发现及演化跟踪;应用“甘肃白银马拉松”微博舆情案例对模型和指标进行验证分析。研究结果表明:该时序超网络模型能够清晰表征突发网络舆情事件,中心性及中心性变化率指标能够准确识别和跟踪热点话题,并为实时态势研判预警、舆论引导等提供指导。
关键词:
超网络 网络舆情 中心性 微博话题
[期刊] 图书情报工作
[作者]
李霞 王连喜 路美秀 刘汉锋 刘俊延
[目的/意义]在海量网络新闻和微博等新媒体文本中自动识别网络热点话题并抽取有意义词串来描述热点事件,对自动识别和描述网络舆情具有重要的研究意义。[方法/过程]在现有热点描述词抽取方法中,利用关联规则或多元词组合方法在抽取过程中存在噪音词较多和特征词语义被放大或转移等问题。本文提出一种基于复合词生成的描述词抽取方法,在所提取的语义更为精确的描述词集合上使用一趟聚类算法对新闻文本进行聚类,自动识别网络热点话题并对热点话题进行排名。[结果/结论]对腾讯新闻事件文本数据集所做的实验结果表明,本文所提出的方法较传统
关键词:
网络热点话题识别 热词抽取 复合词聚类
[期刊] 工业工程与管理
[作者]
黄琳 王丽亚 明新国
在线评论作为客户购后主要的信息分享方式,潜藏着大量的客户需求,LDA模型常被用来挖掘评论主题,以此导出客户需求。但客户对于产品服务的在线评论往往会与有关产品自身性能的评论混杂在一起,直接应用LDA模型会存在主题指代不明、关键词混乱的问题。本文提出了一种改进的LDA模型,该模型通过将根据客户-产品服务画像得来的先验知识整合进LDA模型中,以此来引导模型学习与产品服务相关的特定主题,进而使导出的产品服务需求更贴合实际需要且更具预测性。
[期刊] 建筑经济
[作者]
吴斌 徐佳仁
外向型建筑企业的热点话题吴斌,徐佳仁人们称任务、队伍两个大头“在外的建筑施工企业为外向型企业。外向型企业是建筑业的重要力量,他们无论在“支援建设、友谊长存”时期,还是在面向未来、携手并进”的年代,均以长年在外埠施工为基本特征、凭自身的技术、装备和苦干...
[期刊] 情报科学
[作者]
邱明涛 马静 张磊 姚兆旭
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
关键词:
LDA模型 微博话题 话题特征 特征抽取
[期刊] 图书情报工作
[作者]
唐晓波 向坤
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。
关键词:
LDA 微博热度 主题模型 热点挖掘
[期刊] 情报理论与实践
[作者]
余传明 张小青 陈雷
本文提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法。为验证该方法的有效性,以22157篇餐馆评论为样本,利用Gibbs抽样计算模型参数,获取了评论热点及相应的热点词语。实验获得的9个主题内容较好地反映了餐馆评论中的热点,与现实生活中用户所关心的餐饮热点基本吻合,表明该模型具有较好的热点识别效果。
关键词:
热点话题识别 热点挖掘 用户评论 模型
[期刊] 现代情报
[作者]
廖列法 勒孚刚 朱亚兰
对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。
[期刊] 图书情报工作
[作者]
杨波 邵婉婷
[目的/意义]针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程]基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论]以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。
[期刊] 情报理论与实践
[作者]
叶艳 吴鹏 周知 黄炜 张莉曼
[目的/意义]为了从在线患者评论中识别医疗服务质量主题及其情感,本文提出基于LDA和BiLSTM模型的服务质量主题情感识别模型。[方法/过程]以好大夫在线为例,利用Python收集高血压患者139962条评价数据,采用LDA主题模型得到患者评论的13个主题,并结合相关文献得到6大医疗服务质量主题;根据BiLSTM模型得到各服务质量主题的情感倾向分布;对负向评论较多的服务质量主题进行筛选,分析负向情感产生的原因。[结果/结论]本文提出的方法能帮助医院和医生识别和改善医疗服务质量,提升患者的满意度,从而降低医患纠纷的发生率。
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 情报理论与实践
[作者]
唐晓波 房小可
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
关键词:
文本聚类 主题检索 微博
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除