- 年份
- 2024(9706)
- 2023(14238)
- 2022(12579)
- 2021(11810)
- 2020(10008)
- 2019(23207)
- 2018(23107)
- 2017(44890)
- 2016(24190)
- 2015(27347)
- 2014(27157)
- 2013(26438)
- 2012(23779)
- 2011(21032)
- 2010(20846)
- 2009(18752)
- 2008(17775)
- 2007(15162)
- 2006(12849)
- 2005(10658)
- 学科
- 济(93271)
- 经济(93172)
- 管理(69211)
- 业(66991)
- 企(55968)
- 企业(55968)
- 方法(48963)
- 数学(43269)
- 数学方法(42496)
- 农(25239)
- 财(22883)
- 中国(22507)
- 业经(20662)
- 学(20400)
- 地方(17753)
- 理论(17224)
- 农业(17177)
- 贸(15762)
- 贸易(15751)
- 技术(15343)
- 务(15330)
- 易(15295)
- 财务(15247)
- 财务管理(15214)
- 和(14889)
- 制(14798)
- 企业财务(14371)
- 环境(14311)
- 划(13049)
- 银(12446)
- 机构
- 学院(332570)
- 大学(332303)
- 管理(137306)
- 济(127603)
- 经济(124883)
- 理学(121095)
- 理学院(119844)
- 管理学(117257)
- 管理学院(116669)
- 研究(103138)
- 中国(75058)
- 京(69063)
- 科学(66654)
- 财(55725)
- 农(53613)
- 业大(52630)
- 所(49999)
- 中心(48050)
- 财经(46313)
- 研究所(46263)
- 江(46041)
- 范(43060)
- 师范(42598)
- 北京(42538)
- 经(42351)
- 农业(42052)
- 院(38192)
- 经济学(37761)
- 州(37617)
- 技术(36381)
- 基金
- 项目(241279)
- 科学(190255)
- 基金(175682)
- 研究(174054)
- 家(153466)
- 国家(152230)
- 科学基金(132220)
- 社会(108221)
- 社会科(102580)
- 社会科学(102552)
- 省(94994)
- 基金项目(93652)
- 自然(88734)
- 自然科(86745)
- 自然科学(86723)
- 自然科学基金(85106)
- 教育(81528)
- 划(79851)
- 资助(73118)
- 编号(71793)
- 成果(55840)
- 重点(53661)
- 部(52694)
- 创(50618)
- 发(50459)
- 课题(48302)
- 创新(47117)
- 科研(46655)
- 教育部(45389)
- 大学(45363)
- 期刊
- 济(127286)
- 经济(127286)
- 研究(89064)
- 中国(56149)
- 学报(53620)
- 科学(49012)
- 管理(48354)
- 农(47287)
- 财(41840)
- 大学(41075)
- 学学(38809)
- 教育(37513)
- 农业(33222)
- 技术(31866)
- 融(22826)
- 金融(22826)
- 业经(22333)
- 财经(21211)
- 经济研究(20668)
- 经(18005)
- 图书(17848)
- 业(17088)
- 问题(16514)
- 科技(16508)
- 技术经济(16327)
- 版(15883)
- 统计(15822)
- 理论(15569)
- 资源(14533)
- 商业(14479)
共检索到453310条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
裴超 肖诗斌 江敏
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
关键词:
微博 主题模型 文本聚类 k均值算法
[期刊] 情报理论与实践
[作者]
唐晓波 房小可
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
关键词:
文本聚类 主题检索 微博
[期刊] 情报科学
[作者]
崔金栋 杜文强 关杨 罗文达
【目的/意义】随着LDA模型成为微博信息推荐的主要工具,众多的LDA演化模型的使用问题成为研究者亟待解决地问题。【方法/过程】首先,从演化发展角度对LDA模型运行机理进行了解析,揭示了模型使用的先决条件和算法内涵;其次,从不同需求的视角揭示了RB-LDA、RT-LDA、C-LDA、MB-LDA等扩展模型对LDA模型的功能性补充;最后,提出LDA模型的技术演化方向。【结果/结论】结果表明可利用微型本体来提升语义性、利用多种模型融合来提升精度、利用大数据来提升数据质量是LDA模型未来的演化方向,可使LDA模型
关键词:
LDA 模型融合 本体 大数据
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 情报科学
[作者]
熊建英
【目的/意义】微博是用户情感发泄的重要渠道,预警模型将有助于发现异常情绪用户,以便及时展开干预。【方法/过程】模型首先利用极性词典和句法序列规则计算微博情感极性程度值,过滤出可疑情绪异常节点;然后利用微博社交网互动关系,计算节点之间的信任值,进一步通过可信反馈对情绪异常节点进行判断。【结果/结论】实验表明,基于序列规则+词典比基于词典的方法对可疑异常情绪用户过滤准确性高,而相比这两种文本挖掘的方法,将可信反馈加入异常情绪判断进一步提高了识别准确度。
关键词:
微博 可信反馈 情感分析 情绪异常预警
[期刊] 图书情报工作
[作者]
尤瑾 朱学芳
[目的/意义]构建知识类微博信息质量的评价指标体系与评价模型,为知识类微博信息质量的提升和微博知识服务的改善提供参考。[方法/过程]通过文献调研与问卷调研,确立评价指标体系。收集用户评分数据进行实证分析,利用TOPSIS对30个知识类微博计算综合得分,并将数据输入RBF神经网络进行仿真训练。[结果/结论]测试结果显示,所建立的知识类微博信息质量评价模型的仿真值与实际评分值的误差均在6%以内。该模型能够较准确地拟合用户评分数据,适用于复杂多维指标体系下的微博信息质量评价场景,对知识类微博及其他类型的微博信息质量评价具有一定的借鉴意义。
[期刊] 图书情报工作
[作者]
张培晶 宋蕾
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。
关键词:
LDA 概率主题模型 微博 主题建模
[期刊] 情报科学
[作者]
邱明涛 马静 张磊 姚兆旭
【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
关键词:
LDA模型 微博话题 话题特征 特征抽取
[期刊] 情报科学
[作者]
张静 王欢
【目的/意义】为了减少微博群体性事件带来的负面影响,必须了解微博用户群体行为的形成过程。【方法/过程】基于元胞自动机理论建立模型发现,微博用户群体行为选择主要受个人参与和外在环境影响,个人参与群体互动越积极,群体氛围越活跃,群体行为选择会更加理性,达成一致的可能性越大。【结果/结论】随着个人参与和环境影响的增大,微博用户群体行为选择从两极分化向单极聚化方向发展,在这个过程中,环境的影响力略大于个人参与,所以在应对微博群体性事件的过程中,环境引导比"以人为本"略重要。
关键词:
微博用户群体行为 行为选择 元胞自动机
[期刊] 图书情报工作
[作者]
唐晓波 向坤
分析传统LDA模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到LDA模型的热点挖掘研究中,构建基于微博热度的LDA模型;通过API采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。
关键词:
LDA 微博热度 主题模型 热点挖掘
[期刊] 情报科学
[作者]
刘江华
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
[期刊] 图书情报工作
[作者]
张海涛 唐诗曼 魏明珠 李泽中
[目的/意义]准确把握社交网络用户兴趣倾向,对用户进行分类并形成高聚合的用户群,对研究社交网络信息生态以及信息推荐有重大意义。[方法/过程]通过构造基于多维度的用户属性描述层次模型,根据模型数据需求从新浪微博抓取用户样本数据,对相关用户背景信息、用户博文信息以及用户行为信息的多维度属性下二阶变量进行量化,构造用户向量表达式,比较单一维度与多维度下的用户分类效果,进一步给属性赋予不同的权重值进行加权分析,在取得最优聚类效果后进行方差分析,对模型进行改进。[结果/结论]基于多维度属性加权后的用户聚类效果明显高于单一维度及多维度非加权条件下的用户聚类,且用户博文内容维度对于提高用户聚类效果的有效性最大。
关键词:
微博 多维度 用户聚类 加权分析
[期刊] 情报理论与实践
[作者]
朱晓霞 宋嘉欣 孟建芳
[目的/意义]近些年来,随着互联网的快速发展,微博逐渐成为人们发表言论的一个社交网络平台。通过对大量评论信息进行情感分析,对政府进行舆情治理、企业市场决策和消费行为分析具有十分重要的意义。[方法/过程]文章针对微博评论表达的特点,提出一种基于主题—情感挖掘模型的无监督情感分类方法,通过将语义角色标注、TF-IDF和K-means聚类方法相结合,构建情感单元词表和主题—情感匹配词表,同时挖掘出评论中主题和情感的分布与联系,并利用点互信息(Pointwise Mutual Information,PMI)和情感词典的方法计算主题词的情感极性值,基于此进行情感分类。[结果/结论]经实验证明,该方法同时考虑了评论中的主题分布与情感极性信息,解决了主题模型中常见的数据稀疏问题,提高了情感分类的效率和准确性,在F值上比S-LDA模型提高了14.24%。
[期刊] 图书情报工作
[作者]
唐晓波 王洪艳
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Alloca-tion)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。
[期刊] 图书情报工作
[作者]
唐晓波 祝黎 谢力
随着社交网站用户爆炸性增长,寻找与自己兴趣相投的潜在朋友越来越困难。为了有效解决以上问题,基于社会关系理论中的同质性理论和三元闭包关系理论,分别从社会关系和内容两个维度向社交网络用户推荐志同道合的朋友。并利用LDA的扩展模型UserLDA对新浪微博用户进行兴趣主题建模,通过用户-主题概率分布矩阵计算用户相似度,以进行TopN二级好友推荐。在真实微博语料库上进行试验表明该推荐算法有较好的准确性和多样性。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除