- 年份
- 2024(11398)
- 2023(16756)
- 2022(14454)
- 2021(13486)
- 2020(11284)
- 2019(26196)
- 2018(25816)
- 2017(49624)
- 2016(26634)
- 2015(30060)
- 2014(29741)
- 2013(29009)
- 2012(26281)
- 2011(23284)
- 2010(23470)
- 2009(21542)
- 2008(19726)
- 2007(16953)
- 2006(14591)
- 2005(12376)
- 学科
- 济(102367)
- 经济(102260)
- 管理(75361)
- 业(72883)
- 企(61912)
- 企业(61912)
- 方法(51762)
- 数学(45714)
- 数学方法(44916)
- 中国(30908)
- 融(27657)
- 金融(27655)
- 财(27016)
- 农(26455)
- 银(26103)
- 银行(26063)
- 行(25057)
- 业经(23586)
- 地方(21919)
- 学(21666)
- 制(20247)
- 理论(19757)
- 务(18455)
- 财务(18369)
- 财务管理(18331)
- 农业(18057)
- 贸(17568)
- 贸易(17551)
- 企业财务(17418)
- 易(17068)
- 机构
- 学院(363772)
- 大学(362783)
- 管理(145901)
- 济(140653)
- 经济(137538)
- 理学(127632)
- 理学院(126297)
- 管理学(123548)
- 管理学院(122908)
- 研究(114655)
- 中国(90074)
- 京(75573)
- 科学(72694)
- 财(63960)
- 农(57789)
- 所(55910)
- 业大(55521)
- 中心(55181)
- 财经(52427)
- 江(51499)
- 研究所(51439)
- 经(47770)
- 北京(46928)
- 范(46523)
- 师范(45995)
- 农业(45390)
- 经济学(42814)
- 州(42647)
- 院(42425)
- 技术(40093)
- 基金
- 项目(258838)
- 科学(203420)
- 基金(187457)
- 研究(187209)
- 家(163508)
- 国家(162156)
- 科学基金(140535)
- 社会(116605)
- 社会科(110651)
- 社会科学(110621)
- 省(102663)
- 基金项目(99313)
- 自然(93256)
- 自然科(91181)
- 自然科学(91158)
- 自然科学基金(89444)
- 教育(87773)
- 划(85854)
- 资助(78463)
- 编号(76692)
- 成果(60253)
- 重点(57924)
- 部(56259)
- 发(54615)
- 创(54470)
- 课题(52715)
- 创新(50740)
- 科研(49976)
- 大学(48907)
- 教育部(48516)
- 期刊
- 济(142374)
- 经济(142374)
- 研究(100568)
- 中国(66510)
- 学报(58290)
- 管理(52533)
- 科学(52522)
- 农(51315)
- 财(48469)
- 大学(44678)
- 学学(42115)
- 教育(41514)
- 融(39891)
- 金融(39891)
- 农业(35388)
- 技术(34693)
- 财经(24614)
- 业经(24202)
- 经济研究(23462)
- 经(20985)
- 图书(19148)
- 业(18315)
- 问题(18053)
- 统计(17996)
- 理论(17645)
- 科技(17434)
- 技术经济(17289)
- 版(16872)
- 策(16497)
- 实践(16312)
共检索到514787条记录
发布时间倒序
- 发布时间倒序
- 相关度优先
文献计量分析
- 结果分析(前20)
- 结果分析(前50)
- 结果分析(前100)
- 结果分析(前200)
- 结果分析(前500)
[期刊] 情报理论与实践
[作者]
唐晓波 房小可
伴随着微博的日趋流行,对微博信息的检索逐渐成为人们获取第一消息的手段。其中文本聚类和主题发现是信息检索领域的有效方法,采用适当的方法是影响微博短文本信息检索质量的关键因素。文章针对文本聚类和LDA主题模型的互补特征,综合考虑了微博特殊文体和短文本聚类效率问题,提出了基于频繁词集的文本聚类和基于类簇的LDA主题挖掘相融合的微博检索方法,给出了针对微博文体的一种新的主题检索模型。实验表明,该方法不仅能有效地划分微博文本,并且能清晰地挖掘类簇中潜在主题。
关键词:
文本聚类 主题检索 微博
[期刊] 情报理论与实践
[作者]
裴超 肖诗斌 江敏
大规模文档集中潜藏的语义信息一般可以用潜在狄利克雷(LDA)主题模型识别,因为微博短文本语义稀疏,所以在微博短文本聚类中的应用并不理想。利用传统的潜在狄利克雷分布的主题模型来给微博建模,得到的微博用户分布并不直观,通过改进的LDA模型将用户表示为主题概率向量,不仅能够充分地挖掘文本隐藏的语义信息,同时能够直观地呈现用户的主题分布。提出基于密度区域划分的K-meAns算法对微博用户进行聚类。使用真实的微博数据集进行验证,与传统的K-meAns聚类方法对比,采用该方法对微博用户的聚类能够有较明显的提高。
关键词:
微博 主题模型 文本聚类 k均值算法
[期刊] 情报科学
[作者]
刘江华
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低。【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷。【结果/结论】实验结果显示,不论是一般还是多义主题关键词的检索,本文的LDA主题模型在耗时和准确率上均比本文列出的其他三种主题模型具有明显的优势,进一步验证了本文提出方法的有效性。
[期刊] 情报杂志
[作者]
阮光册 夏磊
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验
[期刊] 情报理论与实践
[作者]
宋凯 李秀霞 赵思喆
[目的/意义]针对CTM模型与K-means算法在文本聚类中存在的不足,提出将二者融合的CKM算法。该算法利用CTM模型确定聚类数和初始聚类中心,利用K-means算法进行聚类。[方法/过程]以Web of Science为数据来源,建立涵盖6个主题的多学科文献集,以F值为评价指标,利用R语言中的k-means函数和topicmodels包,比较K-means算法、CTM模型、CKM算法的聚类效果。[结果 /结论]结果表明,与单纯使用K-means算法、CTM模型相比,CKM算法的聚类效果更优,稳定性更好
[期刊] 图书情报工作
[作者]
张培晶 宋蕾
在介绍概率主题模型发展过程以及概率主题模型的代表性模型LDA基本原理的基础上,分析LDA模型的特征及其用于微博类网络文本挖掘的优势;介绍和评述微博环境下现有的基于LDA模型的文本主题建模方法,并对其扩展方式和建模效果进行总结和比较;最后对微博文本主题建模的发展方向进行展望。
关键词:
LDA 概率主题模型 微博 主题建模
[期刊] 情报学报
[作者]
吴树芳 张雄涛 朱杰
随着移动互联技术的进一步发展,微博检索已成为微博服务的重要组成部分。考虑到微博检索与传统文本检索的不同,提出一个改进的微博检索模型。新模型对传统查询似然模型中的文档先验概率和文档语言模型估计进行了改进。在文档先验概率方面,通过量化用户对博文的兴趣获得用户的兴趣博文库,并在兴趣博文库的基础上计算微博先验概率,使得符合检索用户兴趣的微博具有较高的先验概率;在文档语言模型估计方面,混合内容及用户交互两方面信息获得微博的相关文档集,并将其作为平滑项实现对微博文档语言模型的混合估计,有效缓解了微博短文本的数据稀疏问题。实验采用从新浪微博爬取的真实数据对研究内容的有效性进行验证,结果表明与现有研究中较好的改进查询似然模型相比,新模型在P@15、P@30和MRR上均有一定提高。
[期刊] 情报理论与实践
[作者]
黄名选 朱家安 冯平
将负关联规则挖掘技术应用于信息检索,提出一种基于正负关联规则融合的信息检索模型。重点论述模型的设计思想、各模块的功能以及模型实现的关键技术,最后详细描述其检索算法。实验结果表明,该模型有效,能提高信息检索性能,具有很高的理论价值和广阔的应用前景。
关键词:
信息检索 关联规则 模型
[期刊] 情报学报
[作者]
吴江 侯绍新 靳萌萌 胡忠义
随着互联网时代的快速发展,在线医疗社区的出现打破了时空限制,为用户提供了丰富的医疗信息和情感帮助,已经成为社会支持的重要来源,受到用户的广泛关注和参与。对在线医疗社区进行用户文本挖掘能够揭示社区中用户的参与行为,从而优化其用户管理和信息推荐。已有的研究对象主要集中在英文在线医疗社区,鲜有文献对中文在线医疗社区进行研究。基于社会支持理论,本文设计了一个中文用户文本挖掘流程来研究中文在线医疗社区中的社会支持类型和用户参与。利用中文文本挖掘及机器学习方法,对中文糖尿病社区"甜蜜家园"进行研究。本文利用LDA(L
[期刊] 图书情报工作
[作者]
宫小翠 安新颖
[目的/意义]随着信息资源在数量和种类上的急剧增长,学科间的交叉融合不断涌现,快速主动地从海量信息资源中识别和判断研究主题的发展演化是实现科技创新的基础。[方法/过程]在相关理论调研的基础上,结合医学领域的资源特点,提出一种基于LDA模型的主题演化探测模型和相应的流程步骤。主要步骤包括医学主题词抽取、主题识别、主题关联、关键主题识别、关键主题的演化主路径识别、演化主路径上主题分裂、融合事件识别,实现深度、细致的主题演化分析。[结果/结论]选用乳腺癌治疗研究文献为实验案例,对判断模型进行试验并对结果进行分析
关键词:
LDA 主题分裂 主题融合 主题演化
[期刊] 图书情报工作
[作者]
杨波 邵婉婷
[目的/意义]针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程]基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论]以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。
[期刊] 情报理论与实践
[作者]
唐晓波 李佩珊
现有的微博检索平台将包含检索词的所有微博按照用户发布的时间逆序输出,用户从返回的结果页面一页页地查找微博文档,需要花费较多时间。为了解决微博检索平台查准率低和结果呈现不够友好的问题,文章引入概念格理论,提出了基于概念格理论的微博检索结果的二次组织模型,并详细说明了微博检索结果概念格的构造过程,设计实验证明了该模型的可行性和有效性。
关键词:
微博 概念格 检索结果 聚类
[期刊] 中国图书馆学报
[作者]
张学福
信息检索可视化是指把文献信息、用户提问、各种情报检索模型以及利用检索模型进行信息检索过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中显示出来,并向用户提供信息检索的技术。基于知识模型的文本信息检索可视化,是利用信息资源的元数据信息来进行可视化检索。图1。参考文献29。
关键词:
信息检索 可视化 知识模型 概念图
[期刊] 情报科学
[作者]
梁珊 邱明涛 马静
【目的/意义】考虑到使用LDA模型进行主题抽取时,抽取到的特征词是无序的,破坏了原有的主谓宾结构,导致抽取效果不准确,可读性差的缺陷,构造了WO词序模型,并将LDA模型与WO模型结合,提出了基于LDA-WO混合模型的微博主题有序特征抽取算法。【方法/过程】使用LDA模型进行主题建模,获得无序特征词,然后通过WO模型对特征词进行排序,将特征词与原语料进行对比,构造特征词-语料位置矩阵,通过对特征词的位置排序,构造特征词词序权值矩阵,最终获得有序的特征词,完成对话题特征的有序抽取。【结果/结论】本文以真实新浪
[期刊] 图书情报工作
[作者]
叶春蕾 邢燕丽
[目的/意义]为了解决研究生用户面临的检索问题,提出一种基于LDA和社会网络中心度分析的个性化检索推荐模型。[方法 /过程]首先,该模型以研究生学科专业为个性化特征,并据此选择相应的数据源。其次,该模型使用LDA识别主题内容,以完成全面知识的展示。再次,该模型根据用户提交的检索词在相应的关键词-主题共现网络中进行社会网络中心度分析,以完成用户相关知识的推荐。[结果 /结论]实验表明,该模型能够很好地解决研究生检索中个性化特征、全面知识展示以及相关知识推荐三大问题,其有效性得到一定程度的验证。
文献操作()
导出元数据
文献计量分析
导出文件格式:WXtxt
删除